«Не существует ничего лучше в исследованиях, что иллюстрировало бы невероятный масштаб данных и вычислений, необходимых для выполнения того, что они делают, и насколько невообразимо малым является всё это, учитывая, что это происходит на одной видеокарте.»
«Трансформеры позволили распараллеливать вычисления... Это стало «точкой отсчёта», позволив тренировать модели на колоссальных массивах данных за разумное время.»