Янник Килчер: «Чат-боты — это новая зона юридической ответственности»

Yannic Kilcher 42,5 тыс. 42 мин 3 мин 01.03.2024
Главное

Новости машинного обучения: от прорывов Groq до скандалов Air Canada 🚀 0:00

Последние две недели в сфере искусственного интеллекта прошли под знаком интенсивного развития аппаратного обеспечения, споров об этике генерации изображений и законодательных инициатив. Ведущий Янник Килчер (Yannic Kilcher) в своем аналитическом обзоре рассматривает ключевые события: релиз компактных моделей Gemma от Google, феноменальную скорость работы чипов Groq, успехи модели Sora от OpenAI и прецедентное решение суда по делу Air Canada.

🤖 Модели и архитектуры: Gemma, Sora и Gemini 0:12

Google представила семейство открытых моделей Gemma — это 2-миллиардные и 7-миллиардные модели, которые, по мнению Килчера, превосходят аналогичные модели Llama 2. Хотя Google позиционирует их как «открытые», Килчер считает это маркетинговым ходом: контекстное окно составляет всего 8 000 токенов, а архитектура во многом схожа с моделями Llama.

Тем временем Sora от OpenAI продолжает удерживать внимание общественности:

Gemini 1.5 Pro привлекает пользователей своим огромным контекстным окном в 1 миллион токенов. Пользователи уже загружают в модель целые кодовые базы и даже 44-минутные видео, используя визуальные токены для анализа. Килчер отмечает появление сопутствующей научной работы «World model on million length video and language with ring attention», предлагающей метод приближенного внимания, что является перспективным направлением для масштабирования.

⚡️ Железо: скорость Groq и масштаб Nvidia 3:42

Компания Groq привлекла внимание индустрии своими специализированными процессорами — LPU (Language Processing Unit).

В противовес этому Nvidia представила суперкомпьютер, состоящий из 576 систем DGX H100, что в сумме дает 4 608 GPU H100. Эта система достигает производительности 18,4 эксафлопс и занимает девятое место в списке 500 мощнейших суперкомпьютеров мира.

Также на рынке наблюдается рост сервисов аренды мощностей, таких как GPU list, который Килчер сравнивает с Craigslist для GPU, отмечая при этом сопутствующие риски безопасности при работе на «чужом железе».

⚖️ Правовое поле: Air Canada и регулирование AI 18:39

Ключевым юридическим прецедентом стало решение суда по иску жителя Британской Колумбии к Air Canada. Чат-бот авиакомпании предоставил клиенту ложную информацию о правилах возврата билетов в связи с трауром, и суд обязал авиакомпанию выполнить обещания бота.

Что касается EU AI Act (закона ЕС об ИИ), Килчер скептически относится к установленным порогам регулирования, в частности к ограничению в $10^{25}$ флопс. По его мнению, это произвольная цифра, а подобные законы скорее затруднят вход на рынок для новичков, способствуя монополизации крупными игроками.

💡 Исследования и тренды 23:30

💬 Цитаты

«Если вы внедряете программное обеспечение, вы несете ответственность за то, что оно делает.»

Янник Килчер 20:43

«Это безумная скорость — 532 токена в секунду.»

Янник Килчер 3:56
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
LPU
Language Processing Unit, специализированный чип от компании Groq для высокоскоростного инференса языковых моделей.
Контекстное окно
Максимальный объем данных, которые языковая модель может учитывать за один раз при обработке запроса.
Ring attention
Техника оптимизации внимания в трансформерах, позволяющая эффективно обрабатывать очень длинные последовательности данных.
Инференс
Процесс использования обученной модели для получения предсказаний или генерации текста.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Groq Gemini Sora Air Canada EU AI Act