# Джефф Хинтон против Google: почему ИИ-гиганты закрывают свои технологии

Источник: https://www.youtube.com/watch?v=cjs7QKJNVYM
Канал: Yannic Kilcher
Опубликовано: 12.05.2023

---

В новом выпуске новостей машинного обучения ведущий Янник Кильхер анализирует стремительные изменения в индустрии искусственного интеллекта. Главными темами обсуждения стали уход Джеффа Хинтона из компании Google, финансовые потери OpenAI и уязвимость технологических гигантов перед лицом открытого исходного кода. Автор подробно разбирает, почему эпоха академической открытости сменяется корпоративной войной и какие новые инструменты меняют правила игры.

## 🚨 Джефф Хинтон покидает Google и предупреждает об опасности ИИ
[[JUMP:01:19]]

Джефф Хинтон, признанный пионер в области глубокого обучения и один из создателей архитектуры AlexNet, уволился со своего многолетнего поста в компании Google. В интервью изданию New York Times ученый признался, что частично сожалеет о деле всей своей жизни. Главной проблемой на текущий момент Джефф Хинтон считает невозможность предотвратить использование ИИ злоумышленниками в деструктивных целях. 

По мнению Хинтона, скорость технологического прогресса за последние пять лет выглядит пугающе. До недавнего времени Google вела себя как ответственный хранитель технологии, стараясь не выпускать потенциально опасные инструменты, однако интеграция чат-ботов компанией Microsoft в поисковик Bing вынудила Google включиться в агрессивную гонку. Как утверждает ученый, технологические гиганты оказались заперты в конкурентной борьбе, которую теперь практически невозможно остановить. 

Среди краткосрочных рисков Джефф Хинтон выделяет наводнение интернета фейковыми фотографиями, видео и текстами, из-за чего обычные люди потеряют способность отличать правду от лжи. Также он прогнозирует серьезные изменения на рынке труда: если сегодня чат-боты дополняют человека, то со временем они могут полностью заменить помощников юристов, переводчиков и личных ассистентов. В долгосрочной перспективе, по мнению Хинтона, ИИ несет экзистенциальную угрозу человечеству, поскольку автономные системы обучаются непредвиденному поведению на основе огромных массивов данных, получают возможность самостоятельно исполнять собственный код и могут привести к созданию полностью автономного боевого оружия. Ранее ученый полагал, что появление ИИ, превосходящего человека по разуму, случится через 30–50 лет, однако сейчас он кардинально пересмотрел эти сроки.

## ⚔️ Дискуссия об экзистенциальной угрозе: Лекун против Хинтона
[[JUMP:03:47]]

Взгляды Джеффа Хинтона разделяют далеко не все представители научного сообщества. Другой крупный ученый, Ян Лекун, утверждает, что хайп вокруг ИИ абсурден во всех направлениях — как со стороны тех, кто считает большие языковые модели мыслящими сущностями, так и со стороны пророков скорого уничтожения человечества. 

Ведущий Янник Кильхер признается, что в данном споре склоняется к позиции Лекуна. По мнению Кильхера, главная опасность заключается не в самой технологии ИИ, а в ее концентрации в руках узкого круга крупных корпораций и правительств, особенно если к власти придут люди с недобрыми намерениями. Именно поэтому движение за открытый исходный код и демократизацию технологий ИИ критически важно для предотвращения монополии. 

Касательно проблемы генерации фейков Янник Кильхер отмечает, что создать дезинформацию можно и без помощи языковых моделей. Проблема заключается не в генерации контента, а в механизмах его дистрибуции. Прогнозы о массовой безработице ведущий также считает преувеличенными: ИИ трансформирует рабочие места, а не уничтожит их, что напоминает историческую ситуацию с кучерами колесниц, которым пришлось сменить профессию после появления автомобилей. 

Интересно, что свое мнение по поводу ухода Джеффа Хинтона высказал даже рэпер Снуп Догг. Музыкант выразил удивление способностью ИИ поддерживать полноценный диалог, процитировал опасения Хинтона о том, что у машин появился «собственный разум», и в шутку поинтересовался, не пора ли ему инвестировать в ИИ, чтобы обзавестись личным цифровым помощником для безопасности.

## 🏰 Утечка из Google: «У нас нет защитного рва, и у OpenAI его тоже нет»
[[JUMP:07:02]]

Важным событием недели стала утечка внутреннего документа Google, подлинность которого подтверждают сторонние источники. Меморандум озаглавлен «We have no moat, and neither does open AI» («У нас нет рва, и у OpenAI его тоже нет»). В бизнес-среде под «рвом» понимается защищенная позиция, позволяющая сдерживать натиск конкурентов. 

Автор документа утверждает, что пока Google и OpenAI сосредоточены на закрытых коммерческих системах, сообщество разработчиков моделей с открытым исходным кодом (open source) совершает колоссальный рывок. Использование архитектур вроде LLaMA и методов низкоранговой адаптации (LoRA) позволяет независимым инженерам дообучать огромные модели под специфические задачи всего за $100. 

Согласно тексту меморандума, ключевые выводы для индустрии состоят в следующем:

* Обучение моделей с нуля — самый сложный этап, но как только веса базовой модели оказываются в открытом доступе, сообщество оптимизирует их в кратчайшие сроки.
* Качество данных при обучении ИИ масштабируется гораздо эффективнее, чем простое увеличение объема датасета.
* Прямая конкуренция с открытым исходным кодом для корпораций является заведомо проигрышной стратегией.

Автор меморандума призывает руководство Google не бороться с open source, а интегрировать его разработки в свои продукты и стремиться к управлению экосистемой, по аналогии с успешным опытом Android и TensorFlow. Янник Кильхер напоминает, что данный текст является личным мнением одного из инженеров, а не официальной позицией руководства, однако признает силу и логичность представленных аргументов. Документ мгновенно стал основой для многочисленных мемов в ИИ-сообществе.

## 💰 Полмиллиарда убытков OpenAI и закрытие академических дверей Google
[[JUMP:11:17]]

По информации издания The Information, финансовые потери компании OpenAI в прошлом году удвоились и составили около 550 миллионов долларов США. Огромные средства были потрачены на инфраструктуру для разработки ChatGPT, а также на агрессивный найм ключевых специалистов, в том числе бывших сотрудников Google. 

Успехи OpenAI заставили Google кардинально пересмотреть свою внутреннюю политику. Исторически Google (а теперь и объединенная структура Google Brain и DeepMind) являлась одним из главных академических издателей в мире машинного обучения, лидируя по числу докладов на конференциях NeurIPS и ICML. Поисковый гигант поощрял публикации своих ученых ради привлечения лучших талантов из университетов. 

Однако, как сообщает Washington Post, руководство Google осознало, что стартап OpenAI во многом построил свой успех, читая их открытые научные статьи. Даже сама архитектура Transformer (буква «T» в ChatGPT) была изначально изобретена исследователями Google. Позиция Илии Суцкевера из OpenAI подтверждает общие догадки: в одном из недавних выступлений он открыто признал, что текущая закрытость моделей компании продиктована исключительно соображениями рыночной конкуренции, а вовсе не вопросами безопасности, как утверждалось ранее. 

В результате Google переходит в закрытый «военный режим». Отныне исследователи компании обязаны сначала внедрять свои технологии в коммерческие продукты, и лишь затем, после жесткой процедуры одобрения, они могут получить разрешение на научную публикацию. Янник Кильхер предполагает, что запрет на свободные публикации может в долгосрочной перспективе негативно сказаться на способности Google нанимать сильных ученых, для которых личный академический бренд важнее корпоративных бонусов.

## ⚖️ Юридические барьеры: авторское право на генеративный контент
[[JUMP:18:00]]

Бюро по авторским правам США (US Copyright Office) опубликовало официальное разъяснение касательно произведений, созданных с помощью искусственного интеллекта. Ведомство постановило, что сгенерированные ИИ изображения и тексты не могут быть защищены авторским правом, так как закон требует обязательного наличия человеческого авторства (human authorship). При подаче заявок на регистрацию комплексных проектов авторы обязаны четко указывать, какие элементы были созданы нейросетями, и исключать их из запроса на защиту прав.

Янник Кильхер считает, что данное правило имеет далеко идущие последствия. По его мнению, сами веса обученных ИИ-моделей также не подлежат защите авторским правом, поскольку они являются продуктом работы алгоритма оптимизации, а не человеческого творчества. Единственным юридическим способом защитить модель для компании остается подписание коммерческого контракта (NDA) перед предоставлением доступа к ней. На этом фоне OpenAI пытается зарегистрировать аббревиатуру «GPT» как товарный знак, однако процесс сталкивается с серьезными бюрократическими трудностями.

## 🛠️ Технологический дайджест: Mojo, NeMo Guardrails и футбольные роботы
[[JUMP:20:31]]

В завершение выпуска Янник Кильхер представил обзор важных инструментов, моделей и исследовательских проектов, вышедших за последнее время:

* **StarCoder:** Модель на 15 миллиардов параметров с контекстом в 8000 токенов, обученная на коде из 80 языков программирования. Кильхер критикует проект за использование лицензии OpenRAIL, требующей ввода контактных данных для доступа, что противоречит духу классического open source.
* **Red Pajama и Open Llama:** Проекты по воссозданию открытой альтернативы датасету LLaMA. Модели Red Pajama на 3B и 7B параметров распространяются под полностью свободной лицензией Apache.
* **MosaicML MPT-7B:** Открытая коммерческая модель на 7 миллиардов параметров, которая на тестах показала способность обрабатывать контекст беспрецедентной длины — до 65 000 токенов.
* **YOLO-NAS:** Система автоматического поиска нейроархитектур для детекторов объектов семейства YOLO, демонстрирующая высокую скорость работы, но доступная пока только по некоммерческой лицензией.
* **Mojo:** Новый амбициозный язык программирования от компании Modular, созданный Крисом Латтнером (автором LLVM). Mojo является супермножеством Python, поддерживает строгую типизацию и позволяет компилировать код напрямую в бинарный файлы, оптимизированные под различные аппаратные ИИ-акселераторы. Проект находится на ранней стадии и пока закрыт для внешних разработчиков.
* **Nvidia NeMo Guardrails:** Открытая система, позволяющая программистам задавать жесткие рамки и сценарии для корпоративных чат-ботов, предотвращая обсуждение нежелательных тем и токсичные ответы.
* **LMQL (Language Model Query Language):** Язык запросов к языковым моделям, позволяющий гибко управлять переменными внутри промпта и вводить строгие ограничения на длину или формат выдачи.
* **PandasAI:** Библиотека, добавляющая генеративный ИИ в популярный инструмент анализа данных Pandas, что позволяет пользователям делать текстовые запросы к таблицам и строить графики без написания кода.
* **DeepFloyd IF:** Текстово-графическая модель от Stability AI, которая в отличие от Stable Diffusion работает напрямую в пиксельном пространстве (а не латентном). Это позволяет ей исключительно точно генерировать надписи и текст внутри картинок.
* **Робо-футбол от DeepMind:** Новое исследование, в котором двуногие роботы обучались игре в футбол с помощью сквозного обучения с подкреплением (end-to-end RL). Машины демонстрируют высокую пластичность движений и быструю адаптацию при падениях. Янник в шутку предостерег инженеров от излишней жестокости во время тестов: если Хинтон прав, роботы могут надолго запомнить тех, кто их пинал.