Янник Кильчер: «GPT-4 станет таким же прорывом, как GPT-3 в своё время»

Yannic Kilcher 108 тыс. 41 мин 4 мин 27.11.2022
Главное

В свежем выпуске ML News Янник Кильчер разбирает последние прорывы в области нейроинтерфейсов, новые математические решения для моделирования мозга и нарастающий ажиотаж вокруг следующего поколения языковых моделей. В центре внимания — технологии «чтения мыслей», амбициозные слухи о GPT-4 и этические баталии в академической среде ИИ.

🧠 Чтение мыслей: реконструкция визуальных образов и внутренней речи 0:15

Технологии декодирования активности мозга стремительно выходят на новый уровень, превращая научную фантастику в реальность. В исследовании «Seeing Beyond the Brain» авторы представили метод реконструкции изображений, которые видит человек, на основе данных функциональной МРТ (фМРТ).

Ключевые особенности технологии:

Параллельно с этим, как отмечает ресурс NeuroscienceNews.com, разработан инвазивный интерфейс «мозг-компьютер», способный предсказывать «внутреннюю речь». На данный момент устройство распознаёт ограниченный набор слов (около восьми), но сам факт декодирования мыслей, которые не были произнесены вслух, является значимым прогрессом.

🧬 Математика нейронов: найдено аналитическое решение для взаимодействий 3:06

Рамин Хассани объявил о публикации в журнале Nature Machine Intelligence, которая может изменить подход к созданию биологически правдоподобных нейросетей. Исследователям удалось найти решение в замкнутой форме (closed-form solution) для дифференциального уравнения, описывающего взаимодействие между нейронами.

Преимущества этого открытия:

  1. Отсутствие численных решателей: ранее для моделирования таких связей требовались сложные ODE-солверы.
  2. Эффективность: теперь через формулу можно проводить прямое и обратное распространение ошибки (forward/backprop).
  3. Доступность: реализация уже доступна для PyTorch и TensorFlow.

По мнению Янника Кильчера, хотя это и не гарантирует мгновенного превосходства над текущими архитектурами, открытие критически важно для симуляции реальных нейронных связей и поиска вдохновения в биологических структурах.

🚀 Слухи о GPT-4: мультимодальность и «колоссальный» масштаб 4:10

Индустрия замерла в ожидании следующей итерации модели от OpenAI. Несмотря на ранние заявления Сэма Альтмана о том, что GPT-4 не будет намного больше предшественницы, в Кремниевой долине циркулируют новые слухи, собранные аналитиком Альберто Ромеро.

Основные ожидания от GPT-4:

Релиз модели, по слухам, может состояться в период с декабря по февраль. В связке с этим обсуждается сотрудничество OpenAI с компанией Cerebras, которая представила суперкомпьютер Andromeda с 13,5 миллионами ядер. Система состоит из 16 узлов CS-2 и предназначена для вычислений гигантского масштаба.

🌌 Биология и логика: проекты Meta AI 7:47

Подразделение Meta Research представило ESM Metagenomic Atlas — базу данных «темной материи» белковой вселенной. Проект охватывает сотни миллионов структур белков, полученных из метагеномных образцов (почва, вода, микробы), которые ранее не были каталогизированы.

Помимо биологии, Meta достигла успехов в обучении ИИ математическому мышлению. Исследователи применили вариант поиска по дереву Монте-Карло (MCTS) — алгоритм, прославивший AlphaGo, — для поиска доказательств в формальных математических системах. Это позволяет системе эффективно выбирать стратегии доказательства среди огромного количества возможных вариантов.

⚖️ Скандалы ICLR 2023: токсичность и «византийская» политкорректность 13:00

Период рецензирования работ для конференции ICLR 2023 ознаменовался серией конфликтов. Янник Кильчер выделяет несколько тревожных случаев:

Наибольший резонанс вызвал спор вокруг термина «византийский» (Byzantine) в статье о безопасности распределенных систем. Рецензент потребовал заменить устоявшийся технический термин, считая его оскорбительным для потомков жителей Византии и нарушающим этический кодекс ICLR.

Несмотря на вмешательство комитета по этике, который признал термин допустимым, Янник Кильчер считает этот инцидент «победой жалобщиков». По его мнению, формулировка комитета о том, что это «потенциально зарождающаяся проблема», создает прецедент для дальнейшего ограничения технической терминологии в будущем.

🛠️ Новые инструменты и модели недели 27:50

В завершение выпуска был представлен обзор полезных утилит и специализированных моделей:

Также отмечен запуск проекта GPT Index — экспериментального способа организации и суммаризации больших объемов данных с помощью языковых моделей.

💬 Цитаты

«Реконструкция образов из мозга становится реальностью: семантическое содержание совпадает, даже если пиксели размыты.»

Янник Кильчер 00:53

«GPT-4 будет таким же улучшением по сравнению с GPT-3, каким GPT-3 была по сравнению с GPT-2.»

Янник Кильчер 06:00
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Диффузионные модели
Класс генеративных моделей, создающих данные (например, изображения) путем постепенного удаления шума.
Решение в замкнутой форме
Математическое выражение, которое можно вычислить за конечное число стандартных операций, без итерационных приближений.
Мультимодальность
Способность модели ИИ обрабатывать и объединять данные разных типов: текст, изображения, аудио и видео.
📊 Цифры
🗓 Хронология
  1. Ноябрь 2022 Выход обзора новостей и слухов о GPT-4.
  2. Декабрь 2022 - Февраль 2023 Ожидаемое (по слухам) окно релиза GPT-4.
  3. 2023 Проведение конференции ICLR, вызвавшей этические споры.
⚖️ Другая сторона
Искусственный интеллект GPT-4 OpenAI Cerebras Meta AI ICLR 2023