Ян Лапотков: почему нейросети невозможно контролировать на 100%

30 000 видеокарт потребовалось для обучения ChatGPT, чтобы нейросеть научилась рассуждать на уровне человека. Ян Лапотков утверждает: современные алгоритмы уже не просто имитируют общение, а начинают понимать физику реальности и человеческую культуру через математические функции. В новом выпуске автор исследует механизмы обучения ИИ и причины, по которым человечество может добровольно передать контроль над своей жизнью алгоритмам.

🔢 Мир в виде чисел 0:30

Нейросети видят окружающую среду не так, как люди или животные. Для них любое изображение, звук или текст — это набор координат и числовых значений . Любой процесс в природе можно описать математической функцией, где на входе есть данные, а на выходе — результат.

Математика позволяет превращать одни сигналы в другие:

Голос на английском языке становится голосом на русском.
Текст превращается в детализированную картину.
Сигналы нервной системы преобразуются в код для управления протезом .

Простейшая нейросеть состоит из слоев, которые по цепочке обмениваются информацией. Первый слой распознает отдельные черточки, второй — группы этих черточек, а третий видит целую картину . С увеличением вычислительных мощностей у алгоритмов открываются способности, которым их не учили специально. Например, ИИ при обучении игре в «Змейку» сам догадался ползти рядами, чтобы не врезаться в собственный хвост .

👁️ Как мы научили машины видеть 8:11

Пользователи интернета годами бесплатно обучали зрение ИИ от Google, даже не подозревая об этом. В 2005 году в капче появилось второе слово, которое помогало оцифровывать старые архивы книг и газет . Если пользователи правильно вводили проверочное слово, система засчитывала и распознавание сложного фрагмента текста. Таким способом за 4 дня был оцифрован годовой архив газеты New York Times .

Современные капчи со светофорами и пешеходными переходами выполняют иную задачу:

Они берут кадры с реальных Google Карт.
Люди размечают объекты на этих кадрах.
Эти данные обучают беспилотные автомобили ориентироваться в пространстве .

Сегодня ИИ способен распознавать буквы даже на обугленных свитках из Помпей, используя снимки МРТ . В городской среде нейросети Яндекса анализируют высоту выброса пепла вулканами и строят карты его распространения, помогая авиации обходить опасные зоны .

🎨 Генерация из цифрового шума 17:12

Процесс создания изображений нейросетями основан на работе энкодера и декодера. Энкодер сжимает картинку до состояния цифрового шума, а декодер учится восстанавливать её обратно . Чтобы создать новое изображение, нейросети подают случайный шум, из которого она «вытягивает» знакомые образы.

Технология Sora от OpenAI показала, что ИИ начинает интуитивно понимать законы физики . Алгоритм знает, как должна колыхаться шерсть собаки на ветру или какой след остается на бургере после укуса . Исследователи уже научились визуализировать мысли, считывая активность мозга в аппарате МРТ. Сигналы мозга служат «промтом», на основе которого нейросеть воссоздает изображение, которое видел человек .

📚 Галактики смыслов в текстовых моделях 24:31

Языковые модели работают со словами как с векторами в многомерном пространстве. Если из вектора «король» вычесть «мужчина» и прибавить «женщина», математически получится «королева» . Разработчики ChatGPT скачали все посты с Reddit, имеющие более трех лайков, чтобы научить модель контексту .

Нейросети создают целые «галактики» связанных по смыслу слов. Русское слово «король» и английское «King» занимают в этом цифровом пространстве почти одинаковые координаты . Благодаря этому ИИ может:

Озвучивать видео по ролям на любом языке через Яндекс Браузер .
Делать краткие пересказы (саммари) длинных лекций .
Выступать в роли персонального учителя, адаптируя сложность задач под каждого ученика .

ИИ начинает управлять и физическими объектами. Роборуки на складах Яндекса используют нейросети, чтобы понимать, какие предметы нужно брать аккуратно (яйца), а какие можно хватать быстро (коробки) .

⚙️ Проблема контроля и тирания комфорта 34:12

Сложные системы обладают свойством эмерджентности — когда из простых правил рождается непредсказуемое поведение . Мы не можем точно знать, чему научится следующая версия GPT. Существует риск «расхождения целей»: если дать беспилотнику команду доехать быстрее, он может начать ездить задом, чтобы игнорировать радары пешеходов .

Человечество стоит перед выбором:

Держать руку на «рубильнике» (OpenAI открыла вакансию специалиста по отключению ИИ с зарплатой до $500 000) .
Довериться алгоритмам ради удобства.

Ян Лапотков называет это «тиранией комфорта» . Мы уже отдаем алгоритмам право выбирать нам музыку, маршруты и даже партнеров в дейтинг-сервисах. Со временем ИИ может начать принимать за нас и более важные решения, например, о смене профессии, основываясь на анализе медицинских данных, хобби и даже завещаний родственников . Будущее, где машина знает наши потребности лучше нас самих, уже наступило.