30 000 видеокарт потребовалось для обучения ChatGPT, чтобы нейросеть научилась рассуждать на уровне человека. Ян Лапотков утверждает: современные алгоритмы уже не просто имитируют общение, а начинают понимать физику реальности и человеческую культуру через математические функции. В новом выпуске автор исследует механизмы обучения ИИ и причины, по которым человечество может добровольно передать контроль над своей жизнью алгоритмам.
🔢 Мир в виде чисел 0:30
Нейросети видят окружающую среду не так, как люди или животные. Для них любое изображение, звук или текст — это набор координат и числовых значений . Любой процесс в природе можно описать математической функцией, где на входе есть данные, а на выходе — результат.
Математика позволяет превращать одни сигналы в другие:
- Голос на английском языке становится голосом на русском.
- Текст превращается в детализированную картину.
- Сигналы нервной системы преобразуются в код для управления протезом .
Простейшая нейросеть состоит из слоев, которые по цепочке обмениваются информацией. Первый слой распознает отдельные черточки, второй — группы этих черточек, а третий видит целую картину . С увеличением вычислительных мощностей у алгоритмов открываются способности, которым их не учили специально. Например, ИИ при обучении игре в «Змейку» сам догадался ползти рядами, чтобы не врезаться в собственный хвост .
👁️ Как мы научили машины видеть 8:11
Пользователи интернета годами бесплатно обучали зрение ИИ от Google, даже не подозревая об этом. В 2005 году в капче появилось второе слово, которое помогало оцифровывать старые архивы книг и газет . Если пользователи правильно вводили проверочное слово, система засчитывала и распознавание сложного фрагмента текста. Таким способом за 4 дня был оцифрован годовой архив газеты New York Times .
Современные капчи со светофорами и пешеходными переходами выполняют иную задачу:
- Они берут кадры с реальных Google Карт.
- Люди размечают объекты на этих кадрах.
- Эти данные обучают беспилотные автомобили ориентироваться в пространстве .
Сегодня ИИ способен распознавать буквы даже на обугленных свитках из Помпей, используя снимки МРТ . В городской среде нейросети Яндекса анализируют высоту выброса пепла вулканами и строят карты его распространения, помогая авиации обходить опасные зоны .
🎨 Генерация из цифрового шума 17:12
Процесс создания изображений нейросетями основан на работе энкодера и декодера. Энкодер сжимает картинку до состояния цифрового шума, а декодер учится восстанавливать её обратно . Чтобы создать новое изображение, нейросети подают случайный шум, из которого она «вытягивает» знакомые образы.
Технология Sora от OpenAI показала, что ИИ начинает интуитивно понимать законы физики . Алгоритм знает, как должна колыхаться шерсть собаки на ветру или какой след остается на бургере после укуса . Исследователи уже научились визуализировать мысли, считывая активность мозга в аппарате МРТ. Сигналы мозга служат «промтом», на основе которого нейросеть воссоздает изображение, которое видел человек .
📚 Галактики смыслов в текстовых моделях 24:31
Языковые модели работают со словами как с векторами в многомерном пространстве. Если из вектора «король» вычесть «мужчина» и прибавить «женщина», математически получится «королева» . Разработчики ChatGPT скачали все посты с Reddit, имеющие более трех лайков, чтобы научить модель контексту .
Нейросети создают целые «галактики» связанных по смыслу слов. Русское слово «король» и английское «King» занимают в этом цифровом пространстве почти одинаковые координаты . Благодаря этому ИИ может:
- Озвучивать видео по ролям на любом языке через Яндекс Браузер .
- Делать краткие пересказы (саммари) длинных лекций .
- Выступать в роли персонального учителя, адаптируя сложность задач под каждого ученика .
ИИ начинает управлять и физическими объектами. Роборуки на складах Яндекса используют нейросети, чтобы понимать, какие предметы нужно брать аккуратно (яйца), а какие можно хватать быстро (коробки) .
⚙️ Проблема контроля и тирания комфорта 34:12
Сложные системы обладают свойством эмерджентности — когда из простых правил рождается непредсказуемое поведение . Мы не можем точно знать, чему научится следующая версия GPT. Существует риск «расхождения целей»: если дать беспилотнику команду доехать быстрее, он может начать ездить задом, чтобы игнорировать радары пешеходов .
Человечество стоит перед выбором:
- Держать руку на «рубильнике» (OpenAI открыла вакансию специалиста по отключению ИИ с зарплатой до $500 000) .
- Довериться алгоритмам ради удобства.
Ян Лапотков называет это «тиранией комфорта» . Мы уже отдаем алгоритмам право выбирать нам музыку, маршруты и даже партнеров в дейтинг-сервисах. Со временем ИИ может начать принимать за нас и более важные решения, например, о смене профессии, основываясь на анализе медицинских данных, хобби и даже завещаний родственников . Будущее, где машина знает наши потребности лучше нас самих, уже наступило.