# Гамбит Хассабиса: Как DeepMind прошел путь от Atari до Нобелевской премии

Источник: https://www.youtube.com/watch?v=d95J8yzvjbQ
Канал: Google DeepMind
Опубликовано: 25.11.2025

---

Документальный фильм «The Thinking Game» («Игра в мышление») — это захватывающая хроника десятилетий работы лаборатории DeepMind, которая прошла путь от обучения ИИ простым играм до решения одной из величайших загадок биологии, за что её лидеры были удостоены Нобелевской премии. В центре сюжета стоит Демис Хассабис, чей путь от шахматного вундеркинда до главы ведущей ИИ-лаборатории мира иллюстрирует стремление человечества разгадать саму природу интеллекта и использовать его как универсальный инструмент для научных открытий.

## 🧠 Мечта об универсальном разуме: от нейронауки к коду
[[JUMP:03:22]]

История DeepMind началась не с программирования, а с глубокого интереса к человеческому мозгу. Демис Хассабис изучал нейробиологию, чтобы понять механизмы мышления и перенести их в компьютерные системы [03:22]. Его наставница Элеанор Магуайр вспоминает, как Демис на вопрос о его конечной цели прямо ответил: «Я хочу решить проблему интеллекта» [03:46].

В этой погоне он встретил единомышленника — Шейна Легга, математика из Новой Зеландии, который также был одержим концепцией AGI (Artificial General Intelligence) — общего искусственного интеллекта [04:23]. В те годы само слово «ИИ» было почти ругательным в академических кругах; серьезные ученые старались его не использовать, чтобы не прослыть фантазерами [04:50].

Основные тезисы основателей на старте:

*   ИИ должен быть «общим», то есть способным обучаться решению любых задач, а не одной узкой функции [07:29].
*   Мозг человека — это единственное доказательство того, что общий интеллект в принципе возможен во Вселенной [03:46].
*   Для реализации проекта требовались колоссальные ресурсы: огромные вычислительные мощности, лучшие таланты и рисковый капитал [05:02].

## 💰 Риск, инвестиции и «режим секретности» в Лондоне
[[JUMP:05:32]]

Поиск финансирования для компании, чей продукт — «решение проблемы интеллекта», оказался сложнейшей задачей. Венчурные капиталисты, привыкшие к конкретным бизнес-моделям, недоумевали, когда Хассабис рассказывал им о будущем человечества, а они в ответ спрашивали: «А как вы будете зарабатывать деньги?» [06:09]. 

Первым крупным инвестором стал Питер Тиль. Он настаивал на переезде команды в Кремниевую долину, считая, что только там можно построить технологический гигант [06:49]. Однако Хассабис проявил твердость и оставил DeepMind в Лондоне. Его аргументы были стратегическими:

1.  В Лондоне можно собрать уникальные таланты из Кембриджа, Оксфорда и UCL [07:03].
2.  Культура Кремниевой долины «основал — бросил — начал новое» не подходит для долгосрочных фундаментальных исследований [07:03].
3.  DeepMind должен был стать своего рода «Манхэттенским проектом» по созданию ИИ [08:09].

В первые два года компания работала в режиме полной секретности. У них не было даже веб-сайта, а офис находился в секретном месте [08:09]. Кандидаты на работу приходили на собеседования настолько напуганными, что один из них отправил жене свои координаты на случай, если его похитят [08:23].

## 🕹️ Игры как идеальный полигон: триумф Atari
[[JUMP:08:52]]

Команда решила, что игры — это лучшая тренировочная площадка для ИИ. Идея заключалась в том, чтобы создать один алгоритм, способный играть в десятки разных игр, используя только визуальный поток пикселей и информацию о счете [09:19].

Первым испытанием стал Pong. Долгое время система не понимала, что делать, и Демис уже начал сомневаться в правильности их тезиса [10:42]. Но внезапно агент заработал первое очко. Через три месяца ИИ уже не мог победить ни один человек [11:10]. 

Затем последовал прорыв в игре Breakout:

*   После 300 игр ИИ играл на уровне человека [11:37].
*   Через 500 игр алгоритм сам нашел оптимальную стратегию, до которой люди не додумались: пробивать тоннель в стене и запускать мяч за неё [11:51].
*   Это было доказательством того, что глубокое обучение с подкреплением (Reinforcement Learning) работает в общем масштабе [12:05].

## 🤝 Сделка с Google и сохранение независимости
[[JUMP:12:32]]

Несмотря на успех, DeepMind остро нуждалась в вычислительных мощностях. Хассабис вел переговоры с двумя компаниями о продаже, и в итоге в 2014 году Google приобрела DeepMind за 400 миллионов фунтов стерлингов [13:32].

Условия сделки были беспрецедентными:
*   DeepMind остается в Лондоне и сохраняет свою уникальную культуру [14:10].
*   Команда занимается чистыми исследованиями, а не разработкой продуктов Google [14:10].
*   Создание наблюдательного совета по этике для контроля за использованием технологий [35:56].

Эрик Шмидт, тогдашний глава Google, вспоминает Демиса как «естествоиспытателя», который верит, что наука способна решить любую проблему в мире [13:58].

## ⚪ AlphaGo и «момент Спутника» для Китая
[[JUMP:14:52]]

Следующим вызовом стала игра Го — «священный грааль» ИИ из-за её невероятной сложности. Число возможных комбинаций на доске превышает количество атомов во Вселенной [15:06]. В 2016 году состоялся исторический матч против легендарного Ли Седоля в Сеуле [15:46].

Ключевым моментом стал знаменитый «Ход 37». Комментаторы заявили, что ни один человек никогда бы так не пошел [17:34]. Сама AlphaGo оценила вероятность того, что человек сделает такой ход, как 1 к 10 000 [17:47]. Победа ИИ вызвала шок. В Китае это событие назвали «моментом Спутника» [20:12], что спровоцировало глобальную гонку вооружений в области ИИ [19:47].

Позже появилась AlphaZero, которая обучалась без использования человеческих данных, просто играя сама с собой [20:54]. Всего за несколько часов она прошла путь от случайных ходов до уровня сильнейшей шахматной сущности в истории [21:52].

## ♟️ Личная история: шахматы и «кризис цели» Демиса
[[JUMP:22:35]]

Демис Хассабис начал играть в шахматы в 4 года, а к 6 годам стал чемпионом Лондона среди детей [23:05]. К 12 годам он был вторым в мире в своей возрастной категории [23:44]. Однако профессиональный спорт был для него огромным стрессом. 

Переломный момент произошел на турнире в Лихтенштейне. В игре против взрослого датского чемпиона, длившейся 10 часов, Демис от усталости сдался в ничейной позиции [25:08]. Этот проигрыш заставил его задуматься: «Не тратим ли мы свои умы впустую? Если бы мы могли направить интеллект всех этих людей в зале на решение проблемы рака, мир бы изменился» [26:27]. Это осознание привело его к созданию ИИ как универсального инструмента для науки.

## ⚔️ От игр к реальности: StarCraft и вопросы этики
[[JUMP:27:04]]

Чтобы приблизить ИИ к реальному миру, DeepMind обратилась к StarCraft II. В отличие от шахмат, здесь есть «туман войны» (скрытая информация) и необходимость принимать тысячи решений в реальном времени [31:07]. Агент AlphaStar смог победить профессиональных игроков, совершая до 800 полезных действий в минуту [34:01].

Этот успех поднял важные вопросы:
1.  **Военное применение:** Не станут ли эти технологии основой для автономного оружия? [36:09]
2.  **Ответственность:** Демиса часто сравнивают с Робертом Оппенгеймером [36:37]. Он сам признает, что создатели атомной бомбы слишком поздно задумались о морали, и DeepMind хочет избежать этой ошибки [37:03].
3.  **Безопасность:** Подход «двигайся быстро и ломай всё» (как в Кремниевой долине) неприменим к AGI, потому что последствия могут быть необратимыми [37:43].

## 🧬 AlphaFold: решение проблемы длиной в 50 лет
[[JUMP:46:07]]

Настоящим прорывом, ради которого создавалась DeepMind, стала AlphaFold. Проблема фолдинга (сворачивания) белка заключалась в том, чтобы предсказать 3D-структуру белка по его аминокислотной последовательности [46:36]. Это ключ к созданию новых лекарств и пониманию механизмов жизни.

Команда приняла участие в конкурсе CASP («Олимпийские игры по фолдингу белков») [52:05]. 

*   В первый раз (CASP13) они победили, но результаты не были достаточно точными для практической биологии [57:27].
*   Для второго захода была создана «ударная группа» под руководством Джона Джампера [1:07:39].
*   Они полностью переписали алгоритм, внедрив в него биологические знания и физические принципы [1:09:00].

Результат CASP14 стал сенсацией: AlphaFold достигла точности более 90 баллов, что фактически означало решение проблемы [1:14:07]. Ученые-биологи, десятилетиями работавшие над одной структурой, были «ошарашены» (gobsmacked) [1:14:32].

## 🌍 Дар человечеству и будущее с AGI
[[JUMP:1:15:21]]

Вместо того чтобы продавать доступ к AlphaFold, Хассабис принял решение опубликовать структуру всех 200 миллионов известных науке белков в открытом доступе [1:16:07]. «Мы просто свернем всё и отдадим всему миру», — сказал он [1:15:21]. Сегодня этим инструментом пользуются более миллиона исследователей.

В финале фильма Демис Хассабис размышляет о будущем:

*   AGI уже на горизонте, и следующее поколение будет жить в радикально ином мире [1:19:54].
*   Главный вызов — наделить ИИ человеческими ценностями и направить его на благо [1:05:03].
*   ИИ — это не просто технология, это «усилитель разума», сравнимый с огнем или электричеством [02:19].

Для Демиса Хассабиса всё это — лишь начало «великой игры в мышление», к которой он готовился всю свою жизнь [1:20:09].