Тан Цзе о WuDao 2.0: «ИИ превзойдет человека через 20 лет»

Eye on AI 941 24 мин 3 мин 26.01.2022
Главное

Китайский проект WuDao 2.0 на текущий момент является одной из самых масштабных систем искусственного интеллекта в мире, обладая 1,7 трлн параметров. В этом интервью ведущий подкаста Eye on AI Крейг Смит вместе с исследователем Коннором Лихи беседуют с Тан Цзе, профессором Университета Цинхуа и руководителем проекта WuDao, о технических особенностях модели, стратегии её развития и перспективах глобального сотрудничества ученых в условиях политической напряженности.

🤖 Архитектура и возможности WuDao 2.0 0:16

WuDao 2.0 представляет собой разреженную мультимодальную модель, обученную на 4,9 ТБ данных, включая изображения и тексты. В отличие от плотных языковых моделей, таких как GPT-3, WuDao делает ставку на масштаб и мультимодальность, объединяя китайский и английский языки с визуальными данными.

Ключевые технические аспекты и инновации:

📈 Масштабирование и будущие планы 9:11

Команда проекта уже имеет опыт работы с экстремальными объемами данных. Хотя текущая модель WuDao 2.0 оперирует 1,7 трлн параметров, исследователи экспериментировали с созданием системы на 100 трлн параметров. Тан Цзе подчеркнул, что они не доводили эту модель до полной сходимости, но доказали саму техническую возможность обучения таких гигантских систем на суперкомпьютере Sunway.

Приоритеты развития проекта:

  1. Практическое применение: Команда сотрудничает с более чем 30 крупными китайскими компаниями для внедрения ИИ в продукты с миллионами или миллиардами пользователей.
  2. Генерация видео: Ведется работа над созданием моделей, способных генерировать видеоконтент на основе текстовых описаний.
  3. Повышение точности: Одна из главных задач — сделать результаты генерации более фактическими и точными, возможно, путем объединения модели с графами знаний.
  4. Эффективное дообучение: Тан Цзе представил алгоритм P-Tuning, позволяющий эффективно дообучать модель, используя менее 1% данных.

🌍 Геополитика и будущее ИИ 17:17

Обсуждая риски развития сверхразумного ИИ, Тан Цзе выразил уверенность в необходимости государственного регулирования, особенно в сфере «когнитивного ИИ», который может быть потенциально опасен. При этом он придерживается оптимистичных взглядов на будущее человечества: по мнению профессора, через 10–20 лет машины превзойдут людей в большинстве когнитивных задач, а через 50 лет ИИ может обрести некое подобие сознания.

Что касается противостояния между США и Китаем, Тан Цзе настаивает на важности открытости науки:

💬 Цитаты

«Через 10–20 лет машина сможет делать лучше человека большинство когнитивных задач, таких как письмо или речь.»

«Наука — для всех людей в мире. Мы хотим создать модель, которая принесет пользу каждому.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Sparse model
Разреженная модель, в которой при вычислении каждого конкретного запроса активируется лишь малая часть всех параметров.
Multi-modal model
Модель ИИ, способная работать с разными типами данных, например, с текстом и изображениями одновременно.
GPT-3
Крупная языковая модель от OpenAI, ставшая индустриальным стандартом для сравнения эффективности LLM.
GLM
General Language Model, архитектурный подход, объединяющий задачи понимания и генерации языка.
MoE
Mixture of Experts, техника обучения нейросетей, при которой разные части модели специализируются на разных типах данных.
📊 Цифры
🗓 Хронология
  1. 2018 Тан Цзе впервые сформулировал идею создания модели, обучаемой на всех доступных данных.
  2. Сентябрь/октябрь 2020 Официальный запуск проекта WuDao.
  3. 2021 Обсуждение текущего статуса WuDao 2.0 и планов по развитию.
⚖️ Другая сторона
Искусственный интеллект WuDao 2.0 Тан Цзе Qinghua University GPT-3 FastMoE