Лян Вэньфэн: история успеха создателя DeepSeek

East Money 698 тыс. 18 мин 3 мин 31.01.2025
Главное

🚀 Восхождение DeepSeek: как Лян Вэньфэн бросил вызов технологическим гигантам 0:25

В конце 2024 года китайский стартап DeepSeek потряс мировое технологическое сообщество, представив модель DeepSeek-V3, которая по своим характеристикам превзошла решения ведущих индустриальных гигантов. Основатель компании Лян Вэньфэн, опираясь на принципы эффективности, «демократизации» доступа к технологиям и привлечения молодых талантов, доказал, что для совершения прорыва в области искусственного интеллекта не обязательно обладать многомиллиардными бюджетами и колоссальными вычислительными мощностями.


🧠 Становление Ляна Вэньфэна 1:04

Лян Вэньфэн родился в 1985 году в городе Чжаньцзян, провинция Гуандун. Сын школьного учителя, он с ранних лет демонстрировал незаурядные способности к математике, предпочитая решение сложных уравнений играм со сверстниками.

📈 Путь от количественных финансов к AI 3:04

Во время глобального финансового кризиса 2008 года Лян Вэньфэн увидел возможность применить свои математические навыки для решения проблем, перед которыми спасовали многие эксперты. Собрав команду единомышленников, он начал разрабатывать алгоритмы для количественной торговли, которые анализировали экономические отчеты, биржевые цены и даже заголовки новостей для выявления рыночных тенденций.

Его работа легла в основу компании High-Flyer, которую он соосновал в 2013 году. К 2019 году High-Flyer вошла в число крупнейших количественных хедж-фондов Китая. Для обеспечения работы своих моделей Лян инвестировал огромные средства в суперкомпьютерные системы:

  1. Firefly №1 (2019): Система мощностью 1100 графических процессоров, созданная за 200 млн юаней.
  2. Firefly №2 (2021): Модернизированный комплекс стоимостью 1 млрд юаней с 10 000 процессоров NVIDIA A100, чья вычислительная мощность сопоставима с работой 100 000 современных ноутбуков.

🌐 Революция DeepSeek: V2 и V3 9:08

В мае 2023 года Лян принял решение переключиться с финансов на создание общего искусственного интеллекта (AGI), основав DeepSeek. Стартап сделал ставку на открытый исходный код и высокую эффективность архитектуры.

👥 Командный подход и влияние на индустрию 14:52

Успех DeepSeek обусловлен не только алгоритмами, но и кадровой философией Ляна. В компании работают всего 139 инженеров — это значительно меньше, чем у конкурентов (например, 1200 в OpenAI). Лян намеренно нанимает выпускников топовых вузов с минимальным опытом работы, предоставляя им свободу в принятии решений и отсутствие жесткой иерархии.

Александр Ван, основатель Scale AI, назвал успехи DeepSeek «суровым сигналом к пробуждению» для американских технологических корпораций, которые, по его мнению, стали слишком зависимы от масштабирования затрат. Инвестор Марк Андриссен также отметил, что подход DeepSeek к открытому коду и эффективности способен радикально изменить правила игры на рынке ИИ.

💬 Цитаты

«DeepSeek just taught us that the answer is less than people thought.»

Ведущий канала East Money 0:00

«Deep seek success was a tough wakeup call for American tech companies.»

Александр Ван 16:26
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Количественная торговля
Стратегия инвестирования, основанная на использовании математических моделей и алгоритмов для принятия торговых решений.
Смесь экспертов (mixture of experts)
Архитектура нейросети, где для выполнения задачи активируются только специализированные части модели.
AGI (Общий искусственный интеллект)
Тип ИИ, способный понимать и обучаться любой интеллектуальной задаче на уровне человека или выше.
📊 Цифры
🗓 Хронология
  1. 2008 Лян Вэньфэн начинает заниматься разработкой алгоритмов для количественной торговли.
  2. 2013 Основание компании High-Flyer Investment Management.
  3. 2023 Лян Вэньфэн основывает DeepSeek с целью создания общего искусственного интеллекта.
  4. май 2024 Релиз модели DeepSeek-V2.
  5. декабрь 2024 Выпуск модели DeepSeek-V3.
⚖️ Другая сторона
Стартапы и бизнес DeepSeek Liang Wenfeng DeepSeek-V3 High-Flyer