# Лян Вэньфэн: история успеха создателя DeepSeek

Источник: https://www.youtube.com/watch?v=FMU0j_ly4kk
Канал: East Money
Опубликовано: 31.01.2025

---

## 🚀 Восхождение DeepSeek: как Лян Вэньфэн бросил вызов технологическим гигантам
[[JUMP:0:25]]

В конце 2024 года китайский стартап DeepSeek потряс мировое технологическое сообщество, представив модель DeepSeek-V3, которая по своим характеристикам превзошла решения ведущих индустриальных гигантов. Основатель компании Лян Вэньфэн, опираясь на принципы эффективности, «демократизации» доступа к технологиям и привлечения молодых талантов, доказал, что для совершения прорыва в области искусственного интеллекта не обязательно обладать многомиллиардными бюджетами и колоссальными вычислительными мощностями.

---

### 🧠 Становление Ляна Вэньфэна
[[JUMP:1:04]]

Лян Вэньфэн родился в 1985 году в городе Чжаньцзян, провинция Гуандун. Сын школьного учителя, он с ранних лет демонстрировал незаурядные способности к математике, предпочитая решение сложных уравнений играм со сверстниками.

*   **Образование:** В 17 лет Лян поступил в Университет Чжэцзян, где изучал электронику и информационную инженерию.
*   **Ранние интересы:** В студенческие годы он увлекся анализом данных, компьютерными системами и применением вероятностных моделей для прогнозирования финансовых рынков.
*   **Первый выбор:** Еще будучи студентом, Лян отклонил предложение о партнерстве от основателя компании DJI Ван Тао, решив посвятить себя развитию потенциала искусственного интеллекта.

### 📈 Путь от количественных финансов к AI
[[JUMP:3:04]]

Во время глобального финансового кризиса 2008 года Лян Вэньфэн увидел возможность применить свои математические навыки для решения проблем, перед которыми спасовали многие эксперты. Собрав команду единомышленников, он начал разрабатывать алгоритмы для количественной торговли, которые анализировали экономические отчеты, биржевые цены и даже заголовки новостей для выявления рыночных тенденций.

Его работа легла в основу компании High-Flyer, которую он соосновал в 2013 году. К 2019 году High-Flyer вошла в число крупнейших количественных хедж-фондов Китая. Для обеспечения работы своих моделей Лян инвестировал огромные средства в суперкомпьютерные системы:

1.  **Firefly №1 (2019):** Система мощностью 1100 графических процессоров, созданная за 200 млн юаней.
2.  **Firefly №2 (2021):** Модернизированный комплекс стоимостью 1 млрд юаней с 10 000 процессоров NVIDIA A100, чья вычислительная мощность сопоставима с работой 100 000 современных ноутбуков.

### 🌐 Революция DeepSeek: V2 и V3
[[JUMP:9:08]]

В мае 2023 года Лян принял решение переключиться с финансов на создание общего искусственного интеллекта (AGI), основав DeepSeek. Стартап сделал ставку на открытый исходный код и высокую эффективность архитектуры.

*   **DeepSeek-V2 (май 2024):** Модель показала производительность, сопоставимую с GPT-4 Turbo, при этом ее стоимость обработки данных оказалась в 170 раз ниже аналогов.
*   **Технологический секрет:** Использование метода «смеси экспертов» (mixture of experts), при котором система активирует только те части модели, которые необходимы для решения конкретного вопроса.
*   **DeepSeek-V3 (декабрь 2024):** Новая модель была обучена всего на 2048 графических процессорах NVIDIA H800, что в индустрии считается базовым оборудованием, однако результат оказался на уровне лучших моделей OpenAI.

### 👥 Командный подход и влияние на индустрию
[[JUMP:14:52]]

Успех DeepSeek обусловлен не только алгоритмами, но и кадровой философией Ляна. В компании работают всего 139 инженеров — это значительно меньше, чем у конкурентов (например, 1200 в OpenAI). Лян намеренно нанимает выпускников топовых вузов с минимальным опытом работы, предоставляя им свободу в принятии решений и отсутствие жесткой иерархии.

Александр Ван, основатель Scale AI, назвал успехи DeepSeek «суровым сигналом к пробуждению» для американских технологических корпораций, которые, по его мнению, стали слишком зависимы от масштабирования затрат. Инвестор Марк Андриссен также отметил, что подход DeepSeek к открытому коду и эффективности способен радикально изменить правила игры на рынке ИИ.