В современном мире технологий намечается сдвиг, который может оказаться масштабнее появления интернета и смартфонов. Речь идет о концепции «Software 3.0» — новом этапе эволюции программного обеспечения, где вместо написания строк кода или обучения нейросетей с нуля разработчики переходят к тонкой настройке и «дистилляции» гигантских базовых моделей ИИ.
💾 От Software 1.0 к Software 2.0: Наследие Андрея Карпатого 0:53
Для понимания сути Software 3.0 необходимо обратиться к истории, которую сформулировал Андрей Карпатый (Andrej Karpathy), бывший директор по ИИ в Tesla и сооснователь OpenAI. Еще в 2017 году он представил разделение программного обеспечения на два поколения .
Software 1.0 — это классический стек, к которому мы привыкли.
- Код пишется программистом вручную на языках типа Python или C++ .
- Программа состоит из явных инструкций: человек буквально буква за буквой объясняет компьютеру, что делать .
- Программист ищет конкретную точку в пространстве программ, которая обеспечивает желаемое поведение .
Software 2.0 — это переход к нейронным сетям.
- Код здесь — это веса нейронной сети, которые человек не может написать или прочитать напрямую .
- Вместо написания инструкций человек задает цель (например, «выиграть в го») и предоставляет архитектуру сети .
- Процесс «написания» кода заменяется обучением с помощью обратного распространения ошибки и градиентного спуска .
Карпатый сравнивает этот процесс с собакой Павлова: нейронные связи укрепляются, когда они успешно предсказывают результат (еду после звонка колокольчика) . Уэс Рот отмечает, что Software 2.0 позволило решать задачи, которые были недоступны для классического программирования из-за их сложности, но этот метод все еще требует огромных вычислительных ресурсов и данных .
🚀 Что такое Software 3.0: Манипуляция моделями 11:25
Определение «Software 3.0» предложила Сара Го (Sarah Guo), инвестор и основатель фонда Conviction. В подкасте «My First Million» она объяснила, что если Software 2.0 было про маркировку данных и обучение моделей «с нуля», то новое поколение — это работа с уже готовыми «фундаментальными моделями» (Foundation Models) .
Ключевые характеристики Software 3.0 по мнению Сары Го:
- Использование готовой базы: Модели уже обладают колоссальными знаниями «из коробки», их не нужно учить основам языка или логики .
- Манипуляция вместо обучения: Разработка сводится к направлению (guidance), подкреплению и добавлению специфической информации о бизнесе .
- Решение проблем «последней мили»: Исследовательские лаборатории создают общие модели, а предприниматели адаптируют их под гигантское количество узких ниш .
Примером такого подхода может служить голосовой агент для записи клиентов. Разработчику не нужно собирать данные о звуках человеческой речи; ему достаточно подключить базовую модель к системе календаря и базе данных, задав нужный тон общения .
🌐 Стратегия открытого кода: Марк Цукерберг и Llama 3.1 6:36
Одним из главных катализаторов волны Software 3.0 стал релиз модели Llama 3.1 от Meta. Марк Цукерберг утверждает, что их новая модель уровня GPT-4 станет «учителем» для всего сообщества .
Позиция Цукерберга и Meta:
- Модель как учитель: Лицензия Llama 3.1 теперь официально разрешает использовать её для обучения других, более мелких моделей (дистилляция) .
- Фрагментированный мир: Цукерберг не верит в «одну большую модель, которая правит всеми». Он считает, что мир будет состоять из миллиардов различных агентов .
- Бизнес-модель: Meta не планирует зарабатывать на продаже доступа к модели, как облачные провайдеры. Их цель — построить лучшую экосистему, чтобы в итоге создавать лучшие конечные продукты .
Цукерберг прогнозирует, что в будущем у каждого малого бизнеса будет свой ИИ-агент, так же как сегодня у каждого есть адрес электронной почты, сайт и аккаунт в соцсетях . Для создателей контента (креаторов) ИИ-агенты станут «художественными артефактами», которые смогут взаимодействовать с сообществом 24/7, отражая ценности автора .
🛠 Дистилляция и «ремесленное» ИИ 14:20
Уэс Рот описывает технический процесс Software 3.0 как создание специализированных «студенческих» моделей на базе «учителей» .
Процесс выглядит так:
- Берется гигантская модель (например, Llama 405B), которая слишком дорога и неповоротлива для повседневных задач .
- С её помощью генерируются высококачественные синтетические данные для обучения .
- Обучается маленькая, быстрая и дешевая модель, которая идеально выполняет одну конкретную задачу (поддержка клиентов, проверка домашних заданий, планирование календаря) .
Рот называет это «артистическим» или «ремесленным» ИИ (Artisan AI) . По его прогнозу, через 20 лет даже дети смогут «на коленке» создавать свои модели, например, для отслеживания коллекции покемонов .
🎮 Практикум: Автоматизация игры Factorio 19:07
В качестве живого примера Software 3.0 в видео показан проект разработчика из стартапа Glaive.ai, который автоматизирует сложную стратегическую игру Factorio с помощью LLM .
Детали проекта:
- Разработчик потратил первую неделю на изучение библиотеки модов для Factorio на языке Lua .
- Он создал интерфейс, позволяющий ИИ-агенту взаимодействовать с игровыми объектами (добывать уголь, класть ресурсы в печи) без анализа изображения с экрана .
- Для управления используется модель, дообученная (fine-tuned) на специфических данных Glaive.ai для вызова функций .
- Обучение проводилось локально на видеокарте NVIDIA RTX 4090 .
Это наглядно демонстрирует суть Software 3.0: разработчик не пишет логику игры, он обучает модель понимать команды типа «иди к ближайшей железной руде» и превращать их в программный код Lua для взаимодействия с API игры .
📈 Будущее бизнеса: От 1% к 100% проникновения ИИ 16:04
Уэс Рот сравнивает текущее состояние рынка ИИ с ранними этапами компьютеризации.
- Сейчас, по его мнению, менее 1% бизнесов используют собственные ИИ-решения для автоматизации процессов .
- В ближайшие 5–15 лет этот показатель неизбежно приблизится к 100%, как это произошло с персональными компьютерами .
- Управление бизнесом будущего будет напоминать игру в Factorio: владелец не делает работу сам, а управляет автоматизированными процессами, подкручивая и оптимизируя системы .
Ведущий подчеркивает, что масштаб этой возможности трудно переоценить, и она открыта не только для крупных корпораций, но и для индивидуальных предпринимателей благодаря доступности мощных моделей с открытым исходным кодом .