Компания Snowflake, долгое время известная как гигант в сфере облачного хранения данных, переживает масштабную трансформацию. Под руководством Барыша Гюльтекина, вице-президента по ИИ, компания переосмысливает свою роль, превращаясь в «AI Data Cloud». Основной тезис этой стратегии прост, но радикален: вместо того чтобы отправлять чувствительные корпоративные данные во внешние модели, необходимо привести искусственный интеллект непосредственно к данным.
🚀 От хранилища к «AI Data Cloud»: новая философия Snowflake 3:03
Барыш Гюльтекин пришел в Snowflake вместе с нынешним CEO Шридхаром Рамасвами после поглощения компании Neva в мае 2023 года . По его словам, сегодня Snowflake — это не просто платформа для аналитики, а полноценное облако данных для ИИ.
Основные изменения в работе клиентов:
- До эры ИИ: Клиенты использовали Snowflake преимущественно для структурированных данных, строили BI-дашборды и боролись с «силосами» (разобщенностью) данных внутри организации .
- С приходом ИИ: Произошел «великий апгрейд» неструктурированных данных. Теперь компании могут извлекать структуру из сотен тысяч документов (контрактов, PDF, отчетов) и анализировать их так же легко, как обычные таблицы .
Гюльтекин утверждает, что 80–90% всех корпоративных данных являются неструктурированными . Ранее они были «мертвым грузом», но современные LLM позволяют превратить их в ценный актив. В качестве примера он приводит сферу управления капиталом: теперь агент может одновременно проверять текущие котировки акций (структурированные данные) и анализировать отчеты об активах в формате PDF (неструктурированные данные) .
📊 Революция в Text-to-SQL: почему это заработало сейчас 9:25
Традиционно перевод естественного языка в SQL-запросы (Text-to-SQL) был крайне сложной задачей. По мнению Барыша Гюльтекина, в этой сфере практически нет права на ошибку: если пользователь спрашивает о выручке, существует только один правильный ответ .
Основные трудности Text-to-SQL:
- Семантическая неоднозначность: Определение «выручки» или «прибыли» может меняться от отдела к отделу.
- Масштаб: Реальные базы данных содержат тысячи таблиц и сотни тысяч колонок .
- «Племенные знания»: Информация о том, какие колонки устарели, часто хранится только в головах аналитиков.
Ситуация изменилась в последние полгода благодаря появлению моделей рассуждения (reasoning models), таких как o1. Гюльтекин отмечает, что качество Text-to-SQL достигло уровня, при котором технологию можно развертывать массово для бизнес-пользователей, не владеющих кодом . Продукт Snowflake Intelligence стал самым быстрорастущим в истории компании, так как он позволяет менеджерам получать инсайты мгновенно, не дожидаясь ответа от аналитиков целую неделю .
Чтобы решить проблему семантики, Snowflake предложила стандарт Open Semantic Interchange. Это открытый формат, разрабатываемый совместно с Tableau и Omni, который позволяет один раз создать семантическую модель (описание того, что значат данные) и использовать ее в разных ИИ-платформах без привязки к конкретному вендору .
🧠 RAG и обработка сложных документов 21:12
Технология RAG (генерация с дополнением извлеченными данными) в Snowflake строится на наследии поискового движка Neva. Гюльтекин подчеркивает, что качество RAG зависит не только от модели, но и от всей цепочки обработки :
- Обработка PDF: Документы часто содержат изображения, таблицы и многоколоночную верстку, что сбивает обычные модели.
- Гибридный поиск и ре-ранкеры: Использование поисковых технологий Neva позволяет находить более релевантные куски текста перед отправкой в LLM.
- Агентурная аналитика документов: Теперь системы могут не просто находить абзац, а отвечать на сложные вопросы типа «Какова средняя выручка за последние 10 лет на основе всех квартальных отчетов в PDF?» .
В вопросе выбора моделей Гюльтекин придерживается прагматичного подхода. Если нужно обработать миллионы документов, использовать топовые модели вроде Claude 3.5 Opus или Gemini 1.5 Pro слишком дорого и медленно . В таких случаях Snowflake предлагает специализированные, оптимизированные модели для извлечения информации, которые в разы меньше и дешевле флагманских решений .
🛡️ Безопасность: «ИИ идет к данным» 36:14
Ключевой барьер для внедрения ИИ в крупных корпорациях — страх утечки данных. Гюльтекин поясняет, что Snowflake решила эту проблему через партнерство с облачными провайдерами и лабораториями моделей (Anthropic, Google, OpenAI).
Инференс (исполнение) модели происходит внутри защищенного периметра Snowflake . Это означает:
- Данные не покидают границы безопасности Snowflake.
- Модели не сохраняют состояние (zero retention) и не обучаются на данных клиентов .
- Соблюдается строгая резиденция данных (data residency).
Особое внимание уделяется гранулярному доступу. Если в компании есть ИИ-агент по кадровым вопросам, он автоматически «наследует» права доступа пользователя. Менеджер увидит зарплаты только своих подчиненных, а обычный сотрудник — только свою, хотя обращаются они к одному и тому же боту .
🤖 Агенты и будущее рабочих процессов 51:26
Гюльтекин разделяет агентов на две категории по типу интерфейса и задач:
- Для бизнес-пользователей (Snowflake Intelligence): Это структурированные ассистенты. Например, отдел продаж из 5000 человек использует торгового ассистента для подготовки к продлению контрактов . Здесь важна предсказуемость и доверие к ответу.
- Для разработчиков и аналитиков: Кодинг-ассистенты, которые работают в режиме «выбери свое приключение» (как Claude Code).
Относительно будущего «автономных коллег», Гюльтекин согласен, что это естественная прогрессия. Хотя некоторые эксперты прогнозируют появление полноценных «drop-in» ИИ-сотрудников уже во втором квартале 2026 года, гость считает, что успех будет зависеть от четкости поставленных рамок (scoping) . ИИ-агент не сможет сразу стать «новым коллегой, который делает всё», но он вполне способен взять на себя узкую, изолированную роль.
📈 Экономика ИИ и «стирание середины» 1:23:45
Барыш Гюльтекин представил интересное видение того, где будет аккумулироваться стоимость (value capture) в индустрии ИИ. По его мнению, «середина будет размыта», а края — расширяться:
- Нижний уровень (Инфраструктура): Производители чипов (Nvidia) и провайдеры моделей продолжат забирать значительную долю прибыли .
- Верхний уровень (Приложения): Компании, создающие уникальный пользовательский опыт на базе моделей (например, Cursor), будут процветать.
- Средний уровень (Кастомная бизнес-логика): Традиционные SaaS-решения, которые просто автоматизируют узкие процессы, рискуют исчезнуть, так как агенты смогут генерировать эту логику «на лету» .
Гюльтекин делает ставку на горизонтальные платформы. Он считает, что вертикальные решения (специализированные под одну нишу) становятся менее защищенными, так как современные модели обладают достаточным «интеллектом», чтобы разобраться в специфике любой отрасли при наличии правильных данных.
💡 Советы лидерам индустрии 1:38:04
В завершение беседы Барыш Гюльтекин дал несколько рекомендаций руководителям предприятий:
- Прекратить осторожничать: ИИ уже достаточно мощен, и сейчас идет гонка за интуицией и опытом его использования .
- Готовить фундамент данных: Главное препятствие — «силосы». Нужно инвестировать в то, чтобы данные были доступны для ИИ, а не заперты в старых системах .
- Менять философию продукта: В эпоху ИИ-кодинга прототипирование должно стать мгновенным. «Рабочий прототип — это валюта нашего времени» .