Атул Део об AWS Bedrock: «ИИ должен решать реальные задачи»

Eye on AI 1,1 тыс. 49 мин 3 мин 06.12.2023
Главное

🚀 Будущее генеративного ИИ в Amazon: Инсайт от Атула Део 2:38

В эпоху стремительного развития технологий искусственного интеллекта Amazon активно трансформирует свой подход к облачным сервисам и корпоративной разработке. Крэйг Смит, автор подкаста «Eye on AI», встретился с Атулом Део, генеральным менеджером AWS Bedrock, на конференции AWS re:Invent в Лас-Вегасе, чтобы обсудить, как компания строит экосистему генеративного ИИ и какие вызовы стоят перед индустрией.

🛠 AWS Bedrock: Инструменты и возможности 13:31

AWS Bedrock представляет собой API-сервис, который предоставляет разработчикам доступ к широкому спектру высокопроизводительных базовых моделей (Foundation Models), не требуя при этом глубоких знаний в машинном обучении или управления инфраструктурой.

Ключевые функциональные возможности сервиса:

🧠 Борьба с галлюцинациями: Retrieval Augmented Generation (RAG) 16:38

Одной из главных проблем больших языковых моделей является отсутствие понимания контекста конкретной компании и актуальной информации, что приводит к «галлюцинациям». Для решения этой задачи Amazon внедрила в Bedrock технологию Retrieval Augmented Generation (RAG), или «генерацию с дополненным поиском».

Процесс RAG в реализации Amazon выглядит следующим образом:

  1. Подготовка данных: Документы из S3 разбиваются на мелкие фрагменты (chunks).
  2. Векторизация: Фрагменты пропускаются через модель эмбеддингов, превращаясь в математические векторы, отражающие семантический смысл текста.
  3. Хранение: Векторы сохраняются в специализированную базу данных (Vector Database), например, Pinecone, Redis или собственный движок OpenSearch Serverless.
  4. Поиск и дополнение: Когда пользователь задает вопрос, система находит наиболее релевантные фрагменты документов, добавляет их в системный промпт (контекст) и только потом отправляет запрос в языковую модель.

По словам Атула Део, компания берет на себя «недифференцированную тяжелую работу»: пользователю достаточно просто загрузить документы в S3, а сервис автоматически настроит процесс векторизации и управления запросами.

🖥 Проблема GPU и аппаратные решения 27:05

В индустрии существует острый дефицит вычислительных мощностей, и многие компании сталкиваются с жесткими лимитами на количество запросов в минуту. Атул Део подтверждает наличие проблемы доступности GPU, возникшей из-за резкого спроса на фоне кризиса цепочек поставок.

Однако AWS имеет стратегическое преимущество благодаря многолетним инвестициям в собственные чипы:

Гость подчеркивает, что компания не призывает использовать самые дорогие и ресурсоемкие модели для всех задач. Подход AWS заключается в предоставлении выбора: от маленьких и быстрых моделей (например, Titan Light) до мощных (как Claude от Anthropic) в зависимости от требований к латентности и стоимости.

🔮 Будущее: От языковых моделей к пониманию мира 43:01

По мнению Атула Део, мы находимся на ранней стадии глобальной трансформации, сопоставимой с промышленной революцией. Он полагает, что в ближайшие годы ключевым направлением развития станет «закрытие разрыва в последние 2%»: текущие ИИ-системы работают хорошо, но требуют оттачивания для полной надежности.

В перспективе, как отмечает спикер, ИИ перейдет от чисто текстовых моделей к мультимодальным системам, способным обучаться непосредственно на данных из физического мира, подобно тому, как учатся дети — наблюдая за окружающей средой и социальными сигналами, а не просто поглощая гигабайты текста.

💬 Цитаты

«Хорошие технологии решают проблемы, о которых вы знаете. Великие технологии решают проблемы, о которых вы даже не задумывались.»

«Ничто «ванильное» никогда не бывает приемлемым для строителя (разработчика). Вы всегда хотите добавить свой собственный поворот.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG (Retrieval Augmented Generation)
Технология, позволяющая дополнять промпт языковой модели актуальными данными из внешних источников компании.
Эмбеддинг (Embedding)
Математическое представление текста в виде вектора, которое позволяет ИИ понимать смысловую близость слов и документов.
Инференс (Inference)
Процесс использования обученной модели для выполнения предсказаний или генерации ответов.
Foundation Models
Масштабные базовые модели, обученные на огромных массивах данных, которые служат основой для специализированных приложений.
📊 Цифры
🗓 Хронология
  1. 2008-2009 Работа Атула Део в Yahoo во время обсуждения сделки с Microsoft.
  2. 2014 Переход Атула Део в корпоративное развитие Amazon (M&A для AWS).
  3. 2016-2017 Формирование команды машинного обучения внутри AWS.
  4. 2019 Запуск сервиса Amazon CodeGuru для автоматизированных код-ревью.
  5. сентябрь 2023 Официальный запуск (General Availability) Amazon Bedrock.
⚖️ Другая сторона
Искусственный интеллект AWS Bedrock Atul Deo Generative AI Retrieval Augmented Generation Amazon Titan