Дэвид Пак о будущем финтеха: «Агентный ИИ сокращает ручную проверку документов на 70%»

DeepLearning.AI 578 28 мин 4 мин 03.12.2025
Главное

В рамках конференции AI Dev 25 в Нью-Йорке представители компании Landing AI представили инновационную платформу Agentic Document Extraction (ADE). Дэвид Пак и Эмили рассказали о том, как агентный подход в искусственном интеллекте меняет работу с неструктурированными данными в финансовом секторе, позволяя автоматизировать сложнейшие процессы — от проверки клиентов (KYC) до одобрения кредитов.

🤖 Новая эра извлечения данных: Платформа ADE 0:07

Дэвид Пак, руководитель группы прикладного проектирования ИИ в Landing AI, представил Agentic Document Extraction (ADE) — ориентированную на разработчиков платформу корпоративного уровня . В отличие от традиционных OCR-систем (оптического распознавания символов), ADE построена на принципах агентного ИИ и мультимодальности.

Ключевые особенности архитектуры платформы:

Дэвид особо подчеркнул роль основателя компании, доктора Эндрю Ына (Andrew Ng), который активно курирует R&D-направление . Его подход, ориентированный на данные (data-centric AI), позволяет системе постоянно совершенствоваться по мере обработки миллиардов изображений и документов .

🏦 Кейс в финансовом секторе: Автоматизация KYC и кредитования 8:44

Одним из наиболее ярким примеров внедрения ADE стала работа с крупнейшим финансовым институтом в области процедур «Знай своего клиента» (Know Your Customer, KYC). Ранее тысячи аналитиков вручную проверяли банковские выписки, учредительные документы и налоговые декларации .

Результаты внедрения ADE оказались значительными:

Еще один сценарий — обработка кредитной заявки . Обычно кредитный офицер получает «сборную посылку» (loan packet) в одном PDF: расчетные листки, форму W-2, выписки по счету и удостоверения личности. Раньше аналитикам приходилось вручную искать нужные разделы и перебивать данные.

ADE полностью автоматизирует этот процесс:

  1. Классификация и сплиттинг: Система понимает, где заканчивается паспорт и начинается выписка .
  2. Извлечение по схеме: Для каждого типа документа применяется своя «схема» (например, только Gross Pay и Net Pay для расчетного листка) .
  3. Визуальное обоснование (Visual Grounding): Каждое извлеченное значение привязано к конкретным координатам в исходном документе, что критично для аудита .

💻 Техническая демонстрация и возможности API 13:31

В ходе демонстрации на примере документов Fidelity Дэвид показал, как система справляется со сложными таблицами . Главная проблема LLM при работе с документами — непонимание пространственного расположения. ADE понимает иерархию (родительские и дочерние строки за счет отступов) «из коробки» .

Технические возможности платформы включают:

Дэвид продемонстрировал Python-библиотеку, доступную в GitHub-репозитории Landing AI . Она позволяет визуализировать те самые «кропы» (вырезанные фрагменты изображения) рядом с извлеченными данными. Это помогает аналитикам мгновенно проверить корректность работы ИИ, видя конкретную ячейку таблицы прямо в интерфейсе своей системы .

🛡️ Безопасность и оценка точности 26:10

По вопросам надежности Дэвид Пак привел впечатляющие данные тестов. На стандартном датасете DocVQA современные state-of-the-art модели (VLM и OCR на базе глубокого обучения) показывают точность в районе 90–95%, в то время как решение Landing AI достигает более 99% точности .

Вопросы безопасности в корпоративной среде решены за счет:

Эмили, курирующая программу для разработчиков (Builders Program), добавила, что сейчас Landing AI активно поддерживает сообщество, предоставляя ранний доступ к инструментам и помощь во внедрении . Также в начале следующего года компания планирует запустить новый образовательный курс на платформе DeepLearning.AI, посвященный этим технологиям .

💬 Цитаты

«Мы используем подход, ориентированный на данные, что позволяет системе постоянно улучшаться по мере обработки новых типов документов.»

Дэвид Пак 03:28

«Наш результат в тестах составил более 99% точности, в то время как другие современные модели находятся в районе 90-95%.»

Дэвид Пак 26:50
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
KYC (Know Your Customer)
Обязательная процедура проверки личности клиента финансовыми институтами.
Visual Grounding
Технология связи извлеченных текстовых данных с их точными координатами на изображении документа.
Zero-shot
Способность модели ИИ выполнять задачу без предварительного обучения на специфических примерах или шаблонах.
RAG (Retrieval-Augmented Generation)
Метод предоставления LLM доступа к внешним знаниям (документам) для более точных ответов.
📊 Цифры
🗓 Хронология
  1. 2024 Выход бенчмарка точности ADE в сравнении с DocVQA.
  2. начало 2025 Планируемый запуск курса по Agentic AI на платформе DeepLearning.AI.
⚖️ Другая сторона
Искусственный интеллект Landing AI Agentic AI Andrew Ng KYC automation Multimodal extraction