Цитаты — Эндрю Ын

«

В моей карьере в области ИИ я еще не встречал ни одного человека, который чувствовал бы, что у него достаточно вычислительных мощностей.

Эндрю Ын: «Открытые LLM — это современный аналог Голливуда для геополитики»

«

Открытые модели — это огромный источник геополитического влияния. Это новый фронт мягкой силы, подобный Голливуду.

24:54 · Эндрю Ын: «Открытые LLM — это современный аналог Голливуда для геополитики»

«

Совет бизнес-лидеров не учиться кодить, потому что ИИ всё автоматизирует — это худший карьерный совет в истории.

46:37 · Эндрю Ын: «Открытые LLM — это современный аналог Голливуда для геополитики»

«

ИИ сам по себе ни безопасен, ни опасен. То, как вы его применяете, делает его безопасным или небезопасным.

31:15 · Эндрю Ын: как строить стартапы быстрее с помощью ИИ

«

Утверждение, что ИИ настолько силен, что мы можем случайно привести к вымиранию человечества — это просто нелепо.

28:50 · Эндрю Ын: как строить стартапы быстрее с помощью ИИ

«

Когда путь от четко написанной спецификации до готового кода занимает считаные минуты, критически важным становится решение — что именно нужно собирать.

05:47 · Эндрю Ын и Лоуренс Морони о будущем карьеры в ИИ

«

Программирование — это не про синтаксис, а про умение систематически объяснять компьютеру, что ему делать.

28:45 · Как ИИ меняет кодинг и образование: дискуссия Эндрю Ына и Мехрана Сахами

«

Двигаться быстро и быть ответственным — это возможно.

46:11 · Как ИИ меняет кодинг и образование: дискуссия Эндрю Ына и Мехрана Сахами

«

ИИ — это технология общего назначения, которая сейчас применяется практически во всех областях экономики.

04:25 · Эндрю Ын и Мехран Сахами о будущем кодинга: почему основы CS важнее, чем когда-либо

«

В традиционных софтверных проектах вы пишете код и контролируете его... Но ИИ-проекты включают как код, так и данные, на которых вы обучаете алгоритм. И вы почти никогда не знаете, какие странные и чудесные вещи скрываются в ваших данных.

1:10 · Эндрю Ын: «Скорость выполнения — главный предиктор успеха стартапа»

«

В моему мнению, один из сильных предикторов того, преуспеет ли стартап... это просто скорость выполнения, абсолютная скорость доведения дел до конца.

16:47 · Эндрю Ын: «Скорость выполнения — главный предиктор успеха стартапа»

«

Я склонен говорить своим командам: у нас есть два дня, или один день, или, может быть, неделя... какой самый креативный, уважительный, ответственный, но быстрый способ мы можем использовать для сбора данных?

20:45 · Эндрю Ын: «Скорость выполнения — главный предиктор успеха стартапа»

«

По моему мнению, совет не учиться кодить на том основании, что ИИ автоматизирует этот процесс, — это худший карьерный совет, который когда-либо давали.

44:54 · Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»

«

Сегодня я просто не найму программного инженера, который не умеет использовать ИИ для помощи в написании кода. В этом нет никакого смысла.

47:13 · Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»

«

Многие из моих друзей в то время говорили мне, что создавать Google Brain — ужасная идея.

06:39 · Куок Ле о создании нейросетей и будущем NLP: от кота в Google до генеративных моделей

«

Я бы почтительно заметил, что за последнее десятилетие с помощью ИИ мы призвали гораздо больше ангелов, чем демонов.

12:23 · Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»

«

Если ИИ достаточно умен, чтобы случайно уничтожить нас, он, вероятно, будет достаточно умен, чтобы понять наши намерения.

04:40 · Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»

«

Я бы предпочел, чтобы ИИ развивался быстрее, а не медленнее, если мы хотим, чтобы человечество процветало в следующие тысячи лет.

16:25 · Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»

«

ИИ — это новое электричество. Мы трансформировали софт, теперь пора трансформировать сельское хозяйство и здравоохранение.

00:23 · От хайпа к продуктивности: Эндрю Ын и Лоуренс Морони о будущем TensorFlow

«

Лучшие ИИ-команды не используют глубокое обучение для всего. У них есть портфель техник от XGBoost до графов знаний.

25:13 · От хайпа к продуктивности: Эндрю Ын и Лоуренс Морони о будущем TensorFlow

«

Мы привыкли рассказывать себе подобные истории, но я думаю, мы поняли, что эти результаты — по крайней мере в той же мере продукт воображения исследователя, как и реальный феномен.

42:50 · Эндрю Ын: «PCA — это не панацея для машинного обучения»

«

Перед использованием PCA рассмотрите возможность простого использования исходных данных.

44:35 · Эндрю Ын: «PCA — это не панацея для машинного обучения»

«

Я думаю, что машинное обучение и глубокое обучение всё ещё находятся в той ранней эре, когда студент может обучать нейросеть, и по какой-то причине она не работает, и он идет к мудрецу и спрашивает: „Что мне делать?“

14:40 · Эндрю Ын: «ИИ создаст 30 триллионов долларов стоимости к 2030 году»

«

Одна из очень привлекательных вещей, которые я делаю в машинном обучении — это однодневные спринты. Это звучит безумно, верно?

15:38 · Эндрю Ын: «ИИ создаст 30 триллионов долларов стоимости к 2030 году»

«

Не стройте еще одну поисковую систему — это была конкуренция десятилетней давности. Решайте задачи добычи полезных ископаемых, сельского хозяйства и производства.

34:55 · Эндрю Ын: «ИИ создаст 30 триллионов долларов стоимости к 2030 году»

«

Если они хотят называть себя разработчиками, для меня этого достаточно. Они одни из нас.

09:48 · Как генеративный ИИ меняет разработку ПО: итоги панели AI Dev 25

«

Этот шаг поможет перенести ИИ в остальные сферы, которые намного масштабнее софтверной индустрии.

02:19 · Эндрю Ын: «ИИ — это новая электроэнергия для мирового бизнеса»

«

Я рекомендую компаниям автоматизировать отдельные задачи, а не профессии целиком.

08:22 · Эндрю Ын: «ИИ — это новая электроэнергия для мирового бизнеса»

«

В эпоху масштабных технологических изменений качество лидерства имеет решающее значение.

19:37 · Эндрю Ын: «ИИ — это новая электроэнергия для мирового бизнеса»

«

Полезный тест — не то, может ли человеческий глаз распознать свет светофора, а может ли человек, сидя в офисе, сделать это, глядя только на изображение с камеры.

06:35 · Эндрю Ын о технической осуществимости ML-проектов: как понять, что идею можно реализовать

«

Скорость предыдущих улучшений может быть на удивление хорошим предиктором скорости будущих улучшений.

11:50 · Эндрю Ын о технической осуществимости ML-проектов: как понять, что идею можно реализовать

«

Если у вас всего 100 обучающих примеров и один из них помечен неверно — это уже 1% вашего набора данных.

04:30 · Малые и большие данные в MLOps: как тип данных меняет стратегию разработки

«

Совет от человека, работавшего в том же квадранте, что и ваша проблема, будет в среднем более полезным.

09:40 · Малые и большие данные в MLOps: как тип данных меняет стратегию разработки

«

Если 99% пациентов не больны, алгоритм, предсказывающий, что никто никогда не болеет, будет иметь точность 99%.

00:54 · Эндрю Ын: «Высокая точность на перекошенных данных — это иллюзия»

«

F1 — это способ объединения точности и полноты, который делает акцент на худшем из этих двух показателей.

08:14 · Эндрю Ын: «Высокая точность на перекошенных данных — это иллюзия»

«

Я призываю вас не тратить 30 дней на сбор данных, потому что это задержит ваше вхождение в цикл итерации на целый месяц.

01:07 · Эндрю Ын: «Тратить месяц на сбор данных перед первой моделью — это ошибка»

«

Когда я работаю над новым проектом, я часто не против потратить несколько часов или день-два на самостоятельную разметку данных.

08:15 · Эндрю Ын: «Тратить месяц на сбор данных перед первой моделью — это ошибка»

«

Мой совет командам: не увеличивайте объем данных более чем в 10 раз за один прием.

10:51 · Эндрю Ын: «Тратить месяц на сбор данных перед первой моделью — это ошибка»

«

Неважно, насколько велико входное изображение, количество параметров остается фиксированным.

06:16 · Как устроены слои в CNN: руководство DeepLearning.AI

«

Количество каналов в вашем изображении должно совпадать с количеством каналов в вашем фильтре.

01:20 · Эндрю Ын: «Как работают свертки по трехмерным объемам»

«

По сути, количество каналов в выходном объеме равно количеству используемых вами фильтров.

09:55 · Эндрю Ын: «Как работают свертки по трехмерным объемам»

«

Необычность функции активации Softmax в том, что она принимает на вход вектор и выдает на выходе тоже вектор.

08:15 · Как работает Softmax: математика и логика мультиклассовых нейросетей

«

Решающая граница между любыми двумя классами в Softmax будет линейной, если у вас нет скрытых слоев.

10:29 · Как работает Softmax: математика и логика мультиклассовых нейросетей

«

Локализация относится к выяснению того, где именно на картинке находится обнаруженный вами автомобиль.

01:04 · Как научить нейросеть рисовать Bounding Box: руководство от DeepLearning.AI

«

Идея заставить нейросеть выдавать набор вещественных чисел для определения местоположения оказывается очень мощной.

11:29 · Как научить нейросеть рисовать Bounding Box: руководство от DeepLearning.AI

«

Прикладное машинное обучение — это крайне эмпирический процесс, в котором нужно обучить множество моделей, чтобы найти ту, которая работает.

Как ускорить обучение нейросетей на больших данных с помощью мини-пакетов

«

Имея большой обучающий набор данных, Mini-Batch градиентный спуск работает намного быстрее, и это практически то, что используют все в Deep Learning.

11:19 · Как ускорить обучение нейросетей на больших данных с помощью мини-пакетов

«

Главная причина, по которой люди используют Max pooling, заключается в том, что по результатам множества экспериментов это просто хорошо работает.

3:19 · Разбор слоев объединения в CNN: механизмы Max pooling и Average pooling

«

В слоях объединения нет параметров для обучения — градиентному спуску здесь нечего менять.

3:44 · Разбор слоев объединения в CNN: механизмы Max pooling и Average pooling

«

Механизм внимания позволяет нейронной сети уделять внимание только части входного предложения при генерации перевода, во многом подобно переводчику-человеку.

Как работает Attention Model: детальный разбор архитектуры от Эндрю Ына

«

Это действительно одна из самых мощных идей в глубоком обучении.

12:05 · Как работает Attention Model: детальный разбор архитектуры от Эндрю Ына

«

Вместо того чтобы принуждать вас выполнять прямое распространение для четырех подмножеств входного изображения независимо, это объединяет все четыре в одно вычисление.

08:52 · DeepLearning.AI: «Сверточная реализация метода скользящего окна»

«

Это делает все дело намного эффективнее.

10:55 · DeepLearning.AI: «Сверточная реализация метода скользящего окна»

«

Bleu Score выступает «дублёром» для человеческих экспертов, позволяя автоматически оценивать качество перевода.

01:36 · Bleu Score: Как измерить точность машинного перевода?

«

Bleu Score стал революционным, так как предоставил разработчикам единую метрику для сравнения идей и ускорения прогресса.

14:43 · Bleu Score: Как измерить точность машинного перевода?

«

Масштаб стал движущей силой прогресса в глубоком обучении.

03:05 · Эндрю Ын: «Почему нейросети взлетели именно сейчас?»

«

Огромная разница в продуктивности, когда вы можете проверить идею за 10 минут или за день, а не ждать результата месяц.

08:15 · Эндрю Ын: «Почему нейросети взлетели именно сейчас?»

«

Когда я считаю слои, я считаю только те слои, у которых есть веса.

03:17 · Эндрю Ын: «Не изобретайте гиперпараметры, используйте проверенные архитектуры»

«

Один из распространенных советов — не пытаться изобретать собственные настройки гиперпараметров, а посмотреть в литературе, что сработало у других.

07:28 · Эндрю Ын: «Не изобретайте гиперпараметры, используйте проверенные архитектуры»

«

Если размер активации падает слишком быстро, это обычно не очень хорошо для производительности.

09:48 · Эндрю Ын: «Не изобретайте гиперпараметры, используйте проверенные архитектуры»

«

Вместо того чтобы выбирать, какой размер фильтра вам нужен в свёрточном слое или пулинге, давайте сделаем их все.

0:25 · Выбор без выбора: как архитектура Inception перевернула проектирование нейросетей

«

Слой узкого горлышка — это самая узкая часть этой сети. Мы сжимаем представление перед тем, как снова увеличить размер.

0:57 · Выбор без выбора: как архитектура Inception перевернула проектирование нейросетей

«

Вы можете значительно уменьшить размер представления, и это, похоже, не вредит производительности, но экономит кучу вычислений.

0:43 · Выбор без выбора: как архитектура Inception перевернула проектирование нейросетей

«

Основной вывод, который формулирует Эндрю Ын, заключается в том, что последовательный расчет производных справа налево (против хода основных вычислений) является наиболее эффективным вычислительным методом

13:19 · Эндрю Ын: «Самый эффективный способ вычисления производных — справа налево»

«

Прямой проход (слева направо) служит для вычисления самой оптимизируемой функции стоимости, тогда как обратный проход (справа налево) предназначен исключительно для быстрого вычисления производных

13:59 · Эндрю Ын: «Самый эффективный способ вычисления производных — справа налево»

«

Вместо того чтобы пытаться обучить масштабную сеть с нуля, разработчикам зачастую гораздо выгоднее скачать готовые бесплатные предобученные модели...

14:49 · Эндрю Ын объяснил математику и особенности обучения алгоритма Triplet Loss

«

Если формировать их наобум, то условие корректного разделения будет удовлетворяться слишком легко...

09:38 · Эндрю Ын объяснил математику и особенности обучения алгоритма Triplet Loss

«

По мере того как вы углубляетесь в сеть, высота и ширина имеют тенденцию уменьшаться, а количество каналов — расти.

3:42 · Разбор классических нейросетей: Как устроены LeNet-5, AlexNet и VGG-16

«

Именно эта работа (AlexNet) убедила многих в сообществе компьютерного зрения серьезно взглянуть на глубокое обучение.

11:53 · Разбор классических нейросетей: Как устроены LeNet-5, AlexNet и VGG-16

«

Я почти никогда больше не использую сигмоидальную функцию активации. Гиперболический тангенс (tanh) почти всегда строго лучше.

02:49 · Эндрю Ын: «Я почти никогда больше не использую сигмоиду»

«

Используя ReLU, ваша нейронная сеть часто будет обучаться намного быстрее, чем при использовании tanh или сигмоиды.

07:07 · Эндрю Ын: «Я почти никогда больше не использую сигмоиду»

«

Если вы просто убедитесь, что размерности ваших матриц совпадают, это уже устранит огромное количество багов в алгоритме обратного распространения.

09:50 · Интуиция Backpropagation: как работают шесть ключевых уравнений нейросети

«

Вывод алгоритма backpropagation — это одна из самых сложных математических задач, которые я видел в машинном обучении.

14:31 · Интуиция Backpropagation: как работают шесть ключевых уравнений нейросети

«

Beam Search — это наиболее широко используемый алгоритм для того, чтобы найти наиболее вероятную текстовую транскрипцию.

00:27 · Эндрю Ын: «Beam Search позволяет находить гораздо более качественные предложения»

«

Рассматривая несколько возможностей одновременно, лучевой поиск обычно находит гораздо лучший результат, чем жадный поиск.

11:34 · Эндрю Ын: «Beam Search позволяет находить гораздо более качественные предложения»

«

Операция reshape выполняется за константное время O(1). Это очень дешево, поэтому не бойтесь использовать её часто.

05:10 · Эндрю Ын: Математика и реализация механизма Broadcasting в Python

«

Трансляция позволит вам не только ускорить выполнение кода, но и добиться желаемого результата меньшим количеством строк.

10:40 · Эндрю Ын: Математика и реализация механизма Broadcasting в Python

«

Если вы используете Batch Norm, вы можете фактически исключить параметр b или считать его равным нулю.

08:30 · Эндрю Ын о Batch Norm: почему смещение «b» становится лишним?

«

Batch Norm происходит между вычислением Z и вычислением A.

02:26 · Эндрю Ын о Batch Norm: почему смещение «b» становится лишним?

«

Производная функции просто означает наклон этой функции.

09:34 · Эндрю Ын о производных: как наклон функции меняется в разных точках

«

Если вы хотите найти производную функции, вы можете просто открыть учебник по матанализу или Википедию.

10:04 · Эндрю Ын о производных: как наклон функции меняется в разных точках

«

Граница принятия решения — это линия, на которой вы находитесь в нейтральном положении относительно того, является ли Y нулем или единицей.

05:20 · «Z равно нулю»: как математика разделяет классы в обучении от DeepLearning.AI

«

С полиномиальными признаками вы можете получить очень сложные границы принятия решений.

09:36 · «Z равно нулю»: как математика разделяет классы в обучении от DeepLearning.AI

«

Если размер мини-пакета равен размеру всей выборки, вы просто возвращаетесь к пакетному градиентному спуску.

02:14 · Как Mini-batch Gradient Descent ускоряет обучение нейросетей в тысячи раз

«

Ваш код может работать быстрее, если размер мини-пакета является степенью двойки.

09:11 · Как Mini-batch Gradient Descent ускоряет обучение нейросетей в тысячи раз

«

Для многих задач вы можете использовать open-source реализацию с GitHub и вместо кода сфокусироваться на оптимизации данных.

07:24 · Эндрю Ын об MLOps: почему «чистые» данные важнее идеального кода

«

Вместо того чтобы просто собирать всё больше и больше данных, анализ ошибок поможет вам действовать более целенаправленно.

08:21 · Эндрю Ын об MLOps: почему «чистые» данные важнее идеального кода

«

В многозадачном обучении вы одновременно заставляете одну нейросеть делать несколько вещей сразу.

0:05 · Эндрю Ын: «Обучение одной сети нескольким задачам дает лучший результат в компьютерном зрении»

«

Единственный случай, когда многозадачность вредит производительности — если ваша нейросеть недостаточно велика.

10:14 · Эндрю Ын: «Обучение одной сети нескольким задачам дает лучший результат в компьютерном зрении»

«

На практике я вижу, что Transfer Learning используется гораздо чаще, чем Multitask Learning.

11:34 · Эндрю Ын: «Обучение одной сети нескольким задачам дает лучший результат в компьютерном зрении»

«

Softmax-регрессия — это обобщение логистической регрессии на более чем два класса.

01:47 · Обучение классификатора Softmax: математика потерь и градиентный спуск

«

Название Softmax происходит от контраста с так называемым Hardmax, который ставит 1 на место самого большого элемента и 0 на остальные.

00:52 · Обучение классификатора Softmax: математика потерь и градиентный спуск

«

Функция стоимости дает вам способ измерить, насколько хорошо определенный набор параметров соответствует обучающим данным.

00:01 · Математика классификации: как логарифмические потери спасают градиентный спуск

«

Для логистической регрессии эта функция стоимости на основе квадратичной ошибки не является хорошим выбором.

02:46 · Математика классификации: как логарифмические потери спасают градиентный спуск

«

Один из инструментов отладки, который я часто использую для проверки корректности кода — это лист бумаги, на котором я просто просчитываю размерности матриц.

Эндрю Ын: «Лист бумаги — лучший инструмент отладки размерностей нейросетей»

«

Если вы будете следить за тем, чтобы размерности всех матриц были согласованы, это поможет вам устранить целый класс возможных багов.

10:37 · Эндрю Ын: «Лист бумаги — лучший инструмент отладки размерностей нейросетей»

«

Ортогонализация относится к тому, что дизайнеры телевизоров проектировали ручки так, чтобы каждая выполняла только одну функцию.

1:51 · Эндрю Ын: «Ортогонализация — секрет эффективной настройки нейросетей»

«

Я лично считаю раннюю остановку сложной для понимания, потому что это ручка, которая одновременно влияет на качество обучения и обобщающую способность.

9:05 · Эндрю Ын: «Ортогонализация — секрет эффективной настройки нейросетей»

«

Когда у вас мало данных, ручное проектирование — это лучший способ добиться хорошей производительности.

02:44 · Эндрю Ын о состоянии Computer Vision: от ручного проектирования к Transfer Learning

«

Ансамблирование — это один из тех советов, которые люди используют для победы в соревнованиях, но который почти никогда не используется в продакшене.

08:29 · Эндрю Ын о состоянии Computer Vision: от ручного проектирования к Transfer Learning

«

Лучший способ развернуть систему — это не просто включить её и надеяться на лучшее.

От Shadow Mode до полной автоматизации: как правильно внедрять ML-модели

«

Я нахожу, что частичная автоматизация иногда является очень хорошим проектным решением для приложений, где производительность алгоритма недостаточно хороша для полной автоматизации.

09:40 · От Shadow Mode до полной автоматизации: как правильно внедрять ML-модели

«

Интуитивно вы можете думать о ранних слоях нейронной сети как о детектировании простых функций, таких как края, а затем об их композиции в последующих слоях.

2:00 · Эндрю Ын: «Термин „глубокое обучение“ — это во многом удачный брендинг»

«

Аналогии между глубоким обучением и человеческим мозгом иногда немного опасны, но в этом много правды.

5:05 · Эндрю Ын: «Термин „глубокое обучение“ — это во многом удачный брендинг»

«

Я думаю, что фраза «глубокое обучение» — это просто отличный бренд. Она звучит так глубоко!

9:17 · Эндрю Ын: «Термин „глубокое обучение“ — это во многом удачный брендинг»

«

В машинном обучении термин 'bias' (смещение) имеет второе техническое значение: если алгоритм недообучен, он не способен уловить явную закономерность в данных.

02:40 · Баланс между смещением и дисперсией: как найти идеальную модель машинного обучения

«

Переобучение означает, что модель подогнана под данные почти слишком хорошо, и она не будет обобщаться на новые примеры.

05:50 · Баланс между смещением и дисперсией: как найти идеальную модель машинного обучения

«

TensorFlow уже имеет встроенные необходимые обратные функции. Вот почему, используя встроенные функции для вычисления прямой функции, он может автоматически выполнять и обратные функции.

13:30 · Эндрю Нг о TensorFlow: «Вам больше не нужно реализовывать backprop вручную»

«

Всё, что вам нужно сделать, это указать, как рассчитать функцию стоимости, а затем он берет производные и может применить оптимизатор градиента всего одной или двумя строками кода.

10:32 · Эндрю Нг о TensorFlow: «Вам больше не нужно реализовывать backprop вручную»

«

Сквозное глубокое обучение позволяет взять множество этапов обработки и заменить их одной нейронной сетью.

0:14 · Эндрю Ын: «Сквозное обучение — это не панацея, всё решают данные»

«

Это не панацея, оно работает не всегда.

11:23 · Эндрю Ын: «Сквозное обучение — это не панацея, всё решают данные»

«

Многие инженеры считают, что развертывание модели машинного обучения — это финишная черта. К сожалению, первый деплой означает, что вы прошли лишь половину пути.

12:44 · Эндрю Ын: «Первый деплой модели — это лишь середина пути»

«

Концептуальный дрейф — это когда меняется само определение того, что мы хотим получить на выходе при заданных входных данных.

05:47 · Эндрю Ын: «Первый деплой модели — это лишь середина пути»

«

Этот простой процесс подсчета — анализ ошибок — может сэкономить вам массу времени при выборе наиболее перспективного направления.

04:13 · Как приоритизировать задачи в ML: метод «потолка» от Эндрю Ына

«

Анализ ошибок дает вам 'потолок' производительности — лучшее, на что вы можете надеяться, решив конкретную проблему.

03:05 · Как приоритизировать задачи в ML: метод «потолка» от Эндрю Ына

«

Мы собираемся определить стиль как корреляцию между активациями в разных каналах этого слоя.

00:33 · Эндрю Ын: «Стиль изображения — это корреляция между признаками нейросети»

«

Корреляция говорит вам, какие из этих компонентов текстуры высокого уровня имеют тенденцию возникать или не возникать вместе в части изображения.

03:24 · Эндрю Ын: «Стиль изображения — это корреляция между признаками нейросети»

«

Алгоритмы глубокого обучения достаточно устойчивы к случайным ошибкам в обучающем наборе, но менее устойчивы к систематическим.

2:15 · Эндрю Ын о «грязных» данных: стоит ли исправлять ошибки в разметке?

«

Если вы не можете доверять своему проверочному набору в оценке того, какой классификатор лучше, это веский повод исправить метки.

7:55 · Эндрю Ын о «грязных» данных: стоит ли исправлять ошибки в разметке?

«

Несколько часов ручного подсчета данных могут реально помочь вам расставить приоритеты — это отличное использование вашего времени.

12:35 · Эндрю Ын о «грязных» данных: стоит ли исправлять ошибки в разметке?

«

Если ваша метрика оценки больше не ранжирует предпочтения между алгоритмами правильно... это знак, что вам следует сменить метрику или проверочный набор.

01:59 · Эндрю Ын: «Если метрика не работает, смените её»

«

Думайте об определении метрики как о первом шаге, и вы делаете что-то другое для шага номер два (оптимизации).

07:02 · Эндрю Ын: «Если метрика не работает, смените её»

«

Даже если вы не можете определить идеальную метрику, просто настройте что-то быстро и используйте это для ускорения итераций вашей команды.

10:20 · Эндрю Ын: «Если метрика не работает, смените её»

«

Навигационные запросы в этом контексте — это непропорционально важный набор примеров.

02:12 · Эндрю Ын: «Ваша задача — решать проблему бизнеса, а не просто показывать точность на тестах»

«

Я считаю своей работой не просто хорошо выступить на тестовом наборе, а создать систему машинного обучения, которая решает реальную бизнес-задачу.

10:13 · Эндрю Ын: «Ваша задача — решать проблему бизнеса, а не просто показывать точность на тестах»

«

Потому что вы изменили две вещи одновременно, трудно понять, какая часть увеличения ошибки вызвана тем, что алгоритм не видел данные, а какая — различием в самих данных.

01:47 · Эндрю Ын: «Несоответствие данных — третья большая проблема после смещения и дисперсии»

«

Буду честен: не существует очень систематических способов борьбы с несоответствием данных.

17:29 · Эндрю Ын: «Несоответствие данных — третья большая проблема после смещения и дисперсии»

«

Фонемы — это фантазия языка, созданная людьми-лингвистами. Это разумное описание, но не очевидно, что стоит заставлять алгоритм думать ими.

01:07 · Сквозное обучение нейросетей: когда данные побеждают человеческий опыт

«

Сквозное обучение позволяет данным говорить самим за себя.

00:12 · Сквозное обучение нейросетей: когда данные побеждают человеческий опыт

«

Ручное проектирование компонентов — это способ впрыснуть человеческие знания в алгоритм.

03:19 · Сквозное обучение нейросетей: когда данные побеждают человеческий опыт

«

Я призываю вас относиться к развертыванию как к итеративному процессу.

05:45 · Эндрю Ын: «Развертывание модели — это не конец, а начало итерации»

«

Сегодня ручное переобучение встречается гораздо чаще, чем автоматическое. Разработчики не решаются позволить алгоритму полностью автоматически принимать решение о выпуске новой модели в продакшн.

09:08 · Эндрю Ын: «Развертывание модели — это не конец, а начало итерации»

«

Проверочная выборка указывает вашей команде, куда целиться. Если в ней данные не из того распределения, вы оптимизируете систему не под ту задачу.

04:35 · Эндрю Ын: «Не перемешивайте данные из разных источников в одну кучу»

«

В эпоху глубокого обучения все больше команд тренируют модели на данных, чье распределение отличается от проверочных и тестовых сетов.

00:24 · Эндрю Ын: «Не перемешивайте данные из разных источников в одну кучу»

«

Для человеческого уха один час шума может звучать так же, как любой другой, но есть риск, что алгоритм переобучится на этот конкретный час.

06:19 · Эндрю Ын: Как решать проблему рассогласования данных и не попасть в ловушку синтеза

«

Сложность синтеза данных в том, что на ваш слух 10 000 часов могут звучать одинаково, но вы можете создать обедненный набор данных.

06:59 · Эндрю Ын: Как решать проблему рассогласования данных и не попасть в ловушку синтеза

«

Человеческий уровень производительности является прокси-метрикой для ошибки Байеса.

01:33 · Эндрю Ын: «Точное определение человеческого уровня критично для успеха ML-проекта»

«

Прогресс в проектах машинного обучения замедляется, как только вы достигаете человеческого уровня.

07:22 · Эндрю Ын: «Точное определение человеческого уровня критично для успеха ML-проекта»

«

Перемножение множества чисел меньше единицы приводит к крошечному результату, который компьютер не может хранить точно.

01:26 · Эндрю Ын: «Beam Search — это компромисс между качеством перевода и вычислительными затратами»

«

Использование параметра альфа — это эвристика или «хак», у него нет строгого теоретического обоснования, но это хорошо работает на практике.

05:37 · Эндрю Ын: «Beam Search — это компромисс между качеством перевода и вычислительными затратами»

«

Для многих приложений я ожидаю огромный скачок качества при переходе от ширины луча 1 к 10, но прогресс от 1000 до 3000 может быть уже не таким заметным.

09:24 · Эндрю Ын: «Beam Search — это компромисс между качеством перевода и вычислительными затратами»

«

Вы не сможете лидировать в ИИ, будучи лидером в принятии правил, замедляющих ИИ.

08:11 · Эндрю Ын и Мириам Фогель: Как выстроить доверие к ИИ через управление, а не запреты

«

Если цена поиска двух отличных идей для масштабирования — это создание 18 других вещей, которые умрут тихой смертью, это нормально.

03:26 · Эндрю Нг о будущем разработки: «Возможности ИИ в кодинге удваиваются каждые 70 дней»

«

Наши технологические компании провели массированную PR-кампанию, убеждая людей не доверять ИИ и сравнивая его с ядерным оружием. Это было прискорбно.

07:37 · Эндрю Нг о будущем разработки: «Возможности ИИ в кодинге удваиваются каждые 70 дней»

«

Вершина небоскреба приближает вас к Луне, но строительство высоких зданий — это не всё, что нужно, чтобы на ней оказаться.

29:02 · Эндрю Ын: «ИИ сегодня — это эра хороших данных, а не только больших»

«

Вместо одного приложения на миллиард долларов у вас может быть десять тысяч приложений ценой от одного до пяти миллионов.

07:06 · Эндрю Ын: «ИИ сегодня — это эра хороших данных, а не только больших»

«

Я думаю, что мы сможем построить гораздо более богатое общество, если позволим каждому помочь писать будущее.

00:51 · Как Эндрю Ын предлагает передать ИИ малому бизнесу

«

Вопреки хайпу, ИИ часто может отлично работать даже на скромных объемах данных.

03:11 · Как Эндрю Ын предлагает передать ИИ малому бизнесу

«

Сегодня ИИ находится в руках верховных жрецов и жриц — это высококвалифицированные инженеры, многие из которых работают в крупных технологических компаниях.

0:39 · Эндрю Ын о демократизации ИИ: как превратить технологии в инструмент для каждого бизнеса

«

Мы сможем построить гораздо более богатое общество, если позволим каждому участвовать в написании будущего.

0:51 · Эндрю Ын о демократизации ИИ: как превратить технологии в инструмент для каждого бизнеса

«

AI is the new electricity.

0:26 · Эндрю Ын: «Агентный ИИ — главная возможность для разработчиков»

«

Move fast and be responsible.

6:04 · Эндрю Ын: «Агентный ИИ — главная возможность для разработчиков»

«

Я думаю, что ИИ — это новое электричество.

0:52 · Эндрю Ын: «Искусственный интеллект — это новое электричество»

«

Вы сможете с уверенностью внести глубокое обучение в свое резюме.

0:37 · Эндрю Ын: «Искусственный интеллект — это новое электричество»