← Эндрю Ын
Эндрю Ын
154 цитаты из наших статей · нажмите, чтобы открыть статью-источник
Генеральный партнер AI Fund, сооснователь Coursera, легендарный исследователь ИИ
«
В моей карьере в области ИИ я еще не встречал ни одного человека, который чувствовал бы, что у него достаточно вычислительных мощностей.
Эндрю Ын: «Открытые LLM — это современный аналог Голливуда для геополитики»
«
Открытые модели — это огромный источник геополитического влияния. Это новый фронт мягкой силы, подобный Голливуду.
24:54 · Эндрю Ын: «Открытые LLM — это современный аналог Голливуда для геополитики»
«
Совет бизнес-лидеров не учиться кодить, потому что ИИ всё автоматизирует — это худший карьерный совет в истории.
46:37 · Эндрю Ын: «Открытые LLM — это современный аналог Голливуда для геополитики»
«
ИИ сам по себе ни безопасен, ни опасен. То, как вы его применяете, делает его безопасным или небезопасным.
31:15 · Эндрю Ын: как строить стартапы быстрее с помощью ИИ
«
Утверждение, что ИИ настолько силен, что мы можем случайно привести к вымиранию человечества — это просто нелепо.
28:50 · Эндрю Ын: как строить стартапы быстрее с помощью ИИ
«
Когда путь от четко написанной спецификации до готового кода занимает считаные минуты, критически важным становится решение — что именно нужно собирать.
05:47 · Эндрю Ын и Лоуренс Морони о будущем карьеры в ИИ
«
Программирование — это не про синтаксис, а про умение систематически объяснять компьютеру, что ему делать.
28:45 · Как ИИ меняет кодинг и образование: дискуссия Эндрю Ына и Мехрана Сахами
«
Двигаться быстро и быть ответственным — это возможно.
46:11 · Как ИИ меняет кодинг и образование: дискуссия Эндрю Ына и Мехрана Сахами
«
ИИ — это технология общего назначения, которая сейчас применяется практически во всех областях экономики.
04:25 · Эндрю Ын и Мехран Сахами о будущем кодинга: почему основы CS важнее, чем когда-либо
«
В традиционных софтверных проектах вы пишете код и контролируете его... Но ИИ-проекты включают как код, так и данные, на которых вы обучаете алгоритм. И вы почти никогда не знаете, какие странные и чудесные вещи скрываются в ваших данных.
1:10 · Эндрю Ын: «Скорость выполнения — главный предиктор успеха стартапа»
«
В моему мнению, один из сильных предикторов того, преуспеет ли стартап... это просто скорость выполнения, абсолютная скорость доведения дел до конца.
16:47 · Эндрю Ын: «Скорость выполнения — главный предиктор успеха стартапа»
«
Я склонен говорить своим командам: у нас есть два дня, или один день, или, может быть, неделя... какой самый креативный, уважительный, ответственный, но быстрый способ мы можем использовать для сбора данных?
20:45 · Эндрю Ын: «Скорость выполнения — главный предиктор успеха стартапа»
«
По моему мнению, совет не учиться кодить на том основании, что ИИ автоматизирует этот процесс, — это худший карьерный совет, который когда-либо давали.
44:54 · Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»
«
Сегодня я просто не найму программного инженера, который не умеет использовать ИИ для помощи в написании кода. В этом нет никакого смысла.
47:13 · Эндрю Ын: «Совет не учиться программированию — это худший карьерный совет в истории»
«
Многие из моих друзей в то время говорили мне, что создавать Google Brain — ужасная идея.
06:39 · Куок Ле о создании нейросетей и будущем NLP: от кота в Google до генеративных моделей
«
Я бы почтительно заметил, что за последнее десятилетие с помощью ИИ мы призвали гораздо больше ангелов, чем демонов.
12:23 · Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»
«
Если ИИ достаточно умен, чтобы случайно уничтожить нас, он, вероятно, будет достаточно умен, чтобы понять наши намерения.
04:40 · Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»
«
Я бы предпочел, чтобы ИИ развивался быстрее, а не медленнее, если мы хотим, чтобы человечество процветало в следующие тысячи лет.
16:25 · Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»
«
ИИ — это новое электричество. Мы трансформировали софт, теперь пора трансформировать сельское хозяйство и здравоохранение.
00:23 · От хайпа к продуктивности: Эндрю Ын и Лоуренс Морони о будущем TensorFlow
«
Лучшие ИИ-команды не используют глубокое обучение для всего. У них есть портфель техник от XGBoost до графов знаний.
25:13 · От хайпа к продуктивности: Эндрю Ын и Лоуренс Морони о будущем TensorFlow
«
Мы привыкли рассказывать себе подобные истории, но я думаю, мы поняли, что эти результаты — по крайней мере в той же мере продукт воображения исследователя, как и реальный феномен.
42:50 · Эндрю Ын: «PCA — это не панацея для машинного обучения»
«
Перед использованием PCA рассмотрите возможность простого использования исходных данных.
44:35 · Эндрю Ын: «PCA — это не панацея для машинного обучения»
«
Я думаю, что машинное обучение и глубокое обучение всё ещё находятся в той ранней эре, когда студент может обучать нейросеть, и по какой-то причине она не работает, и он идет к мудрецу и спрашивает: „Что мне делать?“
14:40 · Эндрю Ын: «ИИ создаст 30 триллионов долларов стоимости к 2030 году»
«
Одна из очень привлекательных вещей, которые я делаю в машинном обучении — это однодневные спринты. Это звучит безумно, верно?
15:38 · Эндрю Ын: «ИИ создаст 30 триллионов долларов стоимости к 2030 году»
«
Не стройте еще одну поисковую систему — это была конкуренция десятилетней давности. Решайте задачи добычи полезных ископаемых, сельского хозяйства и производства.
34:55 · Эндрю Ын: «ИИ создаст 30 триллионов долларов стоимости к 2030 году»
«
Если они хотят называть себя разработчиками, для меня этого достаточно. Они одни из нас.
09:48 · Как генеративный ИИ меняет разработку ПО: итоги панели AI Dev 25
«
Этот шаг поможет перенести ИИ в остальные сферы, которые намного масштабнее софтверной индустрии.
02:19 · Эндрю Ын: «ИИ — это новая электроэнергия для мирового бизнеса»
«
Я рекомендую компаниям автоматизировать отдельные задачи, а не профессии целиком.
08:22 · Эндрю Ын: «ИИ — это новая электроэнергия для мирового бизнеса»
«
В эпоху масштабных технологических изменений качество лидерства имеет решающее значение.
19:37 · Эндрю Ын: «ИИ — это новая электроэнергия для мирового бизнеса»
«
Полезный тест — не то, может ли человеческий глаз распознать свет светофора, а может ли человек, сидя в офисе, сделать это, глядя только на изображение с камеры.
06:35 · Эндрю Ын о технической осуществимости ML-проектов: как понять, что идею можно реализовать
«
Скорость предыдущих улучшений может быть на удивление хорошим предиктором скорости будущих улучшений.
11:50 · Эндрю Ын о технической осуществимости ML-проектов: как понять, что идею можно реализовать
«
Если у вас всего 100 обучающих примеров и один из них помечен неверно — это уже 1% вашего набора данных.
04:30 · Малые и большие данные в MLOps: как тип данных меняет стратегию разработки
«
Совет от человека, работавшего в том же квадранте, что и ваша проблема, будет в среднем более полезным.
09:40 · Малые и большие данные в MLOps: как тип данных меняет стратегию разработки
«
Если 99% пациентов не больны, алгоритм, предсказывающий, что никто никогда не болеет, будет иметь точность 99%.
00:54 · Эндрю Ын: «Высокая точность на перекошенных данных — это иллюзия»
«
F1 — это способ объединения точности и полноты, который делает акцент на худшем из этих двух показателей.
08:14 · Эндрю Ын: «Высокая точность на перекошенных данных — это иллюзия»
«
Я призываю вас не тратить 30 дней на сбор данных, потому что это задержит ваше вхождение в цикл итерации на целый месяц.
01:07 · Эндрю Ын: «Тратить месяц на сбор данных перед первой моделью — это ошибка»
«
Когда я работаю над новым проектом, я часто не против потратить несколько часов или день-два на самостоятельную разметку данных.
08:15 · Эндрю Ын: «Тратить месяц на сбор данных перед первой моделью — это ошибка»
«
Мой совет командам: не увеличивайте объем данных более чем в 10 раз за один прием.
10:51 · Эндрю Ын: «Тратить месяц на сбор данных перед первой моделью — это ошибка»
«
Неважно, насколько велико входное изображение, количество параметров остается фиксированным.
06:16 · Как устроены слои в CNN: руководство DeepLearning.AI
«
Количество каналов в вашем изображении должно совпадать с количеством каналов в вашем фильтре.
01:20 · Эндрю Ын: «Как работают свертки по трехмерным объемам»
«
По сути, количество каналов в выходном объеме равно количеству используемых вами фильтров.
09:55 · Эндрю Ын: «Как работают свертки по трехмерным объемам»
«
Необычность функции активации Softmax в том, что она принимает на вход вектор и выдает на выходе тоже вектор.
08:15 · Как работает Softmax: математика и логика мультиклассовых нейросетей
«
Решающая граница между любыми двумя классами в Softmax будет линейной, если у вас нет скрытых слоев.
10:29 · Как работает Softmax: математика и логика мультиклассовых нейросетей
«
Локализация относится к выяснению того, где именно на картинке находится обнаруженный вами автомобиль.
01:04 · Как научить нейросеть рисовать Bounding Box: руководство от DeepLearning.AI
«
Идея заставить нейросеть выдавать набор вещественных чисел для определения местоположения оказывается очень мощной.
11:29 · Как научить нейросеть рисовать Bounding Box: руководство от DeepLearning.AI
«
Прикладное машинное обучение — это крайне эмпирический процесс, в котором нужно обучить множество моделей, чтобы найти ту, которая работает.
Как ускорить обучение нейросетей на больших данных с помощью мини-пакетов
«
Имея большой обучающий набор данных, Mini-Batch градиентный спуск работает намного быстрее, и это практически то, что используют все в Deep Learning.
11:19 · Как ускорить обучение нейросетей на больших данных с помощью мини-пакетов
«
Главная причина, по которой люди используют Max pooling, заключается в том, что по результатам множества экспериментов это просто хорошо работает.
3:19 · Разбор слоев объединения в CNN: механизмы Max pooling и Average pooling
«
В слоях объединения нет параметров для обучения — градиентному спуску здесь нечего менять.
3:44 · Разбор слоев объединения в CNN: механизмы Max pooling и Average pooling
«
Механизм внимания позволяет нейронной сети уделять внимание только части входного предложения при генерации перевода, во многом подобно переводчику-человеку.
Как работает Attention Model: детальный разбор архитектуры от Эндрю Ына
«
Это действительно одна из самых мощных идей в глубоком обучении.
12:05 · Как работает Attention Model: детальный разбор архитектуры от Эндрю Ына
«
Вместо того чтобы принуждать вас выполнять прямое распространение для четырех подмножеств входного изображения независимо, это объединяет все четыре в одно вычисление.
08:52 · DeepLearning.AI: «Сверточная реализация метода скользящего окна»
«
Это делает все дело намного эффективнее.
10:55 · DeepLearning.AI: «Сверточная реализация метода скользящего окна»
«
Bleu Score выступает «дублёром» для человеческих экспертов, позволяя автоматически оценивать качество перевода.
01:36 · Bleu Score: Как измерить точность машинного перевода?
«
Bleu Score стал революционным, так как предоставил разработчикам единую метрику для сравнения идей и ускорения прогресса.
14:43 · Bleu Score: Как измерить точность машинного перевода?
«
Масштаб стал движущей силой прогресса в глубоком обучении.
03:05 · Эндрю Ын: «Почему нейросети взлетели именно сейчас?»
«
Огромная разница в продуктивности, когда вы можете проверить идею за 10 минут или за день, а не ждать результата месяц.
08:15 · Эндрю Ын: «Почему нейросети взлетели именно сейчас?»
«
Когда я считаю слои, я считаю только те слои, у которых есть веса.
03:17 · Эндрю Ын: «Не изобретайте гиперпараметры, используйте проверенные архитектуры»
«
Один из распространенных советов — не пытаться изобретать собственные настройки гиперпараметров, а посмотреть в литературе, что сработало у других.
07:28 · Эндрю Ын: «Не изобретайте гиперпараметры, используйте проверенные архитектуры»
«
Если размер активации падает слишком быстро, это обычно не очень хорошо для производительности.
09:48 · Эндрю Ын: «Не изобретайте гиперпараметры, используйте проверенные архитектуры»
«
Вместо того чтобы выбирать, какой размер фильтра вам нужен в свёрточном слое или пулинге, давайте сделаем их все.
0:25 · Выбор без выбора: как архитектура Inception перевернула проектирование нейросетей
«
Слой узкого горлышка — это самая узкая часть этой сети. Мы сжимаем представление перед тем, как снова увеличить размер.
0:57 · Выбор без выбора: как архитектура Inception перевернула проектирование нейросетей
«
Вы можете значительно уменьшить размер представления, и это, похоже, не вредит производительности, но экономит кучу вычислений.
0:43 · Выбор без выбора: как архитектура Inception перевернула проектирование нейросетей
«
Основной вывод, который формулирует Эндрю Ын, заключается в том, что последовательный расчет производных справа налево (против хода основных вычислений) является наиболее эффективным вычислительным методом
13:19 · Эндрю Ын: «Самый эффективный способ вычисления производных — справа налево»
«
Прямой проход (слева направо) служит для вычисления самой оптимизируемой функции стоимости, тогда как обратный проход (справа налево) предназначен исключительно для быстрого вычисления производных
13:59 · Эндрю Ын: «Самый эффективный способ вычисления производных — справа налево»
«
Вместо того чтобы пытаться обучить масштабную сеть с нуля, разработчикам зачастую гораздо выгоднее скачать готовые бесплатные предобученные модели...
14:49 · Эндрю Ын объяснил математику и особенности обучения алгоритма Triplet Loss
«
Если формировать их наобум, то условие корректного разделения будет удовлетворяться слишком легко...
09:38 · Эндрю Ын объяснил математику и особенности обучения алгоритма Triplet Loss
«
По мере того как вы углубляетесь в сеть, высота и ширина имеют тенденцию уменьшаться, а количество каналов — расти.
3:42 · Разбор классических нейросетей: Как устроены LeNet-5, AlexNet и VGG-16
«
Именно эта работа (AlexNet) убедила многих в сообществе компьютерного зрения серьезно взглянуть на глубокое обучение.
11:53 · Разбор классических нейросетей: Как устроены LeNet-5, AlexNet и VGG-16
«
Я почти никогда больше не использую сигмоидальную функцию активации. Гиперболический тангенс (tanh) почти всегда строго лучше.
02:49 · Эндрю Ын: «Я почти никогда больше не использую сигмоиду»
«
Используя ReLU, ваша нейронная сеть часто будет обучаться намного быстрее, чем при использовании tanh или сигмоиды.
07:07 · Эндрю Ын: «Я почти никогда больше не использую сигмоиду»
«
Если вы просто убедитесь, что размерности ваших матриц совпадают, это уже устранит огромное количество багов в алгоритме обратного распространения.
09:50 · Интуиция Backpropagation: как работают шесть ключевых уравнений нейросети
«
Вывод алгоритма backpropagation — это одна из самых сложных математических задач, которые я видел в машинном обучении.
14:31 · Интуиция Backpropagation: как работают шесть ключевых уравнений нейросети
«
Beam Search — это наиболее широко используемый алгоритм для того, чтобы найти наиболее вероятную текстовую транскрипцию.
00:27 · Эндрю Ын: «Beam Search позволяет находить гораздо более качественные предложения»
«
Рассматривая несколько возможностей одновременно, лучевой поиск обычно находит гораздо лучший результат, чем жадный поиск.
11:34 · Эндрю Ын: «Beam Search позволяет находить гораздо более качественные предложения»
«
Операция reshape выполняется за константное время O(1). Это очень дешево, поэтому не бойтесь использовать её часто.
05:10 · Эндрю Ын: Математика и реализация механизма Broadcasting в Python
«
Трансляция позволит вам не только ускорить выполнение кода, но и добиться желаемого результата меньшим количеством строк.
10:40 · Эндрю Ын: Математика и реализация механизма Broadcasting в Python
«
Если вы используете Batch Norm, вы можете фактически исключить параметр b или считать его равным нулю.
08:30 · Эндрю Ын о Batch Norm: почему смещение «b» становится лишним?
«
Batch Norm происходит между вычислением Z и вычислением A.
02:26 · Эндрю Ын о Batch Norm: почему смещение «b» становится лишним?
«
Производная функции просто означает наклон этой функции.
09:34 · Эндрю Ын о производных: как наклон функции меняется в разных точках
«
Если вы хотите найти производную функции, вы можете просто открыть учебник по матанализу или Википедию.
10:04 · Эндрю Ын о производных: как наклон функции меняется в разных точках
«
Граница принятия решения — это линия, на которой вы находитесь в нейтральном положении относительно того, является ли Y нулем или единицей.
05:20 · «Z равно нулю»: как математика разделяет классы в обучении от DeepLearning.AI
«
С полиномиальными признаками вы можете получить очень сложные границы принятия решений.
09:36 · «Z равно нулю»: как математика разделяет классы в обучении от DeepLearning.AI
«
Если размер мини-пакета равен размеру всей выборки, вы просто возвращаетесь к пакетному градиентному спуску.
02:14 · Как Mini-batch Gradient Descent ускоряет обучение нейросетей в тысячи раз
«
Ваш код может работать быстрее, если размер мини-пакета является степенью двойки.
09:11 · Как Mini-batch Gradient Descent ускоряет обучение нейросетей в тысячи раз
«
Для многих задач вы можете использовать open-source реализацию с GitHub и вместо кода сфокусироваться на оптимизации данных.
07:24 · Эндрю Ын об MLOps: почему «чистые» данные важнее идеального кода
«
Вместо того чтобы просто собирать всё больше и больше данных, анализ ошибок поможет вам действовать более целенаправленно.
08:21 · Эндрю Ын об MLOps: почему «чистые» данные важнее идеального кода
«
В многозадачном обучении вы одновременно заставляете одну нейросеть делать несколько вещей сразу.
0:05 · Эндрю Ын: «Обучение одной сети нескольким задачам дает лучший результат в компьютерном зрении»
«
Единственный случай, когда многозадачность вредит производительности — если ваша нейросеть недостаточно велика.
10:14 · Эндрю Ын: «Обучение одной сети нескольким задачам дает лучший результат в компьютерном зрении»
«
На практике я вижу, что Transfer Learning используется гораздо чаще, чем Multitask Learning.
11:34 · Эндрю Ын: «Обучение одной сети нескольким задачам дает лучший результат в компьютерном зрении»
«
Softmax-регрессия — это обобщение логистической регрессии на более чем два класса.
01:47 · Обучение классификатора Softmax: математика потерь и градиентный спуск
«
Название Softmax происходит от контраста с так называемым Hardmax, который ставит 1 на место самого большого элемента и 0 на остальные.
00:52 · Обучение классификатора Softmax: математика потерь и градиентный спуск
«
Функция стоимости дает вам способ измерить, насколько хорошо определенный набор параметров соответствует обучающим данным.
00:01 · Математика классификации: как логарифмические потери спасают градиентный спуск
«
Для логистической регрессии эта функция стоимости на основе квадратичной ошибки не является хорошим выбором.
02:46 · Математика классификации: как логарифмические потери спасают градиентный спуск
«
Один из инструментов отладки, который я часто использую для проверки корректности кода — это лист бумаги, на котором я просто просчитываю размерности матриц.
Эндрю Ын: «Лист бумаги — лучший инструмент отладки размерностей нейросетей»
«
Если вы будете следить за тем, чтобы размерности всех матриц были согласованы, это поможет вам устранить целый класс возможных багов.
10:37 · Эндрю Ын: «Лист бумаги — лучший инструмент отладки размерностей нейросетей»
«
Ортогонализация относится к тому, что дизайнеры телевизоров проектировали ручки так, чтобы каждая выполняла только одну функцию.
1:51 · Эндрю Ын: «Ортогонализация — секрет эффективной настройки нейросетей»
«
Я лично считаю раннюю остановку сложной для понимания, потому что это ручка, которая одновременно влияет на качество обучения и обобщающую способность.
9:05 · Эндрю Ын: «Ортогонализация — секрет эффективной настройки нейросетей»
«
Когда у вас мало данных, ручное проектирование — это лучший способ добиться хорошей производительности.
02:44 · Эндрю Ын о состоянии Computer Vision: от ручного проектирования к Transfer Learning
«
Ансамблирование — это один из тех советов, которые люди используют для победы в соревнованиях, но который почти никогда не используется в продакшене.
08:29 · Эндрю Ын о состоянии Computer Vision: от ручного проектирования к Transfer Learning
«
Лучший способ развернуть систему — это не просто включить её и надеяться на лучшее.
От Shadow Mode до полной автоматизации: как правильно внедрять ML-модели
«
Я нахожу, что частичная автоматизация иногда является очень хорошим проектным решением для приложений, где производительность алгоритма недостаточно хороша для полной автоматизации.
09:40 · От Shadow Mode до полной автоматизации: как правильно внедрять ML-модели
«
Интуитивно вы можете думать о ранних слоях нейронной сети как о детектировании простых функций, таких как края, а затем об их композиции в последующих слоях.
2:00 · Эндрю Ын: «Термин „глубокое обучение“ — это во многом удачный брендинг»
«
Аналогии между глубоким обучением и человеческим мозгом иногда немного опасны, но в этом много правды.
5:05 · Эндрю Ын: «Термин „глубокое обучение“ — это во многом удачный брендинг»
«
Я думаю, что фраза «глубокое обучение» — это просто отличный бренд. Она звучит так глубоко!
9:17 · Эндрю Ын: «Термин „глубокое обучение“ — это во многом удачный брендинг»
«
В машинном обучении термин 'bias' (смещение) имеет второе техническое значение: если алгоритм недообучен, он не способен уловить явную закономерность в данных.
02:40 · Баланс между смещением и дисперсией: как найти идеальную модель машинного обучения
«
Переобучение означает, что модель подогнана под данные почти слишком хорошо, и она не будет обобщаться на новые примеры.
05:50 · Баланс между смещением и дисперсией: как найти идеальную модель машинного обучения
«
TensorFlow уже имеет встроенные необходимые обратные функции. Вот почему, используя встроенные функции для вычисления прямой функции, он может автоматически выполнять и обратные функции.
13:30 · Эндрю Нг о TensorFlow: «Вам больше не нужно реализовывать backprop вручную»
«
Всё, что вам нужно сделать, это указать, как рассчитать функцию стоимости, а затем он берет производные и может применить оптимизатор градиента всего одной или двумя строками кода.
10:32 · Эндрю Нг о TensorFlow: «Вам больше не нужно реализовывать backprop вручную»
«
Сквозное глубокое обучение позволяет взять множество этапов обработки и заменить их одной нейронной сетью.
0:14 · Эндрю Ын: «Сквозное обучение — это не панацея, всё решают данные»
«
Это не панацея, оно работает не всегда.
11:23 · Эндрю Ын: «Сквозное обучение — это не панацея, всё решают данные»
«
Многие инженеры считают, что развертывание модели машинного обучения — это финишная черта. К сожалению, первый деплой означает, что вы прошли лишь половину пути.
12:44 · Эндрю Ын: «Первый деплой модели — это лишь середина пути»
«
Концептуальный дрейф — это когда меняется само определение того, что мы хотим получить на выходе при заданных входных данных.
05:47 · Эндрю Ын: «Первый деплой модели — это лишь середина пути»
«
Этот простой процесс подсчета — анализ ошибок — может сэкономить вам массу времени при выборе наиболее перспективного направления.
04:13 · Как приоритизировать задачи в ML: метод «потолка» от Эндрю Ына
«
Анализ ошибок дает вам 'потолок' производительности — лучшее, на что вы можете надеяться, решив конкретную проблему.
03:05 · Как приоритизировать задачи в ML: метод «потолка» от Эндрю Ына
«
Мы собираемся определить стиль как корреляцию между активациями в разных каналах этого слоя.
00:33 · Эндрю Ын: «Стиль изображения — это корреляция между признаками нейросети»
«
Корреляция говорит вам, какие из этих компонентов текстуры высокого уровня имеют тенденцию возникать или не возникать вместе в части изображения.
03:24 · Эндрю Ын: «Стиль изображения — это корреляция между признаками нейросети»
«
Алгоритмы глубокого обучения достаточно устойчивы к случайным ошибкам в обучающем наборе, но менее устойчивы к систематическим.
2:15 · Эндрю Ын о «грязных» данных: стоит ли исправлять ошибки в разметке?
«
Если вы не можете доверять своему проверочному набору в оценке того, какой классификатор лучше, это веский повод исправить метки.
7:55 · Эндрю Ын о «грязных» данных: стоит ли исправлять ошибки в разметке?
«
Несколько часов ручного подсчета данных могут реально помочь вам расставить приоритеты — это отличное использование вашего времени.
12:35 · Эндрю Ын о «грязных» данных: стоит ли исправлять ошибки в разметке?
«
Если ваша метрика оценки больше не ранжирует предпочтения между алгоритмами правильно... это знак, что вам следует сменить метрику или проверочный набор.
01:59 · Эндрю Ын: «Если метрика не работает, смените её»
«
Думайте об определении метрики как о первом шаге, и вы делаете что-то другое для шага номер два (оптимизации).
07:02 · Эндрю Ын: «Если метрика не работает, смените её»
«
Даже если вы не можете определить идеальную метрику, просто настройте что-то быстро и используйте это для ускорения итераций вашей команды.
10:20 · Эндрю Ын: «Если метрика не работает, смените её»
«
Навигационные запросы в этом контексте — это непропорционально важный набор примеров.
02:12 · Эндрю Ын: «Ваша задача — решать проблему бизнеса, а не просто показывать точность на тестах»
«
Я считаю своей работой не просто хорошо выступить на тестовом наборе, а создать систему машинного обучения, которая решает реальную бизнес-задачу.
10:13 · Эндрю Ын: «Ваша задача — решать проблему бизнеса, а не просто показывать точность на тестах»
«
Потому что вы изменили две вещи одновременно, трудно понять, какая часть увеличения ошибки вызвана тем, что алгоритм не видел данные, а какая — различием в самих данных.
01:47 · Эндрю Ын: «Несоответствие данных — третья большая проблема после смещения и дисперсии»
«
Буду честен: не существует очень систематических способов борьбы с несоответствием данных.
17:29 · Эндрю Ын: «Несоответствие данных — третья большая проблема после смещения и дисперсии»
«
Фонемы — это фантазия языка, созданная людьми-лингвистами. Это разумное описание, но не очевидно, что стоит заставлять алгоритм думать ими.
01:07 · Сквозное обучение нейросетей: когда данные побеждают человеческий опыт
«
Сквозное обучение позволяет данным говорить самим за себя.
00:12 · Сквозное обучение нейросетей: когда данные побеждают человеческий опыт
«
Ручное проектирование компонентов — это способ впрыснуть человеческие знания в алгоритм.
03:19 · Сквозное обучение нейросетей: когда данные побеждают человеческий опыт
«
Я призываю вас относиться к развертыванию как к итеративному процессу.
05:45 · Эндрю Ын: «Развертывание модели — это не конец, а начало итерации»
«
Сегодня ручное переобучение встречается гораздо чаще, чем автоматическое. Разработчики не решаются позволить алгоритму полностью автоматически принимать решение о выпуске новой модели в продакшн.
09:08 · Эндрю Ын: «Развертывание модели — это не конец, а начало итерации»
«
Проверочная выборка указывает вашей команде, куда целиться. Если в ней данные не из того распределения, вы оптимизируете систему не под ту задачу.
04:35 · Эндрю Ын: «Не перемешивайте данные из разных источников в одну кучу»
«
В эпоху глубокого обучения все больше команд тренируют модели на данных, чье распределение отличается от проверочных и тестовых сетов.
00:24 · Эндрю Ын: «Не перемешивайте данные из разных источников в одну кучу»
«
Для человеческого уха один час шума может звучать так же, как любой другой, но есть риск, что алгоритм переобучится на этот конкретный час.
06:19 · Эндрю Ын: Как решать проблему рассогласования данных и не попасть в ловушку синтеза
«
Сложность синтеза данных в том, что на ваш слух 10 000 часов могут звучать одинаково, но вы можете создать обедненный набор данных.
06:59 · Эндрю Ын: Как решать проблему рассогласования данных и не попасть в ловушку синтеза
«
Человеческий уровень производительности является прокси-метрикой для ошибки Байеса.
01:33 · Эндрю Ын: «Точное определение человеческого уровня критично для успеха ML-проекта»
«
Прогресс в проектах машинного обучения замедляется, как только вы достигаете человеческого уровня.
07:22 · Эндрю Ын: «Точное определение человеческого уровня критично для успеха ML-проекта»
«
Перемножение множества чисел меньше единицы приводит к крошечному результату, который компьютер не может хранить точно.
01:26 · Эндрю Ын: «Beam Search — это компромисс между качеством перевода и вычислительными затратами»
«
Использование параметра альфа — это эвристика или «хак», у него нет строгого теоретического обоснования, но это хорошо работает на практике.
05:37 · Эндрю Ын: «Beam Search — это компромисс между качеством перевода и вычислительными затратами»
«
Для многих приложений я ожидаю огромный скачок качества при переходе от ширины луча 1 к 10, но прогресс от 1000 до 3000 может быть уже не таким заметным.
09:24 · Эндрю Ын: «Beam Search — это компромисс между качеством перевода и вычислительными затратами»
«
Вы не сможете лидировать в ИИ, будучи лидером в принятии правил, замедляющих ИИ.
08:11 · Эндрю Ын и Мириам Фогель: Как выстроить доверие к ИИ через управление, а не запреты
«
Если цена поиска двух отличных идей для масштабирования — это создание 18 других вещей, которые умрут тихой смертью, это нормально.
03:26 · Эндрю Нг о будущем разработки: «Возможности ИИ в кодинге удваиваются каждые 70 дней»
«
Наши технологические компании провели массированную PR-кампанию, убеждая людей не доверять ИИ и сравнивая его с ядерным оружием. Это было прискорбно.
07:37 · Эндрю Нг о будущем разработки: «Возможности ИИ в кодинге удваиваются каждые 70 дней»
«
Вершина небоскреба приближает вас к Луне, но строительство высоких зданий — это не всё, что нужно, чтобы на ней оказаться.
29:02 · Эндрю Ын: «ИИ сегодня — это эра хороших данных, а не только больших»
«
Вместо одного приложения на миллиард долларов у вас может быть десять тысяч приложений ценой от одного до пяти миллионов.
07:06 · Эндрю Ын: «ИИ сегодня — это эра хороших данных, а не только больших»
«
Я думаю, что мы сможем построить гораздо более богатое общество, если позволим каждому помочь писать будущее.
00:51 · Как Эндрю Ын предлагает передать ИИ малому бизнесу
«
Вопреки хайпу, ИИ часто может отлично работать даже на скромных объемах данных.
03:11 · Как Эндрю Ын предлагает передать ИИ малому бизнесу
«
Сегодня ИИ находится в руках верховных жрецов и жриц — это высококвалифицированные инженеры, многие из которых работают в крупных технологических компаниях.
0:39 · Эндрю Ын о демократизации ИИ: как превратить технологии в инструмент для каждого бизнеса
«
Мы сможем построить гораздо более богатое общество, если позволим каждому участвовать в написании будущего.
0:51 · Эндрю Ын о демократизации ИИ: как превратить технологии в инструмент для каждого бизнеса
«
AI is the new electricity.
0:26 · Эндрю Ын: «Агентный ИИ — главная возможность для разработчиков»
«
Move fast and be responsible.
6:04 · Эндрю Ын: «Агентный ИИ — главная возможность для разработчиков»
«
Я думаю, что ИИ — это новое электричество.
0:52 · Эндрю Ын: «Искусственный интеллект — это новое электричество»
«
Вы сможете с уверенностью внести глубокое обучение в свое резюме.
0:37 · Эндрю Ын: «Искусственный интеллект — это новое электричество»