Сергей Брин, сооснователь Google, делится экспертным взглядом на фундаментальные основы создания поисковых систем. В коротком интервью для образовательного курса Udacity «Intro to Programming» он объясняет, что успех любого поискового сервиса начинается не с алгоритмов, а с выбора правильного массива данных для индексации.
🔍 Фундамент поисковой системы 0:00
По мнению Сергея Брина, самым важным аспектом при создании поисковой системы является наличие качественного и обширного корпуса данных (corpus) для старта. Без глубокого и интересного массива информации поисковик не сможет обеспечить ценный пользовательский опыт, даже при наличии технически совершенных инструментов поиска.
При разработке Google команда Брина в качестве такого корпуса использовала «всемирную паутину» (World Wide Web). Брин отмечает, что на тот момент интернет был значительно меньше, чем сегодня, однако он представлял собой принципиально новую и захватывающую среду, наполненную множеством неожиданных и уникальных данных.
💡 Выбор данных для разработки 0:26
Сергей Брин подчеркивает, что сегодня разработчикам доступно огромное количество других интересных массивов информации, которые могут стать основой для специализированных поисковых сервисов. В качестве примеров перспективных направлений для индексации он приводит:
- Корпуса оцифрованных книг.
- Личные данные пользователей, например, электронную почту (при условии обеспечения конфиденциальности).
Ключевой совет сооснователя Google заключается в том, что разработчик должен выбрать тот набор данных, который искренне его вдохновляет. Брин считает, что личная заинтересованность в исследуемой области — необходимый фактор, так как поиск должен быть полезен и интересен прежде всего самому создателю сервиса.