Использование больших языковых моделей (LLM) для имитации человеческого поведения открывает захватывающие перспективы для социальных наук, но одновременно несет в себе риски повторения «кризиса воспроизводимости». Аарон Шоу, доцент Северо-Западного университета, в рамках семинара в Стэнфорде представляет методологию стресс-тестирования таких симуляций, чтобы сделать их более надежными и научно обоснованными.
🤖 Новая эра «цифровых людей»: зачем симулировать общество? 0:09
В течение последних десятилетий социальные ученые рассматривали платформы краудсорсинга, такие как Mechanical Turk, как основной источник данных для изучения поведения людей. Однако с появлением генеративного ИИ ситуация радикально изменилась. Аарон Шоу отмечает, что исследователи переходят от изучения живых выборок к попы