Учёные Национального исследовательского университета «Высшая школа экономики» в Санкт-Петербурге разработали уникальную базу данных, которая поможет языковым моделям лучше ориентироваться в эмоциональной сфере человека.
Этот «словарь эмоций» основан на анализе эмоциональной речи и включает почти три часа видеофрагментов с расшифровками, посвящёнными базовым чувствам — от радости и удивления до страха и грусти.
В рамках исследования специалисты опровергли распространённый миф о том, что люди способны точно считывать эмоции друг друга исключительно по интонации речи. Результаты показали, что более достоверное восприятие аффективного состояния достигается при комплексном подходе: чтении текста и просмотре видео со звуком. Это значит, что для обучения нейросетей важно учитывать не только голосовые особенности, но и визуальные и текстовые контексты.
Созданный датасет уже применяется в различных практических проектах. Например, на его основе разрабатывается эмпатичный чат-бот для Государственного Эрмитажа, который сможет более чутко реагировать на посетителей и помогать им в общении. Также учёные из Владимиро-Суздальского музея-заповедника используют эту базу для анализа отзывов посетителей, что позволяет лучше понимать их эмоциональное восприятие экспозиций и улучшать качество обслуживания.
Служба информации Copyright.ru