Эмоции можно выразить разными способами, однако наибольший практический интерес представляет распознавание эмоционального состояния по выражению лица, поскольку изображения лиц легко получать и анализировать.
Системы распознавания работают по следующему алгоритму:
Предобработка изображений проводится для устранения недостатка сведений выражений лица, межклассовых сходств и внутриклассовых различий, небольших внешних изменений и освещенности. Стандартно предобработка состоит из четырех этапов: нахождение области лица, ее обрезка и масштабирование, выравнивание лица и коррекция контраста.
После предобработки из изображения извлекаются визуальные признаки путем обнаружения элементов, которые содержат наибольшее количество информации для дальнейшей обработки. По выполняемым функциям выделяют методы:
Последняя стадия распознавания эмоций — классификация выделенных признаков. Методы машинной классификации подразделяются на:
Наиболее перспективны для решения задачи распознавания эмоций CNN и RNN. В основе CNN лежит операция свертки, а в основе RNN – рекуррентный LSTM-нейрон. RNN содержат обратные связи внутри и между слоями, что позволяет учитывать результаты предыдущих итераций при анализе текущего набора данных. Эта особенность делает их оптимальным инструментом для обработки видеопотока.
Для обработки статичных изображений больше подходят CNN, обладающие сверточными слоями, каждый нейрон в которых соединен с ограниченным числом нейронов предыдущего слоя. В результате слой превращается в совокупность фильтров с несколькими параметрами, что позволяет обеспечить высокую точность распознавания эмоций на изображении даже при его значительных искажениях. Научиться обучать нейронные сети для распознавания эмоций можно на курсах профессиональной переподготовки.