Перевод аудиофайлов в текст при помощи Google Translate

22.02.2021 Все публикации сайта Время чтения: ~ 2 минуты

Разработчики сервиса Google Translate добавили к нему возможность распознавания голоса в реальном времени. Новую функцию можно использовать не только для перевода с других языков, но и для транскрибации звуковых файлов в текстовый формат.

Расшифровка звука в письменную форму пригодится студентам, которые записывают лекции на диктофон, блогерам, журналистам, а также онлайн-коучам. Раньше Google Translate воспринимал только четкую диктовку коротких фраз, и не мог помочь для перевода или транскрибации живой человеческой речи. Теперь усовершенствованная система искусственного интеллекта от Гугл способна грамотно воспринимать разговор на нескольких языках. Сервис может адекватно расшифровывать не только простую речь, но и активные дискуссии, тексты песен или аудиодорожки из фильмов.

Чтобы использовать синхронный переводчик онлайн с голоса для распознавания текста из аудио- и видеофайлов, нужно:

запустить Google Translate;
выбрать в качестве определяемого и итогового языка русский;
включить перевода речи в реальном времени;
запустить в плеере или браузере нужный медиафайл, или поднести к микрофону устройства колонки, либо смартфон со звуком.

Если вы не желаете говорить сами, возможно у Вас нет микрофона или вы находитесь в помещении не один, то протестировать работу переводчика можно с помощью программного синтезатора речи, просто введите текст и сервис озвучит его. Полученный файл можно скачать и затем протестировать работу гугл переводчика.

По мере звучания записи в окне переводчика будет появляться текстовая информация, которую останется только отредактировать, подправив пунктуацию и ошибки распознавания. Чтобы повысить качество транскрибации, рекомендуется работать со звуковыми файлами в тихом помещении без посторонних шумов и голосов. Точность распознавания высокая и на глаз составляет 85-97%

Функция доступна и на странице сервиса в мобильном приложении Google Translate, при этом версия для смартфонов позволяет изменять размер получаемого текста, а также устанавливать темную тему.

Синхронный переводчик Гугл за один прием может распознать не более 5000 символов, поэтому для работы с большими файлами требуется периодически останавливать запись и запускать новую сессию.

Система преобразования речи в текст в режиме реального времени еще не совершенна – при наличии нескольких одновременно говорящих голосов или посторонних шумов сервис может допускать ошибки, но искусственный интеллект постоянно совершенствуется. Возможно, в скором времени система сможет полностью заменить профессиональных транскрибаторов или переводчиков-синхронистов.

Новости СМИ2

Автор: Mirandoid

Поговорить?

Уже наговорили:

Елена:

Ответить #

Вот еще отличный вариант - https://voicebot.su. Это удобный онлайн-синтезатор речи, который подойдет для преобразования любого текста в аудиодорожку. Можно даже озвучивать текст на нескольких языках.