Перевод аудиофайлов в текст при помощи Google Translate
Разработчики сервиса Google Translate добавили к нему возможность распознавания голоса в реальном времени. Новую функцию можно использовать не только для перевода с других языков, но и для транскрибации звуковых файлов в текстовый формат.
Расшифровка звука в письменную форму пригодится студентам, которые записывают лекции на диктофон, блогерам, журналистам, а также онлайн-коучам. Раньше Google Translate воспринимал только четкую диктовку коротких фраз, и не мог помочь для перевода или транскрибации живой человеческой речи. Теперь усовершенствованная система искусственного интеллекта от Гугл способна грамотно воспринимать разговор на нескольких языках. Сервис может адекватно расшифровывать не только простую речь, но и активные дискуссии, тексты песен или аудиодорожки из фильмов.
Чтобы использовать синхронный переводчик онлайн с голоса для распознавания текста из аудио- и видеофайлов, нужно:
- запустить Google Translate;
- выбрать в качестве определяемого и итогового языка русский;
- включить перевода речи в реальном времени;
- запустить в плеере или браузере нужный медиафайл, или поднести к микрофону устройства колонки, либо смартфон со звуком.
Если вы не желаете говорить сами, возможно у Вас нет микрофона или вы находитесь в помещении не один, то протестировать работу переводчика можно с помощью программного синтезатора речи, просто введите текст и сервис озвучит его. Полученный файл можно скачать и затем протестировать работу гугл переводчика.
По мере звучания записи в окне переводчика будет появляться текстовая информация, которую останется только отредактировать, подправив пунктуацию и ошибки распознавания. Чтобы повысить качество транскрибации, рекомендуется работать со звуковыми файлами в тихом помещении без посторонних шумов и голосов. Точность распознавания высокая и на глаз составляет 85-97%
Функция доступна и на странице сервиса в мобильном приложении Google Translate, при этом версия для смартфонов позволяет изменять размер получаемого текста, а также устанавливать темную тему.
Синхронный переводчик Гугл за один прием может распознать не более 5000 символов, поэтому для работы с большими файлами требуется периодически останавливать запись и запускать новую сессию.
Система преобразования речи в текст в режиме реального времени еще не совершенна – при наличии нескольких одновременно говорящих голосов или посторонних шумов сервис может допускать ошибки, но искусственный интеллект постоянно совершенствуется. Возможно, в скором времени система сможет полностью заменить профессиональных транскрибаторов или переводчиков-синхронистов.
Тогда можно поддержать её лайком в соцсетях. На новости сайта вы ведь уже подписались? ;)
Или хотя бы оставить довольный комментарий, чтобы мы знали, какие темы наиболее интересны читателям. Кроме того, нас это вдохновляет. Форма комментариев ниже.
Что с ней так? Своё негодование вы можете высказать в комментариях. Мы постараемся учесть ваше пожелание в будущем, чтобы улучшить качество материалов сайта. А сейчас проведём воспитательную работу с автором.
Если вам интересны новости мира ИТ так же сильно, как нам, подписывайтесь на Telegram-канал. Там все материалы появляются максимально оперативно. Или, может быть, удобнее "Вконтакте"?
Поговорить?
Читайте нас где удобно
Для тех, кто долистал
Ай-ти шуточка бонусом.
Пользователя Android легко узнать по рюкзаку с аккумулятором за спиной.
Уже наговорили: