Перевод аудиофайлов в текст при помощи Google Translate

Разработчики сервиса Google Translate добавили к нему возможность распознавания голоса в реальном времени. Новую функцию можно использовать не только для перевода с других языков, но и для транскрибации звуковых файлов в текстовый формат.

Перевод аудиофайлов в текст при помощи Google Translate

Расшифровка звука в письменную форму пригодится студентам, которые записывают лекции на диктофон, блогерам, журналистам, а также онлайн-коучам. Раньше Google Translate воспринимал только четкую диктовку коротких фраз, и не мог помочь для перевода или транскрибации живой человеческой речи. Теперь усовершенствованная система искусственного интеллекта от Гугл способна грамотно воспринимать разговор на нескольких языках. Сервис может адекватно расшифровывать не только простую речь, но и активные дискуссии, тексты песен или аудиодорожки из фильмов.

Чтобы использовать синхронный переводчик онлайн с голоса для распознавания текста из аудио- и видеофайлов, нужно:

  1. запустить Google Translate;
  2. выбрать в качестве определяемого и итогового языка русский;
  3. включить перевода речи в реальном времени;
  4. запустить в плеере или браузере нужный медиафайл, или поднести к микрофону устройства колонки, либо смартфон со звуком.

Если вы не желаете говорить сами, возможно у Вас нет микрофона или вы находитесь в помещении не один, то протестировать работу переводчика можно с помощью программного синтезатора речи, просто введите текст и сервис озвучит его. Полученный файл можно скачать и затем протестировать работу гугл переводчика.

По мере звучания записи в окне переводчика будет появляться текстовая информация, которую останется только отредактировать, подправив пунктуацию и ошибки распознавания. Чтобы повысить качество транскрибации, рекомендуется работать со звуковыми файлами в тихом помещении без посторонних шумов и голосов. Точность распознавания высокая и на глаз составляет 85-97%

Функция доступна и на странице сервиса в мобильном приложении Google Translate, при этом версия для смартфонов позволяет изменять размер получаемого текста, а также устанавливать темную тему.

Синхронный переводчик Гугл за один прием может распознать не более 5000 символов, поэтому для работы с большими файлами требуется периодически останавливать запись и запускать новую сессию.

Система преобразования речи в текст в режиме реального времени еще не совершенна – при наличии нескольких одновременно говорящих голосов или посторонних шумов сервис может допускать ошибки, но искусственный интеллект постоянно совершенствуется. Возможно, в скором времени система сможет полностью заменить профессиональных транскрибаторов или переводчиков-синхронистов.

Если вам интересны новости мира ИТ также сильно, как нам, подписывайтесь на наш Telegram-канал. Там все материалы появляются максимально оперативно. Или, может быть, вам удобнее "Вконтакте" или Twitter? Мы есть также в Яндекс.Дзене и даже Facebook.

Фото автораАвтор: Mirandoid

Поговорить?

Читайте нас где удобно

Ещё на эту тему было

Для тех, кто долистал

Ай-ти шуточка бонусом. Android - это ОС будущего, для которой ещё не разработали достойного процессора и аккумулятора.