Всё о секретах программного обеспечения и онлайновых сервисов
Яндекс.Метрика

Автоматическая текстовая расшифровка аудиофайлов с помощью облачного сервиса 3i Speech Recognition

Консорциум 3i Technologies, в состав которого входят компании DSS Lab, InfoQubes и PROMT, сообщил о запуске облачного сервиса 3i Speech Recognition, предназначенного для профессиональной обработки речевых данных из медийного канала и телефонии на русском и английском языках. По заверениям разработчиков, новое решение позволяет с точностью более 90% переводить аудиофайлы в текстовый формат.

Функциональные возможности 3i Speech Recognition обеспечивают преобразование речи в текст с автоматической простановкой знаков препинания (транскрибация), разделение диалогов по дикторам (диаризация), определение пола человека по голосу, шумов и пауз. В сервисе задействованы языковые и акустические модели, построенные с применением машинного обучения и технологий RNN и WFST — рекуррентных нейронных сетей (Recurrent Neural Network) и взвешенных конечных автоматов (Weighted Finite State Transducer).

3i Speech Recognition позволяет работать с записями ТВ и радиоэфиров, материалами продакшн-студий, обращениями в контакт-центры и т.д. Сервис даёт возможность загружать в персонализированное облачное хранилище до 18 часов аудиоинформации, обрабатывая её в несколько раз быстрее реального времени звучания. По результатам обработки система выдаёт «стройный» текст, разбитый на предложения с расставленными знаками препинания. При прослушивании исходного материала, сервис автоматически «подсвечивает» произносимый фрагмент в текстовом блоке.

Автоматическая текстовая расшифровка аудиофайлов с помощью облачного сервиса 3i Speech Recognition

«Сервис ориентирован на специалистов, работающих с голосовой информацией. Например, он будет полезен службам контроля качества в контакт-центрах или консультантам, создающим сценарии телемаркетинговых акций. А также подразделениям телеканалов, которые занимаются расшифровкой телеэфиров. 3i Speech Recognition отличают высокая точность распознавания речи, автоматическая расстановка знаков препинания, удобный редакторский интерфейс и возможность интеграции с наиболее распространёнными программными платформами автоматизации совместной деятельности рабочих групп», — говорит председатель совета директоров консорциума 3i Technologies Алексей Любимов.

Получить дополнительную информацию об облачном сервисе 3i Speech Recognition можно на сайте dev.3i-analytics.ru/speech-recognition/description.

Источник: пресс-служба консорциума 3i Technologies

См. также: автоматическая текстовая расшифровка аудиофайлов с помощью Windows-приложения Voco.