Рейтинг: 0.806  
Новая
Предложил Нечипоренко Тимофей 23.11.2016 19:05:33

Добавить функционал разложения голоса в текст с последующем логированием и индексацией

Уважаемый разработчики!

В контексте активного развития телефонии и появления функции визит-трекера предлагаю реализовать очень важную доработку по разложению голосового трафика в текст с последующим логинованием, хранением и индексацией (лучше вести сохранение по аналогии листинга дилогов whatsapp, viber, telegram и т.п. - это уже всем привычно и удобно).

Такая реализация даст море возможностей, основными из которых можно выделить:
1) Учёт и контроль качества работы персонала (длинную встречу или телефонный разговор не всегда будут слушать полностью, а пробежаться по тексту, разложенному в диалог как в мессенджере - в разы быстрее и эффективнее);
2) Мониторинг качества работы (поиск по ключевым словам) и фильтрация по ключевым словам (упомянуто ли про скидки, доставку, были ли нецензурные выражения, с чьей стороны и по какой причине, формат общения менеджера и т.п.);
3) Поиск по диалогам. Бегло прослушивать часы и сутки диалогов менеджеров с клиентами по телефону нереально, а найти по ключевому слову то, что, с кем и когда обсуждалось и какие были договорённости и сделать это за мгновение через поиск - просто бесценно.
4) Возможность выставления триггеров (настройки фонового функционала робота CRM) на слова и словоформы "откат", "благодарность" и т.п. и автоматический учёт таких диалогов с оповещением руководства, аналогично для случаев, когда при первичном общении должны быть упомянуты конкретные слова (про доставку, скидку и т.п.).

Для качественного разложения звука в текст параллельно вести запись входящего и исходящего голосового трафика для каждого из диалогов (звонков), что снимет проблему наслоения звуковых дорожек плохого качества распознания. Современные технологии обработки голоса (google, яндекс спич, API речевого ассистента Дуси и т.п.) уже могут очень качественно распознавать голос даже при фоновом шуме, дефектах речи и т.п.

Забегая немного вперед: на диалогах с клиентам (звуковых дорожках) можно научить нейронную сеть распознавать голос конкретного абонента и прикреплять диалог к лиду (сделке, компании) на основании распознания голоса после завершения звонка (даже если звонок был с городского телефона, другого сотового и т.п.).