Почему разработчики мессенджеров никак не добавят функцию распознавания голоса?

Пользователей смартфонов можно разделить на две части: те кто любят записывать голосовые сообщения и тех, кто жутко ненавидит их слушать.

комментирует:
Ваге Закарян
IT эксперт

24.05.2021

Новости 📑

Артём Мацун

Комментарии

Первые утверждают, что при записи текста живым голосом можно лучше объяснить всю суть своего сообщения, используя эмоции и паузы.

Почему разработчики мессенджеров никак не добавят функцию распознавания голоса?

Другие ненавидят такой формат общения, ведь в голосовом сообщении сложно найти нужную информацию, на прослушивание записи потребуется больше времени, а еще не всегда есть возможность слушать сообщение (например, в общественном месте).

Однако разработчики мессенджеров могли бы с лёгкостью удовлетворить потребности и тех и других пользователей, ведь необходимые технологии перевода устной речи в письменную уже давно изобретены. Почему их до сих пор активно не используют? Комментирует эксперт нашего издания, Ваге Закарян:

Расшифровка аудиозаписей — давно уже не мечта, а работающий сервис, и на рынке их сейчас несколько. Самый известный — Google Speech-to-Text, воспользоваться им может любой человек или организация. Но, разумеется, не бесплатно.Расшифровка каждых 15 секунд речи обойдется в сумму от 0.004 до 0.009 доллара. Деньги нужны, чтобы постоянно расширять библиотеку распознанной речи и делать сервис более совершенным.

Понятно, что столь дорогая разработка по плечу только гигантам, но, в принципе, разработчики из любых мессенджеров могут добавить функционал расшифровки аудиосообщений, просто подключившись к тому же Text-to-Speech. Это несложно, проблема в другом: за сервис придется платить, и довольно-таки недешево.

Я думаю, по мере развития технологии и наработки базы сервис будет становиться дешевле и в конце концов появится в каждом мессенджере, но в какой срок это случится — никто не скажет точно.

— руководитель команды разработки мессенджера Gem4me Ваге Закарян

Вам понравилась статья?