ВХОД НА САЙТ

Видеомикшер RGBLink Mini - находка для стримеров, журналистов и блогеров

Видеообзор. Компактный видеомикшер, обладающий достаточно скромной ценой и совсем нескромными...

Видеообзор Logitech Rally

В 2020 году видеоконференции стали основным форматом общения, и если нужно подготовить для этого...

Видеообзор креплений Wize

Крепления для видеостен от компании Wize позволяют обеспечить баланс качества и цены. Wize – это...

Speechmatics распознает любые акценты и диалекты


02.11.2021 08:00

 

 

Компания из Великобритании Speechmatics представила свою новую разработку – ПО Autonomous Speech Recognition (ASR), позволяющее автоматически распознавать голоса с высокой точностью. Сообщается, что ASR намного эффективнее технологий, используемых Amazon, Apple, Google и Microsoft.

 

Так, например, число ошибок, часто возникающих при распознавании афро-американских голосов, ниже в среднем на 45%. Для Google и Amazon точность составляет 68,6%; в Speechmatics утверждают, что их программа безошибочна на 82,8%. Сложности также возникают при распознавании голосов детей; здесь ASR также лидирует (91,8% против 83,4% Google и 82,3% Deepgram). Принципиальное отличие новой разработки – в использовании для машинного обучения данных прямо из Интернета, например, контента социальных сетей и подкастов. Это обеспечивает более полное представление всех голосов и значительно снижает предвзятость искусственного интеллекта и количество ошибок.

 

Speechmatics предлагает бесплатные пробные версии своего программного обеспечения и готова поддержать компании и разработчиков, заинтересованных в её исследованиях.


Комментарии