Speechmatics распознает любые акценты и диалекты
Компания из Великобритании Speechmatics представила свою новую разработку – ПО Autonomous Speech Recognition (ASR), позволяющее автоматически распознавать голоса с высокой точностью. Сообщается, что ASR намного эффективнее технологий, используемых Amazon, Apple, Google и Microsoft.
Так, например, число ошибок, часто возникающих при распознавании афро-американских голосов, ниже в среднем на 45%. Для Google и Amazon точность составляет 68,6%; в Speechmatics утверждают, что их программа безошибочна на 82,8%. Сложности также возникают при распознавании голосов детей; здесь ASR также лидирует (91,8% против 83,4% Google и 82,3% Deepgram). Принципиальное отличие новой разработки – в использовании для машинного обучения данных прямо из Интернета, например, контента социальных сетей и подкастов. Это обеспечивает более полное представление всех голосов и значительно снижает предвзятость искусственного интеллекта и количество ошибок.
Speechmatics предлагает бесплатные пробные версии своего программного обеспечения и готова поддержать компании и разработчиков, заинтересованных в её исследованиях.
Комментарии