Синхронное распознавание аудиофайлов

Синхронное распознавание аудиофайлов отличается высокой скоростью ответа и подходит для предзаписанных одноканальных аудиофайлов небольшого размера.

Если вы хотите распознавать речь в рамках одного соединения, используйте потоковый режим. В потоковом режиме вы сможете получать промежуточные результаты распознавания.

Требования к аудио

Передаваемое аудио должно соответствовать требованиям:

Максимальный размер файла — 1 МБ.
Максимальная длительность — 30 секунд.
Максимальное количество аудиоканалов — 1.

Если ваш файл больше, длиннее или у него больше аудиоканалов, используйте асинхронное распознавание.

SpeechKit позволяет распознавать аудио в форматах:

LPCM
OggOpus

Подробнее об особенностях каждого формата смотрите в разделе Поддерживаемые форматы аудио.

Примеры использования

Пример использования API v1 синхронного распознавания

Полезные ссылки

API синхронного распознавания

Была ли статья полезна?

Предыдущая

Потоковое распознавание

Следующая

Асинхронное распознавание