Синхронное распознавание аудиофайлов

Синхронное распознавание аудиофайлов отличается высокой скоростью ответа и подходит для предзаписанных одноканальных аудиофайлов небольшого размера.

Если вы хотите распознавать речь в рамках одного соединения, используйте потоковый режим. В потоковом режиме вы сможете получать промежуточные результаты распознавания.

Требования к аудио

Передаваемое аудио должно соответствовать требованиям:

  • Максимальный размер файла — 1 МБ.
  • Максимальная длительность — 30 секунд.
  • Максимальное количество аудиоканалов — 1.

Если ваш файл больше, длиннее или у него больше аудиоканалов, используйте асинхронное распознавание.

SpeechKit позволяет распознавать аудио в форматах:

  • LPCM
  • OggOpus

Подробнее об особенностях каждого формата смотрите в разделе Поддерживаемые форматы аудио.

Примеры использования

См. также