API синхронного распознавания

С помощью API синхронного распознавания можно распознавать подготовленные аудиофайлы с такими характеристиками:

максимальный размер файла — 1 МБ;
максимальная длительность — 30 секунд;
максимальное количество аудиоканалов — 1.

Сервис синхронного распознавания располагается по адресу: stt.api.cloud.yandex.net/speech/v1/stt:recognize

Query-параметры

Параметр	Описание
lang	string Язык, для которого будет выполнено распознавание. Допустимые значения приведены в описании модели. Значение по умолчанию — `ru-RU` — русский язык.
topic	string Языковая модель, которую следует использовать при распознавании. Чем точнее выбрана модель, тем лучше результат распознавания. В одном запросе можно указать только одну модель. Допустимые значения зависят от выбранного языка. Значение параметра по умолчанию: `general`.
profanityFilter	boolean Параметр, регулирующий работу фильтра ненормативной лексики в распознанной речи. Допустимые значения: `false` (по умолчанию) — ненормативная лексика не будет исключена из результатов распознавания; `true` — ненормативная лексика будет исключена из результатов распознавания.
rawResults	boolean Флаг, указывающий, как писать числа. `true` — писать прописью, `false` (по умолчанию) — писать цифрами.
format	string Формат передаваемого аудио. Допустимые значения: `lpcm` — LPCM без WAV-заголовка. `oggopus` (по умолчанию) — OggOpus.
sampleRateHertz	string Частота дискретизации передаваемого аудио. Применяется, если значение `format` равно `lpcm`. Допустимые значения: `48000` (по умолчанию) — частота дискретизации 48 кГц; `16000` — частота дискретизации 16 кГц; `8000` — частота дискретизации 8 кГц.
folderId	string Идентификатор каталога, к которому у вас есть доступ. Требуется для авторизации с пользовательским аккаунтом (см. ресурс Аутентификация в API SpeechKit). Не используйте это поле, если вы делаете запрос от имени сервисного аккаунта. Максимальная длина строки в символах — 50.

Параметры в теле запроса

В теле необходимо передать двоичное содержимое аудиофайла.

Ответ

Распознанный текст возвращается в ответе в поле result.

{
          "result": <распознанный_текст>
        }

Подробнее о формате и кодах ответов см. на странице Коды ответов на запросы.

Примеры использования

Пример использования API v1 синхронного распознавания.

Была ли статья полезна?

Аутентификация в API

API потокового распознавания

API синхронного распознавания

Query-параметрыQuery-параметры

Параметры в теле запросаПараметры в теле запроса

ОтветОтвет

Примеры использованияПримеры использования

Была ли статья полезна?

Query-параметры

Параметры в теле запроса

Ответ

Примеры использования