Общие вопросы про Vision OCR

Я могу получить логи моей работы в сервисах?

Да, вы можете запросить информацию о работе с вашими ресурсами из логов сервисов Yandex Cloud. Для этого обратитесь в техническую поддержку.

Каких разрешений не хватает, если при обращении к сервису для распознавания изображения возникает ошибка доступа?

Ошибка «Permission denied» возникает при работе с Vision OCR, если у субъекта, который отправляет запрос, нет необходимых доступов. Чтобы исправить ошибку, необходимо назначить субъекту роль не ниже editor. Подробнее в разделе Управление доступом в Vision OCR.

Для каких задач я могу использовать сервис Vision OCR в Yandex Cloud?

Вы можете использовать Vision OCR, чтобы:

  • распознавать текст;
  • обнаруживать лица на изображении;
  • модерировать изображения;
  • определять качество изображений;
  • кодировать файлы в Base64.

Подробные инструкции в разделе Пошаговые инструкции для Vision OCR.

Подходит ли Vision OCR для распознавания документов (паспорт или водительское удостоверение)?

Да, подходит. Поддерживаемые шаблоны указаны в разделе Модели распознавания. Вы можете протестировать другие шаблоны самостоятельно.

Какие языки поддерживает модель распознавания license-plates?

Модель распознавания license-plates поддерживает только русский (ru) и английский (en) языки. Их нужно явно указать в запросе в параметре language_codes.

Почему координаты элементов определяются с ошибками?

Ваш обработчик изображений некорректно обработал метаданные изображения из секции exif. Подробнее читайте в разделе Ошибки в определении координат.

Выполните одно из действий:

  • Включите в вашем средстве просмотра изображений поддержку метаданных exif.
  • При передаче в сервис удаляйте из секции exif изображений атрибут Orientation, либо устанавливайте для него значение 0.