Квоты и лимиты в Yandex AI Studio

В сервисе Yandex AI Studio действуют следующие ограничения:

  • Квоты — организационные ограничения, которые можно изменить по запросу в техническую поддержку.
  • Лимиты — технические ограничения, обусловленные особенностями архитектуры Yandex Cloud. Изменение лимитов невозможно.

Если вам необходимо больше ресурсов, отправьте запрос в техническую поддержку и расскажите, какие потребляемые квоты нужно увеличить и на сколько.

Квоты

Вид ограничения Значение
Векторизация текста
Количество запросов на векторизацию текста, в секунду 10
Выделенные инстансы
Количество одновременных выделенных инстансов 1
Генерация текста
Количество одновременных генераций в синхронном режиме 10
Количество запросов в секунду, асинхронный режим (запрос) 10
Количество запросов в секунду, асинхронный режим (получение ответа) 50
Количество запросов в час, асинхронный режим (запрос) 5 000
Количество запросов в секунду на токенизацию 50
Пакетный режим работы моделей
Количество запусков в час 10
Количество запусков в сутки 100
Классификация текста
Количество запросов на классификацию текста в секунду 1
Генерация изображений
Количество запросов на генерацию в минуту 500
Количество запросов на генерацию в сутки 5 000
Количество запросов результата в секунду 50
Дообучение моделей
Количество запусков дообучений в сутки 10
Количество запусков дообучений в час 3
Датасеты
Количество загруженных датасетов 100
Максимальный размер одного датасета 5 ГБ
Общий объем датасетов 300 ГБ
MCP-серверы
Количество MCP-серверов в облаке 30
Количество инструментов в одном сервере 50
Голосовые агенты (модель speech-realtime-250923)
Количество одновременных сессий с моделью 10
Количество запросов на создание сессии в секунду 10
AI-агенты
Количество одновременных запусков Code Interpreter 3

Лимиты

Вид ограничения Значение
Срок хранения результатов текстовых асинхронных запросов на сервере 3 суток
Векторизация текста
Количество токенов на вход 2 048
Размерность выходного вектора 256
Генерация текста
Максимальное количество токенов в ответе в AI Playground 1 000
Классификация текста
Количество классов в классификаторах по промпту 20
Количество классов в дообученных классификаторах 100
Генерация изображений
Максимальная длина промпта 500 символов
Срок хранения сгенерированных изображений 12 часов
AI-агенты
Максимальное количество агентов 1 000
Максимальное количество загруженных файлов 10 000
Максимальный размер файла 128 МБ
Количество файлов в одной загрузке 100
Максимальное количество файлов в поисковом индексе 10 000
Максимальное количество поисковых индексов 1 000
Максимальное количество запущенных операций индексации 10
Максимальная длина пользовательских чанков 8 000 символов
MCP-серверы
Количество активных соединений в облаке на одну зону доступности 500

См. также

Предыдущая
Следующая