Модели базового инстанса

Сервис Yandex AI Studio предоставляет доступ к большим генеративным моделям, разработанных разными компаниями. Если стандартных моделей вам недостаточно, вы можете дообучить некоторые модели, чтобы они точнее отвечали на ваши запросы. Все роли, необходимые для работы с моделями, перечислены в разделе Управление доступом в Yandex AI Studio.

В базовом инстансе ресурсы модели доступны всем пользователям Yandex Cloud и делятся между ними, поэтому при большой нагрузке время работы моделей может увеличиваться. При этом другие пользователи гарантированно не могут получить доступ к контексту ваших переписок с моделью: даже при включенном режиме логирования запросы хранятся в обезличенном виде, а потенциально чувствительная информация маскируется. Однако если вы обрабатываете конфиденциальную информацию с помощью моделей, рекомендуем отключать логирование данных.

Для моделей базового инстанса действуют правила обновления, описанные в разделе Жизненный цикл модели. Модифицированные модели делят квоты на использование со своими базовыми моделями.

Модель и URI

Контекст

Доступные API

Alice AI LLM
gpt://<идентификатор_каталога>/aliceai-llm

32k
(32 768)

API генерации текста, OpenAI-совместимые API

YandexGPT Pro 5.1
gpt://<идентификатор_каталога>/yandexgpt-5.1

32k
(32 768)

API генерации текста, OpenAI-совместимые API

YandexGPT Pro 5
gpt://<идентификатор_каталога>/yandexgpt-5-pro

32k
(32 768)

API генерации текста, OpenAI-совместимые API

YandexGPT Lite 5
gpt://<идентификатор_каталога>/yandexgpt-5-lite

32k
(32 768)

API генерации текста, OpenAI-совместимые API

DeepSeek V3.2
gpt://<идентификатор_каталога>/deepseek-v32

128k
(131 072)

OpenAI-совместимые API

Qwen3 235B
gpt://<идентификатор_каталога>/qwen3-235b-a22b-fp8

256k
(262 144)

OpenAI-совместимые API

gpt-oss-120b
gpt://<идентификатор_каталога>/gpt-oss-120b

128k
(131 072)

OpenAI-совместимые API

gpt-oss-20b
gpt://<идентификатор_каталога>/gpt-oss-20b

128k
(131 072)

OpenAI-совместимые API

Дообученная YandexGPT Lite
gpt://<идентификатор_каталога>/yandexgpt-lite/latest@<суффикс>

32k
(32 768)

API генерации текста, OpenAI-совместимые API

Qwen3.6 35B
gpt://<идентификатор_каталога>/qwen3.6-35b-a3b

256k
(262 144)

OpenAI-совместимые API

Qwen3.5 35B
gpt://<идентификатор_каталога>/qwen3.5-35b-a3b-fp8
exclamation Переключена в пользу Qwen3.6 35B. URI будет действовать до 28 мая 2026 года

256k
(262 144)

OpenAI-совместимые API

Gemma 3 27B
gpt://<идентификатор_каталога>/gemma-3-27b-it
Условия использования Gemma
exclamation Модель доступна до 15 мая 2026 года

128k
(131 072)

OpenAI-совместимые API

YandexART
art://<идентификатор_каталога>/yandex-art-2.0

500 символов

API генерации изображений

Realtime
gpt://<идентификатор_каталога>/speech-realtime-250923

32k
(32 768)

Realtime API

Модели Gemma 3 27B и Qwen3.6 35B работают с изображениями в кодировке Base64.

Жизненный цикл модели

Каждая модель базового инстанса имеет собственный URI, который позволяет однозначно определить семейство и версию модели. Модель сохраняет URI до тех пор, пока не будет выведена из эксплуатации. При значительных изменениях новая версия модели публикуется отдельно и получает свой URI.

AI Studio заранее информирует о выводе версии модели из эксплуатации в истории изменений, сообществе пользователей и в почтовой рассылке, чтобы вы могли внести изменения в свои продукты. До окончания срока поддержки версия работает в штатном режиме, после чего все запросы, отправленные по устаревшему URI, будут возвращать ошибку 400 Bad Request. Автоматическое переключение между версиями не предусмотрено.

Чтобы сохранить работу ваших приложений, использующих устаревшую модель, измените URI модели в коде и выполните следующие действия:

  • Проверьте параметры промпта и скорректируйте его, чтобы получить результаты работы новой модели соответствовали вашим ожиданиям.
  • Если вы повышали квоты для устаревшей модели, заново запросите необходимые значения для новой модели.
  • Если вы использовали дообученную модель, заново дообучите ее.

Планируйте переход на новую модель заранее, поскольку тестирование новой версии и повторное дообучение могут занять время.

На все модели распространяется SLA сервиса.

Модели YandexGPT Pro 5 и YandexGPT Pro 5.1 остаются доступны по URI gpt://<идентификатор_каталога>/yandexgpt/latest и gpt://<идентификатор_каталога>/yandexgpt/rc соответственно до окончания поддержки, однако рекомендуем использовать явные URI этих моделей.

Примеры использования