Модели базового инстанса

Сервис Yandex AI Studio предоставляет доступ к большим генеративным моделям, разработанных разными компаниями. Если стандартных моделей вам недостаточно, вы можете дообучить некоторые модели, чтобы они точнее отвечали на ваши запросы. Все роли, необходимые для работы с моделями, перечислены в разделе Управление доступом в Yandex AI Studio.

В базовом инстансе ресурсы модели доступны всем пользователям Yandex Cloud и делятся между ними, поэтому при большой нагрузке время работы моделей может увеличиваться. При этом другие пользователи гарантированно не могут получить доступ к контексту ваших переписок с моделью: даже при включенном режиме логирования запросы хранятся в обезличенном виде, а потенциально чувствительная информация маскируется. Однако если вы обрабатываете конфиденциальную информацию с помощью моделей, рекомендуем отключать логирование данных.

Для моделей базового инстанса действуют правила обновления, описанные в разделе Жизненный цикл модели. Модифицированные модели делят квоты на использование со своими базовыми моделями.

Модель и URI	Контекст	Доступные API
Alice AI LLM `gpt://<идентификатор_каталога>/aliceai-llm`	32k (32 768)	API генерации текста, OpenAI-совместимые API
YandexGPT Pro 5.1 `gpt://<идентификатор_каталога>/yandexgpt-5.1`	32k (32 768)	API генерации текста, OpenAI-совместимые API
YandexGPT Pro 5 `gpt://<идентификатор_каталога>/yandexgpt-5-pro`	32k (32 768)	API генерации текста, OpenAI-совместимые API
YandexGPT Lite 5 `gpt://<идентификатор_каталога>/yandexgpt-5-lite`	32k (32 768)	API генерации текста, OpenAI-совместимые API
DeepSeek V3.2 `gpt://<идентификатор_каталога>/deepseek-v32`	128k (131 072)	OpenAI-совместимые API
Qwen3 235B `gpt://<идентификатор_каталога>/qwen3-235b-a22b-fp8`	256k (262 144)	OpenAI-совместимые API
gpt-oss-120b `gpt://<идентификатор_каталога>/gpt-oss-120b`	128k (131 072)	OpenAI-совместимые API
gpt-oss-20b `gpt://<идентификатор_каталога>/gpt-oss-20b`	128k (131 072)	OpenAI-совместимые API
Дообученная YandexGPT Lite `gpt://<идентификатор_каталога>/yandexgpt-lite/latest@<суффикс>`	32k (32 768)	API генерации текста, OpenAI-совместимые API
Qwen3.6 35B `gpt://<идентификатор_каталога>/qwen3.6-35b-a3b`	256k (262 144)	OpenAI-совместимые API
Qwen3.5 35B `gpt://<идентификатор_каталога>/qwen3.5-35b-a3b-fp8` Переключена в пользу Qwen3.6 35B. URI будет действовать до 28 мая 2026 года	256k (262 144)	OpenAI-совместимые API
Gemma 3 27B `gpt://<идентификатор_каталога>/gemma-3-27b-it` Условия использования Gemma Модель доступна до 15 мая 2026 года	128k (131 072)	OpenAI-совместимые API
YandexART `art://<идентификатор_каталога>/yandex-art-2.0`	500 символов	API генерации изображений
Realtime `gpt://<идентификатор_каталога>/speech-realtime-250923`	32k (32 768)	Realtime API

Модели Gemma 3 27B и Qwen3.6 35B работают с изображениями в кодировке Base64.

Жизненный цикл модели

Каждая модель базового инстанса имеет собственный URI, который позволяет однозначно определить семейство и версию модели. Модель сохраняет URI до тех пор, пока не будет выведена из эксплуатации. При значительных изменениях новая версия модели публикуется отдельно и получает свой URI.

AI Studio заранее информирует о выводе версии модели из эксплуатации в истории изменений, сообществе пользователей и в почтовой рассылке, чтобы вы могли внести изменения в свои продукты. До окончания срока поддержки версия работает в штатном режиме, после чего все запросы, отправленные по устаревшему URI, будут возвращать ошибку 400 Bad Request. Автоматическое переключение между версиями не предусмотрено.

Чтобы сохранить работу ваших приложений, использующих устаревшую модель, измените URI модели в коде и выполните следующие действия:

Проверьте параметры промпта и скорректируйте его, чтобы получить результаты работы новой модели соответствовали вашим ожиданиям.
Если вы повышали квоты для устаревшей модели, заново запросите необходимые значения для новой модели.
Если вы использовали дообученную модель, заново дообучите ее.

Планируйте переход на новую модель заранее, поскольку тестирование новой версии и повторное дообучение могут занять время.

На все модели распространяется SLA сервиса.

Модели YandexGPT Pro 5 и YandexGPT Pro 5.1 остаются доступны по URI gpt://<идентификатор_каталога>/yandexgpt/latest и gpt://<идентификатор_каталога>/yandexgpt/rc соответственно до окончания поддержки, однако рекомендуем использовать явные URI этих моделей.

Примеры использования

Была ли статья полезна?

Обзор

Модели выделенного инстанса

Модели базового инстанса

Жизненный цикл моделиЖизненный цикл модели

Примеры использованияПримеры использования

Была ли статья полезна?

Жизненный цикл модели

Примеры использования