Модели базового инстанса
Сервис Yandex AI Studio предоставляет доступ к большим генеративным моделям, разработанных разными компаниями. Если стандартных моделей вам недостаточно, вы можете дообучить некоторые модели, чтобы они точнее отвечали на ваши запросы. Все роли, необходимые для работы с моделями, перечислены в разделе Управление доступом в Yandex AI Studio.
В базовом инстансе ресурсы модели доступны всем пользователям Yandex Cloud и делятся между ними, поэтому при большой нагрузке время работы моделей может увеличиваться. При этом другие пользователи гарантированно не могут получить доступ к контексту ваших переписок с моделью: даже при включенном режиме логирования запросы хранятся в обезличенном виде, а потенциально чувствительная информация маскируется. Однако если вы обрабатываете конфиденциальную информацию с помощью моделей, рекомендуем отключать логирование данных.
Для моделей базового инстанса действуют правила обновления, описанные в разделе Жизненный цикл модели. Модифицированные модели делят квоты на использование со своими базовыми моделями.
|
Модель и URI |
Контекст |
Доступные API |
|
Alice AI LLM |
32k |
API генерации текста, OpenAI-совместимые API |
|
YandexGPT Pro 5.1 |
32k |
API генерации текста, OpenAI-совместимые API |
|
YandexGPT Pro 5 |
32k |
API генерации текста, OpenAI-совместимые API |
|
YandexGPT Lite 5 |
32k |
API генерации текста, OpenAI-совместимые API |
|
DeepSeek V3.2 |
128k |
OpenAI-совместимые API |
|
Qwen3 235B |
256k |
OpenAI-совместимые API |
|
gpt-oss-120b |
128k |
OpenAI-совместимые API |
|
gpt-oss-20b |
128k |
OpenAI-совместимые API |
|
Дообученная YandexGPT Lite |
32k |
API генерации текста, OpenAI-совместимые API |
|
Qwen3.6 35B |
256k |
OpenAI-совместимые API |
|
Qwen3.5 35B |
256k |
OpenAI-совместимые API |
|
Gemma 3 27B |
128k |
OpenAI-совместимые API |
|
YandexART |
500 символов |
API генерации изображений |
|
Realtime |
32k |
Realtime API |
Модели Gemma 3 27B и Qwen3.6 35B работают с изображениями в кодировке Base64.
Жизненный цикл модели
Каждая модель базового инстанса имеет собственный URI, который позволяет однозначно определить семейство и версию модели. Модель сохраняет URI до тех пор, пока не будет выведена из эксплуатации. При значительных изменениях новая версия модели публикуется отдельно и получает свой URI.
AI Studio заранее информирует о выводе версии модели из эксплуатации в истории изменений, сообществе пользователей и в почтовой рассылке, чтобы вы могли внести изменения в свои продукты. До окончания срока поддержки версия работает в штатном режиме, после чего все запросы, отправленные по устаревшему URI, будут возвращать ошибку 400 Bad Request. Автоматическое переключение между версиями не предусмотрено.
Чтобы сохранить работу ваших приложений, использующих устаревшую модель, измените URI модели в коде и выполните следующие действия:
- Проверьте параметры промпта и скорректируйте его, чтобы получить результаты работы новой модели соответствовали вашим ожиданиям.
- Если вы повышали квоты для устаревшей модели, заново запросите необходимые значения для новой модели.
- Если вы использовали дообученную модель, заново дообучите ее.
Планируйте переход на новую модель заранее, поскольку тестирование новой версии и повторное дообучение могут занять время.
На все модели распространяется SLA сервиса.
Модели YandexGPT Pro 5 и YandexGPT Pro 5.1 остаются доступны по URI gpt://<идентификатор_каталога>/yandexgpt/latest и gpt://<идентификатор_каталога>/yandexgpt/rc соответственно до окончания поддержки, однако рекомендуем использовать явные URI этих моделей.