Model Gallery

Каталог моделей для любых задач: от генерации текста и изображений до работы с неструктурированными данными. Здесь собраны модели для работы с текстом, изображениями и голосом.

Начать работу Получить консультацию

Широкий парк моделей для разных сценариев

Передовые разработки Яндекса и актуальные опенсорсные решения.

Инференс и масштабирование из коробки

Без закупки или аренды железа, DevOps-команд и сложной эксплуатации.

Единые интерфейсы и API

Одинаковый способ работы с моделями разных производителей, OpenAI-совместимость.

Корпоративная безопасность данных

Контроль доступа, изоляция сред и соответствие требованиям Enterprise.

Yandex AI Studio Series —
старт 16 июля 2026, онлайн

Узнайте всё о тонкостях разработки ИИ‑агентов и комплексных систем автоматизации. Глубокое погружение в работу с ИИ‑инструментами и API.

Зарегистрироваться

Разнообразие моделей под ваши задачи

Выбирайте подходящую модель под конкретный сценарий использования — без экспериментов и лишней инженерной сложности.

Диалоговое окно с запросом к YandexGPT Lite, суммаризация ответа про рабочие процессы в Yandex Cloud

Сценарии поиска, анализа и краткого изложения информации на базе корпоративных данных. Применяются в ассистентах, внутренних порталах, аналитике и работе с документами.

DeepSeek V4 Flash

Рассчитана на сложные RAG-сценарии, в которых важны последовательная обработка информации и структурированный подход к решению задач.

YandexGPT Pro

Для сложных RAG-сценариев и суммаризации с высоким качеством и устойчивым контекстом.

Qwen3.6 35B

Оптимальна для RAG-сценариев, в которых требуется высокая скорость поиска и генерации ответов.

Qwen3 235B

Эффективна для сценариев поиска по документации и суммаризации при работе с большими документами и многошаговым анализом.

Модели Яндекса

Опенсорсные модели

DeepSeek V4 Flash ^New

Модель для кодовых и агентских сценариев, сложных рассуждений

Qwen3.6 35B

Мультимодальная языковая модель для работы с текстом и изображениями

Qwen3 235B

Модель для агентских сценариев и сложных комплексных инструкций

GPT OSS 20B и 120B

Языковые модели для генерации текста, рассуждений и прикладных задач

Протестируйте модели прямо сейчас

Playground — это интерактивная среда для экспериментов с моделями. Выберите модель, введите запрос и сразу посмотрите, как она отвечает в реальном времени.
Доступны модели всех модальностей: голос, изображения, текст.

Перейти в Playground

Расширьте возможности вашего бизнеса с ИИ‑технологиями

Участвуйте в программе для продуктовых технологических компаний и получите грант до 1 млн рублей на создание своих ИИ‑приложений и агентов.

Подробнее

Единые интерфейсы и стандарты

Используйте привычные SDK и фреймворки — LangChain, LlamaIndex, LangGraph — с минимальными изменениями в коде. Model Gallery совместима с OpenAI-интерфейсом и поддерживает основные инструменты разработчика.

Responses API

Текстовая генерация и анализ

Realtime API

Потоковые ответы и голосовые сценарии

Completions API

Работа с языковыми моделями, простая интеграция в опенсорс-фреймворки

Безопасная работа с корпоративными данными

Model Gallery ориентирована на безопасное и предсказуемое использование моделей, а не на самостоятельное дообучение на данных клиента.

Данные не используются для обучения моделей.

Доступы контролируются на уровне платформы.

Возможность отключения логирования.

Выделенные сетевые доступы и соединения между локальной инфраструктурой и платформой.

Подробнее

Правила тарификации

Стоимость работы с моделями Model Gallery зависит от режима работы модели, количества входящих и исходящих токенов и используемых инструментов. Число токенов в одном и том же тексте для разных моделей может отличаться.

Подробнее

Варианты обращения к моделям

Model Gallery поддерживает разные режимы инференса — под задачи любой сложности и объёма.

Мгновенные ответы

Для интерактивных сценариев: чат-ботов, голосовых интерфейсов, ассистентов. Модели отвечают в реальном времени, обеспечивая живое взаимодействие без задержек.

Пакетная обработка

Для задач с большими объёмами данных: массовой генерации текстов, анализа документов, обновления баз знаний. Запросы обрабатываются асинхронно и масштабируются по нагрузке.

Выделенный инференс

Для развёртывания моделей вне общего пула. Подходит для специфичных сценариев и моделей, недоступных в базовых инстансах. Оптимальный выбор для задач, нуждающихся в предсказуемых ресурсах и управлении нагрузкой.

Могут быть полезны

Сервис для получения ответов поисковой базы Яндекса в формате XML или HTML. Помогает организовать поиск по сайту, группе сайтов или интернету, отслеживать позиции сайтов по поисковым запросам.

Документация

Сервис компьютерного зрения для распознавания текста на изображениях и в файлах PDF. Поддерживает 45+ языков и определяет их автоматически.

Документация

Сервис для интеграции алгоритмов Яндекс Переводчика в приложения или веб-проекты для конечных пользователей. Поддерживает 100+ языков и умеет переводить отдельные слова и целые тексты.

Документация

Начните работать с Model Gallery

Попробуйте запустить первую модель — протестируйте ответы в консоли, подключите API или обучите под особенности вашего бизнеса.

Начать работу Получить консультацию

Широкий парк моделей для разных сценариев

Инференс и масштабирование из коробки

Единые интерфейсы и API

Корпоративная безопасность данных

Yandex AI Studio Series — старт 16 июля 2026, онлайн

Разнообразие моделей под ваши задачи

DeepSeek V4 Flash

YandexGPT Pro

Qwen3.6 35B

Qwen3 235B

Модели Яндекса

Опенсорсные модели

DeepSeek V4 Flash New

Qwen3.6 35B

Qwen3 235B

GPT OSS 20B и 120B

Протестируйте модели прямо сейчас

Расширьте возможности вашего бизнеса с ИИ‑технологиями

Единые интерфейсы и стандарты

Responses API

Realtime API

Completions API

Безопасная работа с корпоративными данными

Данные не используются для обучения моделей.

Доступы контролируются на уровне платформы.

Возможность отключения логирования.

Выделенные сетевые доступы и соединения между локальной инфраструктурой и платформой.

Правила тарификации

Варианты обращения к моделям

Мгновенные ответы

Пакетная обработка

Выделенный инференс

Могут быть полезны

Начните работать с Model Gallery

Вступайте в сообщество Yandex AI Studio

Yandex AI Studio Series —
старт 16 июля 2026, онлайн

DeepSeek V4 Flash ^New