Model Gallery

Каталог моделей для любых задач: от генерации текста и изображений до работы с неструктурированными данными. Здесь собраны модели для работы с текстом, изображениями и голосом.

Широкий парк моделей для разных сценариев

Передовые разработки Яндекса и актуальные опенсорсные решения.

Инференс и масштабирование из коробки

Без закупки или аренды железа, DevOps-команд и сложной эксплуатации.

Единые интерфейсы и API

Одинаковый способ работы с моделями разных производителей, OpenAI-совместимость.

Корпоративная безопасность данных

Контроль доступа, изоляция сред и соответствие требованиям Enterprise.

DeepSeek V3.2 в Model Gallery

Планирует действия, удерживает контекст в длинных цепочках рассуждений и вызывает инструменты без потери логики. Уверенно работает с кодом: генерирует, анализирует и рефакторит, понимает зависимости и выполняет многошаговые задачи.

Разнообразие моделей под ваши задачи

Выбирайте подходящую модель под конкретный сценарий использования — без экспериментов и лишней инженерной сложности.

Диалоговое окно с запросом к YandexGPT Lite, суммаризация ответа про рабочие процессы в Yandex Cloud

Сценарии поиска, анализа и краткого изложения информации на базе корпоративных данных. Применяются в ассистентах, внутренних порталах, аналитике и работе с документами.

YandexGPT Pro

Для сложных RAG-сценариев и суммаризации с высоким качеством и устойчивым контекстом.

Qwen3 235B

Эффективна для сценариев поиска по документации и суммаризации при работе с большими документами и многошаговым анализом.

Модели Яндекса

Опенсорсные модели

DeepSeek V3.2 New

Модель для кодовых и агентских сценариев, сложных рассуждений

Gemma 3 27B

Мультимодальная модель, которая работает с текстом и изображениями

Qwen3 235B

Модель для агентских сценариев и сложных комплексных инструкций

GPT OSS 20B и 120B

Языковые модели для генерации текста, рассуждений и прикладных задач

Протестируйте модели прямо сейчас

Playground — это интерактивная среда для экспериментов с моделями. Выберите модель, введите запрос и сразу посмотрите, как она отвечает в реальном времени.
Доступны модели всех модальностей: голос, изображения, текст.

Единые интерфейсы и стандарты

Используйте привычные SDK и фреймворки — LangChain, LlamaIndex, LangGraph — с минимальными изменениями в коде. Model Gallery совместима с OpenAI-интерфейсом и поддерживает основные инструменты разработчика.

Responses API

Текстовая генерация и анализ

Realtime API

Потоковые ответы и голосовые сценарии

Completions API

Работа с языковыми моделями, простая интеграция в опенсорс-фреймворки

Безопасная работа с корпоративными данными

Model Gallery ориентирована на безопасное и предсказуемое использование моделей, а не на самостоятельное дообучение на данных клиента.

Данные не используются для обучения моделей.

Доступы контролируются на уровне платформы.

Возможность отключения логирования.

Выделенные сетевые доступы и соединения между локальной инфраструктурой и платформой.

Правила тарификации

Стоимость работы с моделями Model Gallery зависит от режима работы модели, количества входящих и исходящих токенов и используемых инструментов. Число токенов в одном и том же тексте для разных моделей может отличаться.

Варианты обращения к моделям

Model Gallery поддерживает разные режимы инференса — под задачи любой сложности и объёма.

Мгновенные ответы

Для интерактивных сценариев: чат-ботов, голосовых интерфейсов, ассистентов. Модели отвечают в реальном времени, обеспечивая живое взаимодействие без задержек.

Пакетная обработка

Для задач с большими объёмами данных: массовой генерации текстов, анализа документов, обновления баз знаний. Запросы обрабатываются асинхронно и масштабируются по нагрузке.

Выделенный инференс

Для развёртывания моделей вне общего пула. Подходит для специфичных сценариев и моделей, недоступных в базовых инстансах. Оптимальный выбор для задач, нуждающихся в предсказуемых ресурсах и управлении нагрузкой.

Могут быть полезны

Сервис для получения ответов поисковой базы Яндекса в формате XML или HTML. Помогает организовать поиск по сайту, группе сайтов или интернету, отслеживать позиции сайтов по поисковым запросам.

Сервис компьютерного зрения для распознавания текста на изображениях и в файлах PDF. Поддерживает 45+ языков и определяет их автоматически.

Сервис для интеграции алгоритмов Яндекс Переводчика в приложения или веб- проекты для конечных пользователей. Поддерживает 100+ языков и умеет переводить отдельные слова и целые тексты.

Начните работать с Model Gallery

Попробуйте запустить первую модель — протестируйте ответы в консоли, подключите API или обучите под особенности вашего бизнеса.