Особенности реализации API в сервисе Yandex AI Studio

Yandex AI Studio предоставляет большой выбор API для создания различных приложений и решения бизнес-задач с помощью моделей искусственного интеллекта. Все API можно разделить на две группы:

  • OpenAI-совместимые API, которые обеспечивают единый интерфейс для работы с моделями, текстовыми и голосовыми агентами, файлами и поиском.
  • Специализированные API, разработанные в Yandex Cloud для генерации текста и изображений, классификации, дообучения моделей и пакетной обработки.

OpenAI-совместимые API

Выбирайте OpenAI-совместимые API для создания агентов, реализации RAG-сценариев и простых запросов к моделям.

API Технология Описание
Models API REST Получение списка доступных моделей и их идентификаторов
Chat Completions API REST Генерация текста по промпту без управления диалогом
Conversations API REST Работа с историей диалога и контекстом
Responses API REST Создание агентов. Позволяет генерировать текст, вызывать инструменты, получать структурированные ответы, реализовывать RAG-сценарии и создавать мультиагентные системы
Realtime API WebSocket Потоковая генерация текста и аудио с низкой задержкой для сценариев с голосовым входом
Files API REST Загрузка, хранение и работа с файлами для RAG-сценариев
Embeddings API REST Получение эмбеддингов для семантических задач
Vector stores API REST Индексация данных и извлечение данных для RAG

Специализированные API Yandex Cloud

Используйте специализированные API AI Studio для работы с моделями YandexGPT Lite, YandexGPT Pro, YandexART, пакетной обработки, классификации текстов, дообучения моделей и управления MCP-серверами.

API Yandex Cloud спроектированы на основе механизма gRPC. Для описания методов и структур данных в API используется Protocol Buffers (proto 3).

В отличие от большинства API сервисов Yandex Cloud, API для работы с моделями не поддерживают ресурсо-ориентированный подход, так как не оперирует ресурсами. Запросы к моделям AI Studio не идемпотентны.

API Технология Описание
Text Generation API gRPC
REST
Генерация текстов по промпту, вызов функций, поддержка структурированного ответа
Image Generation API gRPC
REST
Генерация изображений по текстовому описанию
Batch Inference API gRPC Асинхронная обработка большого количества запросов
Text Classification API gRPC
REST
Классификация, модерация, определение тематик
Embeddings API gRPC
REST
Векторное представление текста
Files API gRPC
REST
Загрузка и хранение файлов и данных
Dataset API gRPC Управление датасетами для обучения
Tuning API gRPC Дообучение моделей под предметную область
MCP Gateway API gRPC
REST
Создание, получение списка и удаление MCP-серверов

Читайте также