VK Cloud logo

Распознавание объектов

Данный метод позволяет найти различные объекты на фотографии.

HOST: https://smarty.mail.ru

ENDPOINT: /api/v1/objects/detect

Авторизационные данные передаются в строке запроса:

ПараметрТипЗначение
oauth_token
string
OAuth2 access token (required non-empty)
oauth_provider
string
Провайдер OAuth2 (required non-empty)

Поддерживаемые провайдеры OAuth2:

ПровайдерЗначение oauth_providerПолучение токена
VK Cloud
mcs
https://mcs.mail.ru/help/vision-auth/vision-token (все клиенты VK Cloud)

Параметры запроса передаются в формате JSON в теле запроса с name="meta":

ПараметрТипЗначение
mode
[]string
Типы объектов, которые требуется искать на переданных изображениях (required non-empty)
images
[]image_meta
Метаданные передаваемых изображений (required non-empty)

Возможные значения mode:

ПараметрТип
object
Искать на изображении объекты
scene
Искать на изображении сцены
car_number
Искать на изображении номера машин
multiobject
Искать на изображении мультиобъекты — объекты и все множество боксов всех найденных объектов
pedestrian
Искать на изображении людей (более точно определяет множество боксов всех людей на изображении)

mode

mode может содержать один или несколько режимов. Например:

  • "mode":["object"] <-- искать только объекты;

  • "mode":["scene"] <-- искать только сцены;

  • "mode":["object","scene"] <-- искать сцены и объекты.

image_meta

ПараметрТипЗначение
name
string
Имена файлов для сопоставления файлов в запросе и ответе (required non-empty)

Изображения передаются в теле запроса, значения поля name должны соответствовать переданным в images.

Максимальное количество изображений в одном запросе равняется 100. Максимальный размер каждого изображения не должен превышать 4 МБ.

Пример запроса
POST /api/v1/objects/detect?oauth_provider=mr&oauth_token=123 HTTP/1.1

Content-Type: multipart/form-data; boundary=----WebKitFormBoundaryfCqTBHeLZlsicvMp

------WebKitFormBoundaryfCqTBHeLZlsicvMp
Content-Disposition: form-data; name="file_0"; filename=""
Content-Type: image/jpeg

000000000000000000000000000
000000000000000000000000000
000000000000000000000000000
------WebKitFormBoundaryfCqTBHeLZlsicvMp
Content-Disposition: form-data; name="file_1"; filename=""
Content-Type: image/jpeg

111111111111111111111111111
111111111111111111111111111
111111111111111111111111111
------WebKitFormBoundaryfCqTBHeLZlsicvMp
Content-Disposition: form-data; name="meta"

{"mode":["object","scene","car_number"],"images":[{"name":"file_0"},{"name":"file_1"}]}
------WebKitFormBoundaryfCqTBHeLZlsicvMp--