В России разработали первую мультимодальную модель ИИ

11.04.2024

В России разработали первую мультимодальную модель ИИ

Институт AIRI представил открытую мультимодальную языковую модель OmniFusion 1.1, первую в России, способную вести визуальный диалог и отвечать на вопросы, основываясь на изображениях, с поддержкой русского языка.

Открытый доступ к коду и весам модели позволяет использовать её для разработки как общедоступных, так и коммерческих продуктов.

OmniFusion умеет распознавать и описывать изображения, предоставляя возможность объяснить содержимое фотографии, анализировать карты помещений, распознавать текст и решать задачи, представлять формулы в LaTeX и многое другое.

Применение OmniFusion охватывает широкий спектр задач, от анализа медицинских изображений до решения логических задач. Модель уже сейчас может указывать на проблемы на медицинских изображениях, хотя для более точной диагностики требуется дополнительное обучение с участием медицинских экспертов.

На международном рынке представлены аналоги OmniFusion, в том числе LLaVA, Gemini, GPT4-Vision и другие, некоторые из которых являются закрытыми и платными. Однако OmniFusion выделяется своей открытостью, предоставляя доступ к исходному коду на GitHub, что делает её доступной для широкой аудитории разработчиков.

Модель основана на комбинации предварительно обученной большой языковой модели и визуальных энкодеров, кодирующих визуальную информацию в числовые векторы.

Разработка ведется научной группой FusionBrain Института AIRI с участием специалистов из Sber AI и SberDevices.

мультимодальную модель ии

ии

искусственный интеллект

россия

Нравится 1000+

Комментарии

Другие публикации канала

РТ: Компания DST Global укрепила свои международные позиции, получив уникальный идентификационный номер DUNS

Создание собственного маркетплейса на DST Marketplace

Обновление DST Marketplace V2.4 — Август 2025

Вам может быть интересно

Мультимодальный ИИ: Следующая эволюция в искусственном интеллекте

Искусственный интеллект достиг значительных успехов, но традиционные системы ИИ в основном работали в пределах одного типа данных — обрабатывали только текст, изображения или аудио одновременно....

Искусственный интеллект

20.05.2025

DST AI - Мультимодельная платформа с искусственным интеллектом

В современном мире развития искусственного интеллекта (ИИ) одним из ключевых выз...

Искусственный интеллект

17.05.2025

Грязные данные в разработке ИИ

Не секрет, что в настоящее время идет золотая лихо...

Искусственный интеллект

03.03.2025

Преимущества синтетических данных для тестирования, соответствия и генеративного ИИ

Примечательно, когда Microsoft и другие говорят о ...