Рейтинг открытости генеративных AI-моделей

02.07.2024

Рейтинг открытости генеративных AI-моделей

Исследователи из Университета Неймегена (Нидерланды) подготовили рейтинг сорока больших языковых моделей и семи моделей для генерации изображений по текстовому описанию, которые заявлены производителями как полностью открытые и свободные от ограничений в использовании.

Большинство моделей, позиционируемых как «открытые», не стоит воспринимать как «полностью свободные» или «доступные для всех». В большинстве случаев, они распространяются под ограничивающими лицензиями, запрещающими использование в коммерческих продуктах. Сторонние исследователи могут экспериментировать с подобными моделями, но не имеют возможность адаптировать модель под свои нужды. Более половины моделей не предоставляют детальные сведения о данных, используемых для обучения, а также не публикуют информацию о внутреннем устройстве и архитектуре.

Из-за того, что критерии открытости моделей машинного обучения окончательно не сформированы, и не имеют четко выраженных определений, под видом открытых распространяются модели, имеющие лицензию, ограничивающую область использования.

Наиболее открытыми признаны модели BloomZ, AmberChat, OLMo, Open Assistant и Stable Diffusion, которые опубликованы под открытыми лицензиями вместе с исходными данными, кодом и реализацией API. Модели от Google (Gemma 7B), Microsоft (Orca 2) и Meta* (Llama 3), позиционируемые производителями как открытые, оказались ближе к концу рейтинга, так как они не предоставляют доступ к исходным данным, не раскрывают технические детали реализации и распространяют их под лицензиями, ограничивающими область использования. Популярная модель Mistral 7B оказалась примерно в середине рейтинга, так как поставляется под открытой лицензией, но лишь частично документирована, не раскрывает используемые при обучении данные и имеет не полностью открытый сопутствующий код.

Исследователями предложены четырнадцать критериев открытости AI-моделей. В их списох входят: условия распространения кода, открытость данных для обучения, весовых коэффициентов, вариантов данных и коэффициентов, оптимизированных при помощи обучения с подкреплением (RL), а также наличие готовых к использованию пакетов, API, документации и детального описания реализации.

* признана экстремистской организацией и запрещена в РФ

генеративная модель ии

генеративный ии

искусственный интеллект

ии

Нравится 2000+

Комментарии

Другие публикации канала

Архитектура цифровой коммерции 2026: гид по бизнес-моделям, трендам и стратегическому выбору

Объектное хранилище S3: практическое руководство для администраторов и DevOps

Как масштабировать маркетплейс: от стратегии до устойчивого роста

Вам может быть интересно

От augmentation к symbiosis: новая парадигма программирования

Использование средств генеративного искусственного интеллекта (ИИ) в разработке программного обеспечения радикально ускоряет создание кода. Однако обеспечение корректности, безопасности и долгосрочной...

Искусственный интеллект

04.05.2026

Edge AI: Архитектура, технологии и стратегические перспективы распределённого искусственного интеллекта

Периферийный искусственный интеллект (Edge AI) сегодня является одним из наиболе...

Искусственный интеллект

24.04.2026

Искусственный интеллект в кибербезопасности

Искусственный интеллект (ИИ) и машинное обучение (...

Искусственный интеллект

25.03.2026

DST Global и Λ-Универсум представили SemanticDB — первую живую онтологическую память для симбиотического ИИ

РТ: Россия — Февраль 2026 — Российская...