Рейтинг открытости генеративных AI-моделей

Рейтинг открытости генеративных AI-моделей

Исследователи из Университета Неймегена (Нидерланды) подготовили рейтинг сорока больших языковых моделей и семи моделей для генерации изображений по текстовому описанию, которые заявлены производителями как полностью открытые и свободные от ограничений в использовании.

Большинство моделей, позиционируемых как «открытые», не стоит воспринимать как «полностью свободные» или «доступные для всех». В большинстве случаев, они распространяются под ограничивающими лицензиями, запрещающими использование в коммерческих продуктах. Сторонние исследователи могут экспериментировать с подобными моделями, но не имеют возможность адаптировать модель под свои нужды. Более половины моделей не предоставляют детальные сведения о данных, используемых для обучения, а также не публикуют информацию о внутреннем устройстве и архитектуре.

Из-за того, что критерии открытости моделей машинного обучения окончательно не сформированы, и не имеют четко выраженных определений, под видом открытых распространяются модели, имеющие лицензию, ограничивающую область использования.

Наиболее открытыми признаны модели BloomZ, AmberChat, OLMo, Open Assistant и Stable Diffusion, которые опубликованы под открытыми лицензиями вместе с исходными данными, кодом и реализацией API. Модели от Google (Gemma 7B), Microsоft (Orca 2) и Meta* (Llama 3), позиционируемые производителями как открытые, оказались ближе к концу рейтинга, так как они не предоставляют доступ к исходным данным, не раскрывают технические детали реализации и распространяют их под лицензиями, ограничивающими область использования. Популярная модель Mistral 7B оказалась примерно в середине рейтинга, так как поставляется под открытой лицензией, но лишь частично документирована, не раскрывает используемые при обучении данные и имеет не полностью открытый сопутствующий код.

Исследователями предложены четырнадцать критериев открытости AI-моделей. В их списох входят: условия распространения кода, открытость данных для обучения, весовых коэффициентов, вариантов данных и коэффициентов, оптимизированных при помощи обучения с подкреплением (RL), а также наличие готовых к использованию пакетов, API, документации и детального описания реализации.

* признана экстремистской организацией и запрещена в РФ

Комментарии
Вам может быть интересно
Узнайте от разработчиков компании DST Global, как использование тестирования программного обеспечения на базе искусственного интеллекта для сферы здравоохранения может существенно повлиять на качество...
По результатам исследования, которое мы провели среди пользователей облачного Би...
Ученые, которые стояли у истоков создания искусств...
Что такое объяснимый ИИ (XAI)?XAI включает в себя ...
Проекты искусственного интеллекта могут оказаться ...
Интерактивное чтение с помощью MEMWALKER расширяет...
Эта статья представляет собой анализ того, как мет...
Службы данных и генеративного искусственного интел...
Перейти вверх