Т-Технологии открыла доступ к языковым моделям T-Pro и T-Lite
Группа «Т-Технологии» объявила об открытии доступа к двум крупным языковым моделям (LLM) — T-Pro и обновленной T-Lite. Эти модели установили новый стандарт производительности, обойдя все открытые российские и зарубежные аналоги на ключевых индустриальных бенчмарках. Теперь любая компания в России может бесплатно воспользоваться возможностями моделей для решения бизнес-задач.
Применение этих моделей позволит компаниям ускорить автоматизацию, повысить эффективность и снизить затраты на создание новых продуктов. Модели предоставляются для использования в любых внутренних процессах и для разработки новых решений. К примеру, с их помощью можно создавать умных чат-ботов, способных вести естественный диалог и быстро обрабатывать клиентские запросы без привязки к строгим сценариям. Также модели могут быть использованы для разработки ассистентов, помогающих сотрудникам выполнять сложные задачи, такие как написание кода, подготовка отчетов и проведение аналитических исследований.
Преимущество предоставленных моделей заключается в том, что компании больше не придется инвестировать в разработку собственных дорогостоящих языковых моделей. Вместо этого они смогут адаптировать уже существующие решения под свои нужды, что существенно снизит расходы. Помимо этого, использование открытых моделей от «Т-Технологий» позволяет отказаться от затрат на приобретение лицензий или оплату услуг сторонних поставщиков, предлагающих закрытые продукты.
Виктор Тарнавский, директор по искусственному интеллекту Т-Банка:
«При нашем объеме бизнеса (более 46 млн клиентов и 90 тысяч сотрудников) возникают задачи такого уровня сложности, для которого подходят только собственные технологии. Когда мы начали развивать продукты на базе больших языковых моделей — например, копилотов для сотрудников и Вселенную AI-ассистентов, — мы еще раз убедились, что существующие на рынке решения не отвечают нашим требованиям.
Так мы начали развивать Gen-T — семейство специализированных языковых моделей. Нашей целью было создать решения без компромиссов по качеству и при этом минимизировать затраты, используя наработки мирового научного и инженерного сообщества.
Убедившись в эффективности нашего решения, мы решили поделиться нашими моделями со всей индустрией и поменять подход к использованию LLM. Зачем создавать собственные дорогие модели, если можно взять лучшее с рынка и настроить под себя.
Оценив успешность собственных разработок, «Т-Технологии» приняли решение сделать их доступными для других компаний. T-Pro и T-Lite входят в семейство Gen-T, объединяющее специализированные языковые модели. Они созданы с использованием технологии продолженного предобучения, которая позволяет адаптировать обученные на больших данных модели под задачи конкретных отраслей. Эта технология не только обеспечивает высокую точность и производительность моделей на русском языке, но и снижает затраты на их разработку на 80–90% по сравнению с созданием аналогичных решений с нуля.
Сравнительные тесты, проведенные на таких бенчмарках, как MERA, ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval, показали, что T-Pro и T-Lite превосходят все существующие аналоги по уровню знаний, качеству ведения диалога и способности решать практические задачи на русском языке.
Модель T-Pro является самой мощной среди открытых решений. С числом параметров, увеличенным с 7 до 32 миллиардов, она способна учитывать больший объем контекста, более точно обрабатывать данные и выполнять сложные задачи. Модель поддерживает два режима работы: дообучение для решения конкретных задач и интерактивный режим промптинга, позволяющий ставить задачи в формате диалога.
По словам разработчиков, на российском рынке модели семейства Gen-T обгоняют конкурентов как среди открытых, так и среди проприетарных решений.
Впрочем, конкуренты не дремлют. Например, российский провайдер коммуникационных решений «Телфин» добавил в функциональность АТС «Телфин.Офис» сервис анализа речи. Решение разработано с использованием технологии Yandex SpeechSense.