«Т-Технологии» бесплатно предоставит разработчикам российские модели ИИ

В открытом доступе опубликовали две большие языковые модели T-Pro и T-Lite: российские компании смогут использовать их бесплатно, сообщает пресс-служба группы «Т-Технологии».

Группа «Т-Технологии» открыла доступ к двум языковым моделям: T-Pro с 32 млрд параметров и обновленную версию T-Lite с 7 млрд параметров. Обе модели разработаны на базе открытой архитектуры Qwen-2.5 и были дополнительно обучены для работы с русскоязычными задачами.

Разработчики использовали технологию продолженного предобучения (Continual Pretraining). Это процесс, при котором уже обученную на больших объемах информации модель продолжают тренировать на материалах, специфичных для определенной задачи или области, и адаптируют ее на русский язык. По словам представителей компании, это позволило сократить затраты на создание моделей примерно на 80-90% по сравнению с разработкой с нуля.

Модели доступны для загрузки на платформе Hugging Face под открытой лицензией Apache 2.0. T-Pro работает в двух режимах: ее можно дообучить под конкретные бизнес-задачи, а также использовать в режиме промптинга — ставить задачи в режиме диалога.

Разработчики заявляют, что при решении задач на русском языке эта модель превосходит аналогичные открытые модели по индустриальным бенчмаркам MERA, ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval. При этом в ряде тестов она уступает проприетарной GPT-4o.

Данные о тестировании моделей с помощью различных бенчмарков. Изображения предоставленны пресс-службой группы «Т-Технологии»

Директор по искусственному интеллекту Т-Банка Виктор Тарнавский считает, что публикация моделей позволит компаниям эффективнее внедрять технологии ИИ, не тратить средства на обучение собственных LLM.


Читать далее:

323 флакона со смертельными вирусами пропали из лаборатории в Австралии

Квантовый чип Google превзошел суперкомпьютеры на септиллионы лет

Создан уникальный квантовый двигатель: Эйнштейн высмеивал эту идею

Иллюстрация на обложке: Изображение от freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Юпитер оказался не таким, как считали ученые: открытие опровергает гипотезу о гиганте
Космос
Физики придумали, как найти новые измерения в пространстве
Наука
Посмотрите на первое фото кометы C/2024 G3 в России: она прилетает раз в 160 000 лет
Космос
Ученые нашли необычные частицы: их поведение невозможно объяснить обычной физикой
Наука
Байден запретит поставки ИИ-чипов в Россию: что ответила NVIDIA
Новости
300 млрд киловатт-часов: Китай строит крупнейшую в мире гидроэлектростанцию
Новости
Парниковые газы предложили хранить в стенах домов для борьбы с изменением климата
Наука
Ученые разгадали тайну, как древние птерозавры поднялись в воздух
Наука
Эксперимент показал, что фотоны света могут вести себя как частицы темной материи
Наука
ИИ создал крупнейшую базу данных фотографий северного сияния
Наука
Молекулы РНК превратили в «фонарики», чтобы отслеживать их работу в клетке
Наука
Европейский зонд показал северный полюс Меркурия в рекордных деталях
Космос
Посмотрите, как изменится внешний вид людей через 30 лет  
Наука
Посмотрите на первые фото Tesla Model Y без камуфляжа  
Новости
«Тостер» для смартфона обновляет зарядку гаджета за секунды
Новости
Гаджет, который научился читать мысли человека, показали на CES 2025
Новости
Эта камера будет снимать на Луне: Nikon представила прототип на CES 2025  
Новости
Ярчайший гамма-всплеск в истории связали с теорией струн и темной материей  
Новости
Наука в фокусе: кто и зачем делает научно-популярные видеоблоги в России
Кейсы
Telegram раскрыл данные о 2000 пользователях в после ареста Дурова
Новости