Министерство цифровых дел Польши объявило, что PLLuM — семейство польских моделей искусственного интеллекта — уже может быть использовано

imagazine.pl 4 месяцы назад

Минцифры представило польскую языковую модель PLLuM и ее план развития. Отныне модель доступна всем.

ПЛЛУМ Польская модель большого языка представляет собой семейство моделей искусственного интеллекта, которые позволяют обрабатывать и генерировать тексты на польском языке. Модели, разработанные польскими экспертами и специалистами в области IT и лингвистики, будут способствовать развитию цифровых компетенций и инноваций в государственном управлении и бизнесе. Объявление о начале работ по этой модели состоялось в декабре 2023 года:

Восстание PLLuM: польская модель открытого большого языка

PLLuM является доказательством того, что мы можем разрабатывать современные технологии на наших собственных условиях, на нашем собственном языке, в интересах граждан и граждан. Мы создаем основу для интеллектуальных государственных услуг и инноваций, которые будут реальной поддержкой как администрации, так и бизнеса, - говорит вице-премьер и министр цифровизации Кшиштоф Гавковский.

В зависимости от выбранного варианта модели PLLuM доступны в 8-70 млрд параметров (для сравнения GPT-3.5 представляет собой модель с 175 млрд параметров, а текущий GPT-4 имеет 100 трлн параметров). PLLuM - это гибкая и масштабируемая модель, небольшие модели в соответствии с министерством работают в быстрых задачах, в то время как более крупные предлагают более высокую точность и контекстную согласованность в значении польского языка.

Семейство PLLuM включает в себя модели в архитектуре MoE с сбалансированным выбором экспертов и специализированных моделей RAG.

Разработчики PLLuM подчеркивают, что их группа моделей основана на этическом сборе данных — коммерческие версии используют текстовые ресурсы владельцев, предоставивших лицензию консорциума, а также ресурсы, которые в соответствии с Законом об авторском праве и смежных правах и правилами ЕС могут быть использованы для построения полностью открытой модели.

Научные модели PLLuM (т.е. доступные на лицензиях, не допускающих коммерческих приложений) также используют общедоступные наборы данных, такие как Common Crawl.

По данным отдела оцифровки, PLLuM вместе с моделью Уайтхед может содействовать искусственному интеллекту, созданному в Польше, поддерживая друг друга в лучшем процессе обучения и дальнейшего получения и открытия данных, необходимых для #AIMadeInPoland улучшилась – для государственного управления, бизнеса и общества.

Вот билик - у поляков тоже есть свой ИИ на базе LLM

Развитие PLLuM – это инвестиции в цифровое государство. На данный момент мы выделили на этот проект 14,5 млн злотых, и сейчас мы идем еще дальше – еще 19 млн злотых позволят реализовать модель в государственном управлении и расширить сотрудничество с новыми партнерами, такими как COI и Digital. Это сделает PLLuM ключевым элементом в оцифровке государственных услуг и развитии национальной экосистемы ИИ, - сказал заместитель министра цифровизации Дариуш Стэндерски.

Проект реализуется от имени Министерства цифровых дел, которое владеет результатами и контролирует разработку PLLuM. На данный момент проект реализуется консорциумом из шести организаций:

  • Вроцлавский технологический университет (руководитель проекта)
  • Институт компьютерных наук PAS
  • Институт славян PAS
  • Научно-академическая компьютерная сеть (НАСК-ПИБ)
  • Центр обработки информации (OPI-PIB)
  • Университет Лодзи

Куда пойдет PLLuM? Одной из идей является функция виртуального помощника, встроенная в будущие итерации приложений mCitizen, которая призвана облегчить пользователям доступ к публичной информации. Министерство также рассматривает применение готового к использованию семейства польских моделей ИИ в административном или образовательном секторах.

PLLuM доступен по адресу: http://pllum.clarin-pl.eu. Модели можно скачать на Обнимающее лицо.

Если статья Министерство цифровых дел Польши объявило, что PLLuM — семейство польских моделей искусственного интеллекта — уже может быть использовано. Не смотрите правильно в RSS-ридере, а затем смотрите на него iMagazine.

Читать всю статью