EuroLLM: LLM made in Europe built to support all 24 official EU languages
EuroLLM — европейская языковая модель, поддерживающая все 24 официальных языка ЕС. Проект представляет две модели: EuroLLM-9B с 9 миллиардами параметров, обученную на более чем 4 триллионах токенов на 35 языках, и EuroLLM-1.7B, оптимизированную для работы на периферийных устройствах. Обе модели открыты для использования и доступны на Hugging Face. Проект получил поддержку от Horizon Europe, Европейского исследовательского совета и EuroHPC, а обучение проводилось на суперкомпьютере MareNostrum 5.
Команда EuroLLM, включающая исследователей из Университета Эдинбурга, Instituto Superior Técnico и других ведущих европейских институтов, стремится укрепить цифровый суверенитет ЕС и стимулировать инновации в области ИИ. В будущем планируется добавить мультимодальные возможности — обработку изображений и речи. Проект позиционируется как "механизм инноваций", предоставляя европейским исследователям и организациям доступ к отечественной LLM для дальнейшего развития.