EuroLLM: LLM made in Europe built to support all 24 official EU languages 🔥 Горячее 💬 Длинная дискуссия
EuroLLM — европейская языковая модель, поддерживающая все 24 официальных языка ЕС. Проект представляет две модели: EuroLLM-9B с 9 миллиардами параметров, обученную на более чем 4 триллионах токенов на 35 языках, и EuroLLM-1.7B, оптимизированную для работы на периферийных устройствах. Обе модели открыты для использования и доступны на Hugging Face. Проект получил поддержку от Horizon Europe, Европейского исследовательского совета и EuroHPC, а обучение проводилось на суперкомпьютере MareNostrum 5.
Команда EuroLLM, включающая исследователей из Университета Эдинбурга, Instituto Superior Técnico и других ведущих европейских институтов, стремится укрепить цифровый суверенитет ЕС и стимулировать инновации в области ИИ. В будущем планируется добавить мультимодальные возможности — обработку изображений и речи. Проект позиционируется как "механизм инноваций", предоставляя европейским исследователям и организациям доступ к отечественной LLM для дальнейшего развития.
Комментарии (552)
- Европейский проект EuroLLM-9B представляет собой модель 9B параметров, обученную на 24 официальных языках ЕС, но не раскрывает детали обучения и не предоставляет доступ к датасету.
- Модель демонстрирует слабые результаты на бенчмарках и не может конкурировать с лучшими моделями, но при этом требует согласие на сбор персональных данных для доступа к весам.
- Проект финансируется из бюджета ЕС в размере 50 миллионов евро, но при этом не предоставляет никаких выгод для европейских стартапов и компаний в отличии от американских и китайских моделей.
- Появление EuroLLM-9B вызвало широкое обсуждение в сообществе, так как она не может конкурировать с другими моделями и не предоставляет никаких преимуществ для европейских пользователей.
Комментарии (49)
- PS3 был особенно трудным для эмуляции из-за Cell и его специфики, но RPCS3 уже справляется с большинством игр, хотя не без проблем с синхронизацией и таймингом.
- Почему у PS3 был выделенный 256 КБ локальной памяти, а у других архитектур нет? Ответ в том, что это было компромиссом ради экономии, а не техническое превосходство.
- Несмотря на то, что PS3 можно было использовать для кластеров и даже для нейросетей, на практике это было ограничено 256 МБ ОЗУ и 256 МБ видеопамяти, а также архитектурой Cell, которая не подходит для большинства задач ML.
- Парадокс в том, что Cell в свое время был вариантом для суперкомпьютера, но сегодняшние телефоны превосходят его возможностями.
- И хотя RPCS3 эмулирует большинство игр, но эмуляция неидеальна и требует мощного ПК, что ставит под вопросом саму идею эмуляции как таковой.
Why is Japan still investing in custom floating point accelerators?
- Япония продолжает финансировать Pezy Computing, создающую энергоэффективные математические ускорители SC4S/SC5, способные заменить GPU в HPC и ИИ.
- SC4S: 2 048 ядер, 8 TFLOPS FP64, 200 Вт, 40 нм; SC5: 16 384 ядер, 64 TFLOPS FP64, 400 Вт, 7 нм; оба используют SIMD и обходятся без HBM, охлаждаясь жидкостью.
- Ускорители уже стоят в 6-8 системах ТОП500; пиковая энергоэффективность 32 GFLOPS/Вт.
- Драйверы OpenCL/CUDA-аналог ZCL, компиляторы Fortran/C++ готовы; в 2026-2027 ждут SC6 (128 TFLOPS FP64, 7 нм) и SC7 (E级, 3 нм).
- Цель: 10× экономия энергии и долгая независимость от NVIDIA/Intel.
Комментарии (74)
- Япония развивает собственные HPC-акселераторы (Pezy и др.), ориентированные на FP64 и традиционные суперкомпьютерные задачи, а не на ИИ-низкоточность.
- Эти чипы создаются под кластеры с жидкостным охлаждением и продаются не поштучно, а целыми стойками.
- Производительность FP64 у Pezy конкурентна с NVIDIA, но энергоэффективность и программное окружение NVIDIA пока непревзойдены.
- Японские компании и государство инвестируют в HPC-экосистему, чтобы сохранить технологический суверенитет и не зависеть от американских GPU.
- Участники обсуждают, насколько целесообразно переключение на альтернативные форматы чисел (posits) и почему правительства продолжают финансировать «собственных лошадей» несмотря на риск провала.