Hacker News Digest

Тег: #gpt-5.1

Постов: 2

Olmo 3: Charting a path through the model flow to lead open-source AI (allenai.org) 🔥 Горячее

by mseri • 21 ноября 2025 г. в 06:50 • 345 points

ОригиналHN

#llm#open-source#machine-learning#allenai#gpt-5.1#qwen3-30b-vl

Комментарии (111)

  • Спор о кошерности жирафов: модель утверждает, что жирафы не кошерны (не жуют жвачку), несмотря на расщелины копыт, что противоречит мнению пользователя и поддерживается GPT-5.1.
  • Критика OlmoTrace: функционал в playground.allenai.org, показывающий совпадения с обучающими данными, воспринимается пользователями как попытка угадать, а не настоящая отслеживаемость.
  • Оптимизация размеров моделей: предложение сосредоточиться на 20B-моделях как компромисс между 7B (недостаточно мощные) и 32B (требуют 24GB GPU), идеально подходящих для 16GB GPU.
  • Преимущества Qwen3-30B-VL: отмечена высокая скорость (90 ток/с) и эффективность для повседневных задач, делающая её сложной для замены плотными моделями.
  • Спор о термине "fully open": критика использования этого термина для Olmo, так как других полностью открытых моделей нет, но подчеркивается уникальность предоставления кода, данных и весов.

Trying out Gemini 3 Pro with audio transcription and a new pelican benchmark (simonwillison.net)

Google выпустил Gemini 3 Pro, обновление модели, которое позволяет ей конкурировать с ведущими аналогами. Модель сохраняет базовые характеристики предыдущей версии (обрезание знаний в январе 2025 года), но предлагает улучшенную производительность. Gemini 3 Pro поддерживает до 1 миллиона входных токенов, может генерировать до 64 000 токенов и обладает мультимодальными возможностями для обработки текста, изображений, аудио и видео.

Согласно собственным тестам Google, Gemini 3 Pro незначительно превосходит Claude 4.5 Sonnet и GPT-5.1 по большинству стандартных бенчмарков. Модель стоит дороже, чем предыдущая версия, но остается дешевле конкурентов. В практическом тесте модель продемонстрировала сильные мультимодальные возможности, успешно обработав сложную таблицу с результатами тестов и создав подробный альтернативный текст для изображения.

by nabla9 • 18 ноября 2025 г. в 19:05 • 141 points

ОригиналHN

#gemini-3-pro#gemini-3.5-pro#whisper#gpt-5.1#claude-4.5-sonnet#transcription#audio-processing#summarization#multimodal-ai#benchmarking

Комментарии (47)

  • Обсуждение охватывает вопросы от транскрибирования и суммаризации длинных аудио-файлов до точности и стоимости, включая использование Whisper и Gemini 3.5 Pro, а также влияние стоимости на качество и доступность.
  • Участники обсуждают, какие модели лучше всего справляются с задачей транскрибирования и суммаризации, и какие инструменты лучше всего использовать для этой цели.
  • Также обсуждается, что в будущем может быть разработан единый стандарт для оценки моделей на такие задачи.
  • Участники также обсуждают, какие именно аспекты важны для журналистов и исследователей, и какие именно инструменты они используют для транскрибирования и суммаризации.