Тег: #gpt-5.1 — Hacker News Digest

Olmo 3: Charting a path through the model flow to lead open-source AI (allenai.org) 🔥 Горячее

—

by mseri • 21 ноября 2025 г. в 06:50 • 345 points

#llm #open-source #machine-learning #allenai #gpt-5.1 #qwen3-30b-vl

Комментарии (111)

Спор о кошерности жирафов: модель утверждает, что жирафы не кошерны (не жуют жвачку), несмотря на расщелины копыт, что противоречит мнению пользователя и поддерживается GPT-5.1.
Критика OlmoTrace: функционал в playground.allenai.org, показывающий совпадения с обучающими данными, воспринимается пользователями как попытка угадать, а не настоящая отслеживаемость.
Оптимизация размеров моделей: предложение сосредоточиться на 20B-моделях как компромисс между 7B (недостаточно мощные) и 32B (требуют 24GB GPU), идеально подходящих для 16GB GPU.
Преимущества Qwen3-30B-VL: отмечена высокая скорость (90 ток/с) и эффективность для повседневных задач, делающая её сложной для замены плотными моделями.
Спор о термине "fully open": критика использования этого термина для Olmo, так как других полностью открытых моделей нет, но подчеркивается уникальность предоставления кода, данных и весов.

Trying out Gemini 3 Pro with audio transcription and a new pelican benchmark (simonwillison.net)

Google выпустил Gemini 3 Pro, обновление модели, которое позволяет ей конкурировать с ведущими аналогами. Модель сохраняет базовые характеристики предыдущей версии (обрезание знаний в январе 2025 года), но предлагает улучшенную производительность. Gemini 3 Pro поддерживает до 1 миллиона входных токенов, может генерировать до 64 000 токенов и обладает мультимодальными возможностями для обработки текста, изображений, аудио и видео.

Согласно собственным тестам Google, Gemini 3 Pro незначительно превосходит Claude 4.5 Sonnet и GPT-5.1 по большинству стандартных бенчмарков. Модель стоит дороже, чем предыдущая версия, но остается дешевле конкурентов. В практическом тесте модель продемонстрировала сильные мультимодальные возможности, успешно обработав сложную таблицу с результатами тестов и создав подробный альтернативный текст для изображения.

by nabla9 • 18 ноября 2025 г. в 19:05 • 141 points

Оригинал • HN

#gemini-3-pro #gemini-3.5-pro #whisper #gpt-5.1 #claude-4.5-sonnet #transcription #audio-processing #summarization #multimodal-ai #benchmarking

Комментарии (47)

Обсуждение охватывает вопросы от транскрибирования и суммаризации длинных аудио-файлов до точности и стоимости, включая использование Whisper и Gemini 3.5 Pro, а также влияние стоимости на качество и доступность.
Участники обсуждают, какие модели лучше всего справляются с задачей транскрибирования и суммаризации, и какие инструменты лучше всего использовать для этой цели.
Также обсуждается, что в будущем может быть разработан единый стандарт для оценки моделей на такие задачи.
Участники также обсуждают, какие именно аспекты важны для журналистов и исследователей, и какие именно инструменты они используют для транскрибирования и суммаризации.