Комментарии (111)
- Спор о кошерности жирафов: модель утверждает, что жирафы не кошерны (не жуют жвачку), несмотря на расщелины копыт, что противоречит мнению пользователя и поддерживается GPT-5.1.
- Критика OlmoTrace: функционал в playground.allenai.org, показывающий совпадения с обучающими данными, воспринимается пользователями как попытка угадать, а не настоящая отслеживаемость.
- Оптимизация размеров моделей: предложение сосредоточиться на 20B-моделях как компромисс между 7B (недостаточно мощные) и 32B (требуют 24GB GPU), идеально подходящих для 16GB GPU.
- Преимущества Qwen3-30B-VL: отмечена высокая скорость (90 ток/с) и эффективность для повседневных задач, делающая её сложной для замены плотными моделями.
- Спор о термине "fully open": критика использования этого термина для Olmo, так как других полностью открытых моделей нет, но подчеркивается уникальность предоставления кода, данных и весов.
Trying out Gemini 3 Pro with audio transcription and a new pelican benchmark
Google выпустил Gemini 3 Pro, обновление модели, которое позволяет ей конкурировать с ведущими аналогами. Модель сохраняет базовые характеристики предыдущей версии (обрезание знаний в январе 2025 года), но предлагает улучшенную производительность. Gemini 3 Pro поддерживает до 1 миллиона входных токенов, может генерировать до 64 000 токенов и обладает мультимодальными возможностями для обработки текста, изображений, аудио и видео.
Согласно собственным тестам Google, Gemini 3 Pro незначительно превосходит Claude 4.5 Sonnet и GPT-5.1 по большинству стандартных бенчмарков. Модель стоит дороже, чем предыдущая версия, но остается дешевле конкурентов. В практическом тесте модель продемонстрировала сильные мультимодальные возможности, успешно обработав сложную таблицу с результатами тестов и создав подробный альтернативный текст для изображения.
Комментарии (47)
- Обсуждение охватывает вопросы от транскрибирования и суммаризации длинных аудио-файлов до точности и стоимости, включая использование Whisper и Gemini 3.5 Pro, а также влияние стоимости на качество и доступность.
- Участники обсуждают, какие модели лучше всего справляются с задачей транскрибирования и суммаризации, и какие инструменты лучше всего использовать для этой цели.
- Также обсуждается, что в будущем может быть разработан единый стандарт для оценки моделей на такие задачи.
- Участники также обсуждают, какие именно аспекты важны для журналистов и исследователей, и какие именно инструменты они используют для транскрибирования и суммаризации.