Claude vs. Gemini: Testing on 1M Tokens of Context
Claude Sonnet 4 теперь держит 1 млн токенов (~все книги о Гарри Поттере) за один запрос.
Получили ранний доступ и проверили:
-
Текст: спрятали две сцены из фильмов в 900 тыс. слов Шерлока Холмса.
- Все модели нашли, но Claude был в 2 раза быстрее (42 с vs 69–78 с у Gemini).
- Меньше галлюцинаций, но анализ менее подробный.
-
Код: загрузили весь код CMS Every + «подушку» до 1 млн токенов.
- Claude справился, но ответы короче и менее полные, чем у Gemini.
-
AI Diplomacy: играли в «Дипломатию» — мировое господство пока не одержал.
Вывод: быстрый и стабильный длинный контекст, но менее детальный, чем конкуренты.