AI World Clocks 🔥 Горячее 💬 Длинная дискуссия
Каждую минуту на сайте AI World Clocks отображаются новые часы, сгенерированные девятью разными AI-моделями. Каждая модель получает 2000 токенов для создания уникального дизайна аналоговых часов с анимированной секундной стрелкой, адаптивным дизайном и белым фоном. Проект представляет собой постоянную демонстрацию творческих возможностей ИИ в создании простых, но визуально разнообразных объектов.
Идея проекта принадлежит Брайану Муру, который вдохновился работой Мэтью Рейфилда. Каждые 60 секунд пользователь видит совершенно новый набор часов, демонстрирующий, как разные ИИ-модели интерпретируют одну и ту же задачу по-разному. Это интересный пример творческого применения генеративного ИИ для создания повседневных объектов, где функциональность сочетается с уникальным визуальным стилем.
Комментарии (352)
- Kimi K2 демонстрирует наибольшую точность и стабильность при генерации циферблатов, включая корректное отображение секундной стрелки.
- Qwen 2.2 и 2.5 выделяются креативными, но часто абсурдными решениями, напоминающими сюрреализм (например, искажённое расположение цифр).
- Большинство моделей испытывают трудности с базовыми задачами: правильным размещением цифр, отображением 13 часов или точным временем.
- Отсутствие визуальной обратной связи у ИИ приводит к непредсказуемым результатам и "когнитивной перегрузке" при решении логических задач.
- Проект сравнивают с тестом на деменцию ("нарисуй часы") и рассматривают как новый "тест Тьюринга" для оценки качества LLM.
Kimi K2 Thinking, a SOTA open-source trillion-parameter reasoning model 🔥 Горячее 💬 Длинная дискуссия
Kimi K2 Thinking — это новая модель от компании 01.AI, демонстрирующая впечатляющие способности в обработке длинных текстов. Модель способна анализировать документы до 128K токенов, что в 8 раз превышает возможности предыдущей версии. Это позволяет ей эффективно работать с целыми книгами, юридическими документами и научными исследованиями за один проход.
Разработчики подчеркивают, что K2 Thinking превосходит конкурентов в задачах, требующих глубокого понимания контекста, особенно на китайском языке. Тесты показывают, что модель достигает 90% точности в сложных аналитических задачах, что делает её одной из самых мощных на рынке. В то же время, компания заявляет о более эффективном использовании вычислительных ресурсов по сравнению с аналогами.
Комментарии (381)
- Китайские компании (Moonshot, DeepSeek, Qwen, GLM) за последние месяцы выпустили ряд открытых моделей, что ставит под сомнение привычное представление о том, что «открытый исходный код» — это западная практика.
- Модель Kimi K2 Thinking показала себя как наилучшая в своем классе, превосходя GPT-4.5 и Claude 3.5 Sonnet, и при этом доступна через OpenRouter и Hugging Face.
- Несмотря на то, что модель не является открытой, Moonshot AI предоставляет доступ к ней бесплатно, что вызывает вопросы о финансировании и стратегии.
- Появление столь мощных открытых моделей вызывает вопросы о том, как они будут использоваться и как это повлияет на рынок ИИ.