GLM 4.5 with Claude Code
GLM-4.5
- 355B параметров, 32B активных; 128K контекст; 96K выход
- MoE-архитектура, 15T токенов дообучения, RL-доработка
- Режимы:
thinking(сложные задачи) и мгновенный ответ - Инструменты, JSON, потоковый вывод, кэш контекста
GLM-4.5-Air
- 106B/12B, дешевле и быстрее, качество почти на уровне GLM-4.5
GLM-4.5-X / AirX / Flash
- X: максимум скорости и качества
- AirX: лёгкий + сверхбыстрый
- Flash: бесплатный, для кода и агентов
Ключевые умения
глубокое рассуждение, вызов функций, структурный вывод, поток, кэш.
Комментарии (77)
- Пользователи тестируют китайскую модель GLM 4.5 и GLM 4.5 Air от Z.ai как дешёвую замену Claude Sonnet в Claude Code и RooCode.
- Модель показывает хорошие результаты в коротких задачах, но уступает по длине контекста и стабильности.
- Подозрения, что OpenRouter и другие поставщики могут отдавать квантованные версии, что портит качество.
- Политика приватности Z.ai разрешает вечное использование отправленного кода и промптов — кто-то напуган, кто-то считает это нормой.
- Документация и интеграция вызывают нарекания: нет чёткой инструкции для Claude Code, приходится использовать прокси-обёртки.
Wan – Open-source alternative to VEO 3
Wan2.2 — открытая генеративная модель для создания видео.
Репозиторий: Wan-Video/Wan2.2
- Масштабируемость — работает от локального GPU до кластеров.
- Качество — высокое разрешение, плавность, точность текста.
- Гибкость — обучение, дообучение, инференс через PyTorch.
- Форматы — MP4, GIF, WebM; выбор fps и разрешения.
- API & CLI — простой запуск:
wan2.2 generate --prompt "...". - Docker — готовый образ
wanvideo/wan2.2:latest. - Лицензия Apache 2.0, коммерческое использование разрешено.
Комментарии (31)
- Wan2GP позволяет запускать модели Wan 2.1/2.2 на видеокартах всего 6 ГБ VRAM (Nvidia) и объединяет десятки вариантов моделей с LoRA-ускорением и активным Discord-сообществом.
- Пользователи хвалят качество Wan 2.2: 27B «MoE»-архитектура (два 14B эксперта для разных уровней детализации), 5B-модель выдаёт 720p24 на RTX 4090/24 ГБ или двух 12 ГБ GPU.
- Генерация 4-секундного видео Image-to-Video занимает 3–4 мин, апскейл до 4K — ещё 2–3 мин; изображения рендерятся за 20–40 с.
- Участники спрашивают о бенчмарках видео-моделей, UI-обёртке «Obi» и высокопроизводительных инференс-фреймворках вроде vLLM для видео.
- Некоторые критикуют название «Wan», спорят о корректности термина MoE и отмечают, что Replicate-версия дешевле и проще в использовании.