Тег: #imagen — Hacker News Digest

SynthID – A tool to watermark and identify content generated through AI (deepmind.google)

Gemini
- 2.5 Pro, Flash, Flash Image, Flash-Lite — самые мощные модели
Gemma
- Gemma 3, 3n и ShieldGemma 2 — лёгкие open-модели
Генеративные модели
- Imagen, Lyria, Veo — картинки, музыка, видео
Эксперименты
- Project Astra, Mariner, Gemini Diffusion — прототипы

Исследования
- Проекты, публикации, новости

Наука с ИИ
- Биология: AlphaFold, AlphaGenome, AlphaMissense, AlphaProteo
- Климат: WeatherNext, Weather Lab
- Математика: AlphaEvolve, AlphaProof, AlphaGeometry
- Физика/химия: GNoME, Fusion, AlphaQubit
- Прозрачность: SynthID — водяные знаки для ИИ-контента

О нас
- Новости, карьера, вехи, образование, безопасность, подкаст

by jonbaer • 30 августа 2025 г. в 03:29 • 78 points

Оригинал • HN

#gemini #gemma #generative-models #imagen #lyria #veo #alphafold #llm #synthid #watermarking

Комментарии (65)

SynthID встрачивает невидимый водяной знак, меняя вероятности токенов при генерации текста.
Критика: одиночный фрагмент не детектируется, легко обойти конкурентами, редактирование/шум ломает метку.
Пользователи опасаются потери приватности и ложных срабатываний; спор о том, нужно ли вообще помечать AI-контент.
Предложены альтернативы: цифровые подписи авторов, C2PA, open-source-детекторы.
Обсуждается «гонка вооружений» между генераторами и детекторами, а также возможное регулирование.

Gemini 2.5 Flash Image (developers.googleblog.com) 🔥 Горячее 💬 Длинная дискуссия

Gemini 2.5 — Pro, Flash, Flash Image, Flash-Lite
Gemma 3 — Gemma 3, 3n, ShieldGemma 2
Генеративные модели — Imagen, Lyria, Veo
Эксперименты — Project Astra, Mariner, Gemini Diffusion
Исследования — проекты, публикации, новости
Наука
- Биология: AlphaFold, AlphaGenome, AlphaMissense, AlphaProteo
- Климат: WeatherNext, Weather Lab
- Математика и КС: AlphaEvolve, AlphaProof, AlphaGeometry
- Физика и химия: GNoME, Fusion, AlphaQubit
- Прозрачность: SynthID
О нас — новости, карьера, вехи, образование, безопасность, подкаст

by meetpateltech • 26 августа 2025 г. в 14:01 • 1011 points

Оригинал • HN

#gemini #imagen #lyria #veo #alphafold #alphagenome #alphamissense #alphaproteo #alphaproof #alphageometry

Комментарии (452)

Gemini 2.5 Flash (nano-banana) стал новым «iPhone-моментом» для редактирования картинок: +171 ELO на LM Arena, почти догнал Imagen и gpt-image-1.
Модель умеет одновременно использовать несколько входных изображений без хаков, быстро работает и дешёво ($0.02), но дороже Flux Schnell.
Жёсткая безопасность: отказывает в редактировании людей и детей, половина промптов блокируется, что делает продукт бесполезным для фото-ретуши.
На практике результаты не всегда совпадают с рекламой, иногда «Internal server error» и квоты API, а в Европе доступ ограничен VPN.
Пользователи радуются быстрому восстановлению старых фото и «фотобаттлам», но боятся deepfake-шантажа и отсутствия контроля над лицами.

Imagen 4 is now generally available (developers.googleblog.com)

Imagen 4 и Imagen 4 Fast теперь доступны всем через Gemini API.
Imagen 4 Fast генерирует изображения в 2 раза быстрее и дешевле, чем Imagen 3, без потери качества.
Imagen 4 — флагманская модель: лучше текст, детали, стилизация; поддерживает 2K разрешение и редактирование (inpainting/outpainting).
Цены:
- Imagen 4 Fast: $0,03 за изображение 1024×1024.
- Imagen 4: $0,05 за изображение 1024×1024.

Как начать:

from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_images(
    model="imagen-4-fast",
    prompt="A cat wearing a space helmet on Mars"
)

Доступно в 180+ странах через Google AI Studio и Gemini API.

by meetpateltech • 15 августа 2025 г. в 17:36 • 181 points

Оригинал • HN

#imagen #gemini #google #python

Комментарии (65)

Пользователи жалуются, что Imagen 4/Ultra игнорирует детальные промпты: четырёхпанельный комикс не соблюдает ни стиль, ни содержание.
Сравнения показывают, что «Ultra» не лучше обычной версии, а иногда даже хуже; OpenAI и Copilot дают точнее.
Документация отсутствует, примеры устарели, а вывод часто «мультяшный» вместо фотореалистичного.
Сообщество шутит над ошибками, опечатками Google и общим качеством «AI-slop».