Hacker News Digest

Тег: #imagen

Постов: 3

SynthID – A tool to watermark and identify content generated through AI (deepmind.google)

  • Gemini
    • 2.5 Pro, Flash, Flash Image, Flash-Lite — самые мощные модели
  • Gemma
    • Gemma 3, 3n и ShieldGemma 2 — лёгкие open-модели
  • Генеративные модели
    • Imagen, Lyria, Veo — картинки, музыка, видео
  • Эксперименты
    • Project Astra, Mariner, Gemini Diffusion — прототипы

  • Исследования
    • Проекты, публикации, новости

  • Наука с ИИ
    • Биология: AlphaFold, AlphaGenome, AlphaMissense, AlphaProteo
    • Климат: WeatherNext, Weather Lab
    • Математика: AlphaEvolve, AlphaProof, AlphaGeometry
    • Физика/химия: GNoME, Fusion, AlphaQubit
    • Прозрачность: SynthID — водяные знаки для ИИ-контента

  • О нас
    • Новости, карьера, вехи, образование, безопасность, подкаст

by jonbaer • 30 августа 2025 г. в 03:29 • 78 points

ОригиналHN

#gemini#gemma#generative-models#imagen#lyria#veo#alphafold#llm#synthid#watermarking

Комментарии (65)

  • SynthID встрачивает невидимый водяной знак, меняя вероятности токенов при генерации текста.
  • Критика: одиночный фрагмент не детектируется, легко обойти конкурентами, редактирование/шум ломает метку.
  • Пользователи опасаются потери приватности и ложных срабатываний; спор о том, нужно ли вообще помечать AI-контент.
  • Предложены альтернативы: цифровые подписи авторов, C2PA, open-source-детекторы.
  • Обсуждается «гонка вооружений» между генераторами и детекторами, а также возможное регулирование.

Gemini 2.5 Flash Image (developers.googleblog.com) 🔥 Горячее 💬 Длинная дискуссия

  • Gemini 2.5 — Pro, Flash, Flash Image, Flash-Lite

  • Gemma 3 — Gemma 3, 3n, ShieldGemma 2

  • Генеративные модели — Imagen, Lyria, Veo

  • Эксперименты — Project Astra, Mariner, Gemini Diffusion

  • Исследования — проекты, публикации, новости

  • Наука

    • Биология: AlphaFold, AlphaGenome, AlphaMissense, AlphaProteo
    • Климат: WeatherNext, Weather Lab
    • Математика и КС: AlphaEvolve, AlphaProof, AlphaGeometry
    • Физика и химия: GNoME, Fusion, AlphaQubit
    • Прозрачность: SynthID
  • О нас — новости, карьера, вехи, образование, безопасность, подкаст

by meetpateltech • 26 августа 2025 г. в 14:01 • 1011 points

ОригиналHN

#gemini#imagen#lyria#veo#alphafold#alphagenome#alphamissense#alphaproteo#alphaproof#alphageometry

Комментарии (452)

  • Gemini 2.5 Flash (nano-banana) стал новым «iPhone-моментом» для редактирования картинок: +171 ELO на LM Arena, почти догнал Imagen и gpt-image-1.
  • Модель умеет одновременно использовать несколько входных изображений без хаков, быстро работает и дешёво ($0.02), но дороже Flux Schnell.
  • Жёсткая безопасность: отказывает в редактировании людей и детей, половина промптов блокируется, что делает продукт бесполезным для фото-ретуши.
  • На практике результаты не всегда совпадают с рекламой, иногда «Internal server error» и квоты API, а в Европе доступ ограничен VPN.
  • Пользователи радуются быстрому восстановлению старых фото и «фотобаттлам», но боятся deepfake-шантажа и отсутствия контроля над лицами.

Imagen 4 is now generally available (developers.googleblog.com)

  • Imagen 4 и Imagen 4 Fast теперь доступны всем через Gemini API.
  • Imagen 4 Fast генерирует изображения в 2 раза быстрее и дешевле, чем Imagen 3, без потери качества.
  • Imagen 4 — флагманская модель: лучше текст, детали, стилизация; поддерживает 2K разрешение и редактирование (inpainting/outpainting).
  • Цены:
    • Imagen 4 Fast: $0,03 за изображение 1024×1024.
    • Imagen 4: $0,05 за изображение 1024×1024.
  • Как начать:
    from google import genai
    client = genai.Client(api_key="YOUR_API_KEY")
    response = client.models.generate_images(
        model="imagen-4-fast",
        prompt="A cat wearing a space helmet on Mars"
    )
    
  • Доступно в 180+ странах через Google AI Studio и Gemini API.

by meetpateltech • 15 августа 2025 г. в 17:36 • 181 points

ОригиналHN

#imagen#gemini#google#python

Комментарии (65)

  • Пользователи жалуются, что Imagen 4/Ultra игнорирует детальные промпты: четырёхпанельный комикс не соблюдает ни стиль, ни содержание.
  • Сравнения показывают, что «Ultra» не лучше обычной версии, а иногда даже хуже; OpenAI и Copilot дают точнее.
  • Документация отсутствует, примеры устарели, а вывод часто «мультяшный» вместо фотореалистичного.
  • Сообщество шутит над ошибками, опечатками Google и общим качеством «AI-slop».