Hacker News Digest

Тег: #gemma

Постов: 5

A Gemma model helped discover a new potential cancer therapy pathway (blog.google)

Исследователи использовали модель Gemma 2B, разработанную Google, для анализа геномных данных и выявили новый механизм, влияющий на рост раковых клеток. Они обнаружили, что определенный белок (названный в статье, но не в этом резюме) может быть ключевым регулятором, и его ингибирование подавляет рост рака в лабораторных моделях. Это открытие было сделано с помощью машинного обучения, где Gemma обрабатывала огромные объемы данных генома, чтобы найти паттерны, невидимые для человека. Открытие было подтверждено в сотрудничестве с онкологическим центром, и теперь они планируют клинические испытания. Этот подход может ускорить открытие новых методов лечения и сделать персонализированную медицину более доступной.

by alexcos • 15 октября 2025 г. в 19:04 • 199 points

ОригиналHN

#gemma#google#openai#machine-learning#llm#genomics

Комментарии (47)

  • Google и OpenAI продолжают демонстрировать прогресс в медицинском применении ИИ, но при этом остается открытым вопрос, насколько эти достижения доступны для широкой научной общественности и не являются ли они просто PR-ходом.
  • Сообщество выражает обеспокоенность по поводу того, что ИИ может быть использован для создания биологического оружия, и призывает к более строгому регулированию.
  • Несмотря на то, что Google и OpenAI продолжают продвигать ИИ в медицине и биологии, критики указывают на то, что эти компании не демонстрируют свои лучшие модели и не вкладывают достаточно ресурсов в научные исследования, что может замедлить прогресс.
  • Участники обсуждения также поднимают вопрос о том, что компании могут быть более заинтересованы в создании PR-шумих вокруг их достижений, чем в реальном продвижении науки, и что вместо того, чтобы делиться своими разработками, они могли бы использовать их для внутренних целей.
  • Наконец, обсуждение также затрагивает вопрос о том, как ИИ может быть использован для создания порнографии и как это может быть связано с тем, что компании вроде OpenAI не демонстрируют свои лучшие модели.

A beginner's guide to deploying LLMs with AMD on Windows using PyTorch (gpuopen.com)

AMD и GPUOpen опубликовали практическое руководство, как запустить LLM на Windows с GPU AMD и PyTorch. Самое важное — это не требует ROCm, а использует DirectML, что делает процесс доступным для большинства геймерских видеокарт Radeon. Поддерживаются модели Llama 3.2, Mistral и Gemma, а также Q4 и FP16 квантизация. Подготовка включает установку ROCm и PyTorch, но ROCm не используется; вместо этого используется DirectML. Процесс включает скачивание модели, конвертацию в GGUF с помощью llama.cpp, и запуск через веб-интерфейс Gradio. Важно, что весь процесс происходит на Windows без виртуализации или WSL2.

by beckford • 06 октября 2025 г. в 13:15 • 92 points

ОригиналHN

#pytorch#amd#directml#llama#mistral#gemma#llm#quantization#gradio#windows

Комментарии (26)

I have a philosophy for which I have mixed feelings because I like it in principle despite it making me worse off in some other ways: Devs should punish companies that clearly don't give a shit about them. When I see AMD, I think of a firm that heavily prioritized their B2B busin

VaultGemma: The most capable differentially private LLM (research.google)

  • VaultGemma — самая мощная языковая модель с дифференциальной приватностью.
  • Обучена на Gemma 2 2B, добавлен шум и обрезка градиентов; ε=9 за одну эпоху.
  • На 4 из 5 тестов MMLU Pro теряет ≤1 % точности по сравнению с базовой.
  • Код и веса открыты: Hugging Face.

by meetpateltech • 12 сентября 2025 г. в 16:14 • 84 points

ОригиналHN

#gemma#differential-privacy#machine-learning#llm#google#hugging-face

Комментарии (16)

  • Google выпустила VaultGemma-1B — «дифференциально-приватную» версию Gemma: веса можно скачать и запустить локально.
  • Обучение с DP-шумом даёт математическую гарантию: вероятность утечки любого конкретного примера ≤ e^ε (ε≈2) + крошечное δ; модель «почти не замечает» отдельные строки.
  • Польза — юридическая защита: слабее иск о нарушении авторского права и меньше рисков PII-утечки, поэтому можно масштабировать данные, включая медицинские или потоки повседневной активности.
  • Пока это скорее PoC и исследование, чем готовый продукт; Google может применять DP и для рекламных моделей.
  • Пользователь получает обычную 1B-модель, но с официальным сертификатом «не запомнила» тренировочные тексты — достаточно для локального запуска без доверия к облаку.

Show HN: Semantic grep for Claude Code (local embeddings) (github.com)

GitHub-репозиторий BeaconBay/ck
Публичный проект без описания.
Кнопки: «Code», «Issues», «Pull requests», «Actions», «Projects», «Wiki», «Security», «Insights».
Последний коммит: 2 года назад.
Язык: C.
Лицензия: отсутствует.

by Runonthespot • 07 сентября 2025 г. в 11:20 • 147 points

ОригиналHN

#rust#tree-sitter#embeddings#vector-search#semantic-search#code-search#baai-bge-small-en-v1.5#gemma#github

Комментарии (60)

  • Утилита ck — это «семантический grep» на Rust: строет локальный векторный индекс файлов и ищет по смыслу, а не только по ключевым словам.
  • Работает через embeddings (BAAI/bge-small-en-v1.5, планируется Gemma), повторное индексирование запускается автоматически при изменении файлов.
  • Поддерживает почти все языки, но для точного семантического чанкинга требуется донастройка tree-sitter; grep-режим остаётся дефолтом.
  • Пользователи жалуются на медленный поиск в больших проектах, отсутствие TypeScript-LSP и «разрезание» эмодзи; README считают «AI-флаффным».
  • Альтернативы: Codanna, Serena, Roo с Qdrant, SemTools; автор приглашает тестеров и PR для доведения до зрелости.

SynthID – A tool to watermark and identify content generated through AI (deepmind.google)

  • Gemini
    • 2.5 Pro, Flash, Flash Image, Flash-Lite — самые мощные модели
  • Gemma
    • Gemma 3, 3n и ShieldGemma 2 — лёгкие open-модели
  • Генеративные модели
    • Imagen, Lyria, Veo — картинки, музыка, видео
  • Эксперименты
    • Project Astra, Mariner, Gemini Diffusion — прототипы

  • Исследования
    • Проекты, публикации, новости

  • Наука с ИИ
    • Биология: AlphaFold, AlphaGenome, AlphaMissense, AlphaProteo
    • Климат: WeatherNext, Weather Lab
    • Математика: AlphaEvolve, AlphaProof, AlphaGeometry
    • Физика/химия: GNoME, Fusion, AlphaQubit
    • Прозрачность: SynthID — водяные знаки для ИИ-контента

  • О нас
    • Новости, карьера, вехи, образование, безопасность, подкаст

by jonbaer • 30 августа 2025 г. в 03:29 • 78 points

ОригиналHN

#gemini#gemma#generative-models#imagen#lyria#veo#alphafold#llm#synthid#watermarking

Комментарии (65)

  • SynthID встрачивает невидимый водяной знак, меняя вероятности токенов при генерации текста.
  • Критика: одиночный фрагмент не детектируется, легко обойти конкурентами, редактирование/шум ломает метку.
  • Пользователи опасаются потери приватности и ложных срабатываний; спор о том, нужно ли вообще помечать AI-контент.
  • Предложены альтернативы: цифровые подписи авторов, C2PA, open-source-детекторы.
  • Обсуждается «гонка вооружений» между генераторами и детекторами, а также возможное регулирование.