Hacker News Digest

Обновлено: 28 ноября 2025 г. в 08:55

Постов: 4635 • Страница 397/464

T-Mobile claimed selling location data without consent is legal–judges disagree (arstechnica.com) 🔥 Горячее

  • Апелляционный суд США подтвердил штраф $92 млн для T-Mobile за продажу данных о местоположении абонентов без согласия.
  • FCC оштрафовала T-Mobile, AT&T и Verizon за передачу реального местоположения посредникам LocationSmart и Zumigo; злоупотребления стали известны в 2018 г.
  • Суд: каждый смартфон — трекер, данные раскрывают «интимные детали жизни»; операторы не проверяли согласие и не ввели защиту после инцидентов.
  • T-Mobile и Sprint не отрицали фактов, но заявляли, что FCC превысила полномочия; суд признал штрафы законными.
  • Решения по апелляциям AT&T и Verizon ещё не вынесены.

by Bender • 18 августа 2025 г. в 19:25 • 297 points

ОригиналHN

#t-mobile#att#verizon#fcc#location-data#privacy#mvno#google-fi

Комментарии (72)

  • Пользователи в шоке: даже после отключения всех доступных опций в личном кабинете T-Mobile/ATT/Verizon данные о местоположении всё равно утекают и спам-связанные звонки «догоняют» человека по дороге.
  • Оказалось, что в настройках T-Mobile появились новые пункты «профилирование и автоматические решения», которые снова включены по умолчанию; приходится отключать дважды.
  • MVNO (Google Fi, Mint и др.) не дают прямого доступа к настройкам T-Mobile, поэтому полностью отказаться от трекинга нельзя.
  • Единственные практические советы: включать «режим полёта + Wi-Fi», использовать «фарадеевы» чехлы или возвращаться к крупным операторам ради встроенных фильтров спама.
  • Участники считают, что рынок США по сути является естественной монополией: спектр регулируется FCC, а мелкие игроки не могут конкурировать; проблему можно решить только через государственное регулирование и разделение инфраструктуры от сервиса.

Show HN: Chroma Cloud – serverless search database for AI (trychroma.com)

Chroma Cloud — серверлес-база поиска с открытым исходным кодом: быстро, дёшево, масштабируемо, надёжно.

Возможности

  • Векторный, полнотекстовый и мета-поиск
  • Форк коллекций
  • Скоро: автоматическая синхронизация данных

Производительность

  • Низкая латентность, высокий QPS
  • Линейное масштабирование данных
  • Хранение в объектном хранилище

DevEx

  • Оплата по факту использования
  • Веб-дашборд, CLI, локальная разработка
  • Интеграция в CI/CD

Как начать

pip install chromadb
import chromadb
client = chromadb.CloudClient()
collection = client.get_or_create_collection("my_docs")
collection.add(
    documents=["Hello, world!", "Chroma is cool"],
    metadatas=[{"src": "demo"}, {"src": "demo"}],
    ids=["d1", "d2"]
)
print(collection.query(query_texts=["hello"], n_results=1))

Документация | Бесплатный старт

by jeffchuber • 18 августа 2025 г. в 19:20 • 86 points

ОригиналHN

#chroma#chromadb#vector-search#full-text-search#llm#python#serverless#cloud#rag#apache-2.0

Комментарии (27)

  • Пользователи спрашивают, почему «open-source» просит деньги: ответ — сам Chroma под Apache 2.0 и бесплатен при самостоятельном развёртывании, а платная версия — это управляемый Chroma Cloud.
  • Chroma поддерживает комбинированный поиск: фильтрацию по метаданным (category=X AND value>Y) + векторное сходство.
  • Некоторые считают, что продукт и калькулятор цен слишком похожи на Turbopuffer; команда Chroma отвечает, что архитектуру обсуждали публично два года и уважают конкурентов.
  • Для нетехнических пользователей Chroma решает задачу «R» в RAG: позволяет LLM «на лету» подтягивать нужные данные без дообучения модели.
  • Стартапам предлагают помощь: совместное планирование, Slack-канал и персональная поддержка.
  • Отличия от pgvector/Redis: собственные индексы (SPANN, SPFresh), шардирование, масштабирование, встроенный regex и trigram-поиск без нагрузки на основную БД.
  • По сравнению с Qdrant Chroma позиционируется как «0 конфигураций и 0 операционной боли».

Комментарии (68)

  • Участники обсуждают «духовного наследника The Sims», где LLM-агенты создают непредсказуемые, но логичные стратегии и социальную динамику.
  • Разработчики подтверждают, что игра началась как продукт и «повернула» в сторону игры; геймплей пока состоит из мини-игр с разными целями.
  • Поднимаются вопросы: как удержать LLM от «схода с рельсов», как задать уровень сложности и не перегрузить игру вычислениями.
  • Часть игроков хочет полного контроля над промптами и локальных моделей, другие опасаются лишних подписок и «генеративной угарности».
  • Побочные темы: баг с ToS, низкий звук в видео, отсутствие Linux-сборки и ностальгия по DXBall.

How to Think About GPUs (jax-ml.github.io) 🔥 Горячее

Что такое GPU
Современная ML-GPU (H100/B200) — это ~100–150 независимых вычислительных блоков (SM), каждый из которых содержит матричное ядро Tensor Core, векторные ALU (CUDA-ядра) и 256 КБ кэш SMEM. Все SM делят общий L2 и HBM3-память. SM разбит на 4 подблока; каждый подблок выполняет 32 SIMD-операции за такт. GPU-ядро менее мощное, чем TPU TensorCore, но их много, поэтому общая гибкость выше.

Память
H100: 80 ГБ HBM3, 3 ТБ/с. B200: 192 ГБ, 8 ТБ/с. L2 кэш 50 МБ (H100) / 128 МБ (B200). SMEM даёт 256 КБ на SM.

GPU vs TPU на уровне чипа
TPU: 1–2 больших MXU, жёсткая синхронизация, векторная часть слабее. GPU: 100+ мелких ядер, независимые SM, но общий L2 ограничивает масштаб. GPU лучше для разнородных задач, TPU — для чистых матмул.

Сеть внутри узла
Узел = 8 GPU + 2 CPU. GPU соединены NVLink/NVSwitch (900 ГБ/с между любыми двумя). CPU-GPU идут через PCIe 5.0 (64 ГБ/с). NVSwitch-кроссбар внутри узла = полносвязная сеть.

Сеть за пределами узла
InfiniBand HDR/NDR (до 400 Гб/с) или Ethernet RoCE. GPUDirect RDMA позволяет GPU читать/писать память соседнего узла без участия CPU.

Коллективные операции
Intra-node: NCCL использует NVLink; all-reduce 8×H100 за ~3 мкс.
Cross-node: кольцо IB + NVLink; latency ~10 мкс, bandwidth лимит IB.

Roofline-модель для LLM

  • Data Parallelism: ограничен IB; эффективен при малых моделях.
  • Tensor Parallelism: ограничен NVLink; лучше внутри узла.
  • Expert/ Pipeline Parallelism: комбинируем; pipeline глубже → меньше bubble, но больше весов на каждом GPU.
  • TLDR: держи параллелизм так, чтобы IB не стал bottleneck; используй NVLink для tensor-parallel, IB для data-parallel.

Итого
GPU — это масса мелких, независимых SM, связанных быстрым NVLink внутри узла и медленным IB между узлами. Для LLM выбирай параллелизм, который минимизирует IB-трафик и максимально использует NVLink.

by alphabetting • 18 августа 2025 г. в 18:18 • 354 points

ОригиналHN

#gpu#tpu#cuda#nvlink#infiniband#roce#nvidia#parallel-computing#machine-learning

Комментарии (107)

  • Критика точности: документация местами неточна, особенно в определении «CUDA-core».
  • Открытость и вендор-лок: ряд участников считают инвестиции в проприетарную экосистему NVIDIA рискованной ставкой.
  • Ошибка в расчётах: Quiz 2 преувеличивает пропускную способность; реальные 3,2 ТБ/с ограничены портами NIC.
  • Похвала и польза: серия всё же хорошо объясняет принципы параллелизма, применимые и к другим устройствам.
  • Сравнение TPU и GPU: TPU проще масштабировать, но закрыт для продажи; GPU NVIDIA гибче, но сложнее в программировании.
  • Дефицит официальных данных: NVIDIA не раскрывает полную архитектуру, поэтому полезные модели приходится собирать из сторонних источников.

How much do electric car batteries degrade? (sustainabilitybynumbers.com)

  • Основной вывод: после 320 тыс. км большинство электромобилей сохраняют ≥80 % ёмкости аккумулятора.
  • Типы старения:
    • Календарное — 1–2 % в год даже при простое, усиливается в жаре.
    • Цикловое — потери при зарядке/разрядке из-за механического напряжения и роста SEI-слоя.
  • Динамика: быстрая потеря первые 30 тыс. км, затем линейное замедление.
  • Факторы, ускоряющие деградацию: высокие температуры, постоянная зарядка до 100 % или разрядка до 0 %.
  • Советы для замедления:
    • Держать SoC между 20–80 %.
    • Избегать частых «быстрых» зарядок.
    • Парковать в тени/прохладе.
  • Практика: Tesla Model S/X на 320 тыс. км теряют в среднем 12 %, Model 3/Y — 10 %.
  • Гарантии: большинство производителей покрывают ≥70 % ёмкости 8 лет или 160 тыс. км.

by xnx • 18 августа 2025 г. в 17:53 • 95 points

ОригиналHN

#electric-vehicles#batteries#tesla#nissan-leaf#battery-degradation#lifepo4#battery-management#state-of-charge

Комментарии (143)

  • Реальная деградация батарей EV оказалась меньше страхов: после 150–200 тыс. миль Tesla держит ≥80 % ёмкости, а гарантии 8–10 лет/100 тыс. миль покрывают 70 %.
  • Проблема не столько в «химии», сколько в инженерии: старые Leaf без тепло-менеджмента теряют до 16 % за 6 лет, новые машины с жидкостным охлаждением и LFP-ячейками живут дольше.
  • Страх «последних 20 %» дальности владельцы считают критичным: при холоде или отсутствии зарядок каждая потерянная миля превращается в риск остаться без энергии.
  • Гарантии часто нетрансферны и не спасают цену на подержанные EV: даже 60 % ёмкости после 8 лет делает машину «неликвидной».
  • На практике EV-аккумуляторы переживают кузова и другие узлы: у одного Model S за 10 лет всё заменили, кроме батареи (85 % осталось), а у Prius 2010 года Ni-MH-батарея отходила 190 тыс. миль.

Left to Right Programming (graic.net) 🔥 Горячее 💬 Длинная дискуссия

Программа должна оставаться валидной по мере набора.
Python-списковые включения плохи: пока вы не допишете for line in text.splitlines(), редактор не знает тип line, не может подсказать split() и даже не понимает, существует ли переменная.
В Rust text.lines().map(|line| line.split_whitespace()) строится слева-направо: сразу после line. доступны методы, и код всё время «жив».

Принцип progressive disclosure: сложность появляется ровно тогда, когда нужна. В C функции для FILE* начинаются на f; вводишь f и видишь сотни вариантов, не понимая, какой подходит. В идеале file. показал бы read, close и т. д. прямо во время набора.

Python и JS:

map(len, text.split())

— неясно, как называется длина (len, length, size?).

text.split(" ").map(w => w.length)

length и map подсказываются сразу после точки.

С ростом логики читаемость падает:

len(list(filter(lambda line: all([abs(x) >= 1 and abs(x) <= 3 for x in line]) ...

by graic • 18 августа 2025 г. в 17:08 • 406 points

ОригиналHN

#python#rust#javascript#ide#syntax#functional-programming#autocompletion#language-design

Комментарии (323)

  • Обсуждение вращается вокруг идеи «слева-направо» синтаксиса: сначала контекст (объект, коллекция), потом действие, чтобы IDE могла мгновенно подсказывать.
  • Критикуют Python- comprehensions и вложенные вызовы за «вправо-налево» порядок, мешающий автокомплиту и чтению.
  • Многие хотят pipe-оператор (|>) или uniform call syntax, как в F#, Elixir, Nim, чтобы цепочки выглядели data |> filter(...) |> map(...).
  • Противники считают, что язык не должен подстраиваться под автокомплит, а сложные цепочки лучше выносить в переменные или использовать методы.
  • Примеры из SQL, JS/TS импортов, Rust for-loops и C# LINQ показывают ту же проблему: сначала надо указать, что ты хочешь получить, а потом — откуда.

Show HN: Whispering – Open-source, local-first dictation you can trust (github.com) 🔥 Горячее

Whispering — микросервис в репозитории epicenter-so/epicenter, каталог apps/whispering.
Предназначен для быстрого распознавания речи через OpenAI Whisper: принимает аудио-файл, возвращает текст.

Ключевые файлы

  • main.py — FastAPI-endpoint /transcribe (POST, multipart/form-data).
  • requirements.txtfastapi, uvicorn, openai-whisper.
  • Dockerfile — лёгкий образ на python:3.11-slim, порт 8000.

Запуск

docker build -t whispering .
docker run -p 8000:8000 whispering

или

pip install -r requirements.txt
uvicorn main:app --host 0.0.0.0 --port 8000

Использование

curl -F "file=@audio.mp3" http://localhost:8000/transcribe

Ответ: {"text": "распознанный текст"}.

by braden-w • 18 августа 2025 г. в 16:52 • 532 points

ОригиналHN

#python#fastapi#uvicorn#openai-whisper#docker#sqlite#local-first#speech-recognition#microservices#github

Комментарии (135)

  • Пользователи делятся «костыльными», но рабочими схемами диктовки на Linux и обсуждают, как локально запускать Whisper/Parakeet без облаков.
  • Epicenter продвигает идею «local-first»: plaintext + SQLite, прозрачные данные, открытый код, совместимые инструменты.
  • Постоянно сравнивают альтернативы (VoiceInk, Superwhisper, Wispr Flow, Willow, whishper, Vibe) и жалуются на подписки, задержки, качество и отсутствие разметки динамиков.
  • Разработчик Epicenter уже добавляет whisper.cpp и планирует Parakeet; просит помощи в PR для ускорения.

How Not to Buy a SSD (andrei.xyz)

Месяц назад купил iMac 2006, поставил «Kingston»-SSD — система упала, скорость упала до 600 КБ/с. «Починка диска» подняла до 2,6 МБ/с — всё равно мало. Подозрение: подделка. Коробка и корпус настоящие, но наклейка сзади печатается плохо.

Установил f3, начал тест — диск умер, форматировать нельзя. Вероятно, внутри перепрошитый 128-ГБ Kingston, проданный как новый. Жду ответа магазина; если не примут возврат, вскрою и посмотрю, что внутри.

by speckx • 18 августа 2025 г. в 16:49 • 138 points

ОригиналHN

#ssd#hardware#storage#amazon#ebay#aliexpress#kingston#intel#f3

Комментарии (131)

  • Amazon и другие маркетплейсы перестали быть безопасными: из-за sku-pooling и смешанных складов даже товары «sold by Amazon» могут оказаться подделкой.
  • Пользователи регулярно получают фальшивые SSD/HDD с поддельными SMART-данными, внешне идентичные оригиналам; возврат затруднён, т.к. листинги «переписываются» под дешёвые товары.
  • eBay, AliExpress, eMag и другие площадки завалены «4 ТБ»-накопителями на 100 ГБ реальной флэш-памяти; при превышении объёма диски просто умирают.
  • Надёжнее покупать напрямую у вендора, в Micro Center, B&H или использовать б/у enterprise-SSD (Intel S3700 и др.) — их не подделывают и они живут дольше потребительских.
  • Для проверки новых накопителей рекомендуют утилиты ValiDrive, f3/f3fix и взвешивание — фейки часто легче.

Miles from the ocean, there's diving beneath the streets of Budapest (cnn.com)

Подземный дайвинг в Будапеште

В центре Будапешта, забытые тёплые источники превратились в уникальные места для дайвинга. Красочные пещеры, арочные залы и прозрачная вода ждут под улицами города.

Molnár János-шпиль

  • 30 °C термальная вода, видимость до 30 м.
  • Лабиринты тоннелей, сталактиты, рыбы и черепахи.
  • Сертификат Open Water и бронь заранее.

Kőbánya Mines

  • Старые известняковые катакомбы, 5–20 м глубина.
  • Подводные «улицы» и шахтные колодцы.
  • Требуется продвинутый уровень.

Где ещё

  • Lake Malom-tó – затопленный карьер с руинами.
  • Lake Budaörs – искусственное озеро для тренировок.

Как добраться

  • Molnár János: 20 мин на метро до станции Déli, затем пешком.
  • Kőbánya: 30 мин на метро до Köbánya-Kispest, такси 5 мин.

Советы

  • Вода 28–30 °C, 5–7 мм костюм.
  • Прокат оборудования на месте.
  • После дайвинга – термальные купальни Сечени или руин-бары.

by thm • 18 августа 2025 г. в 16:42 • 133 points

ОригиналHN

#diving#caving#scuba-diving

Комментарии (32)

  • Пользователи обсуждают редкость тёплых пещер: европейский взгляд противопоставляется Юкатану, где вода в ценотах тёплая, а вход прохладный (~21 °C).
  • Опытные и бывшие пещерные дайверы делятся воспоминаниями о шахтах Дубник в Венгрии и опасностях — запутанность, взмученная грязь, потеря линии.
  • Большинство соглашается: активность требует стальной нервы, дисциплины и точности; многие считают её кошмарной.
  • Техника почти не изменилась: баллоны всё так же стальные/алюминиевые, углепластиковые редки.
  • Некоторые всё же находят пещерные погружения привлекательными при наличии линий, тёплой воды и контролируемых условий.

My Retro TVs (myretrotvs.com)

MyRetroTVs
Для работы приложения включите JavaScript.

by the-mitr • 18 августа 2025 г. в 16:40 • 122 points

ОригиналHN

#javascript#raspberry-pi#nostalgia

Комментарии (21)

  • Пользователи делятся воспоминаниями и проектами по «оживлению» старых телевизоров на базе Raspberry Pi и сайтам вроде EXPTV.
  • Отмечают ностальгию по ограниченному эфиру, «щелчку» переключения каналов и даже звуку размагничивания.
  • Рекламы и новости 9/11 вызывают особые эмоции, подчеркивая, как медиа формируют «разные реальности» в разные годы.
  • Канадский музей MZTV в Торонто и виртуальные туры рекомендуются для «настоящего» погружения.
  • Мобильная версия сайта вызывает затруднения, но это не мешает «залипать» на часы.