Our investigation into the suspicious pressure on Archive.today 🔥 Горячее 💬 Длинная дискуссия
—
Комментарии (423)
- AdGuard разоблачил WAAD, выявив, что их сайт использует бесплатный шаблон с минимальными правками, а хостинг зарегистрирован в январе 2025 года.
- Участники сомневаются в легитимности WAAD из-за отсутствия юридического лица и подозрительной тактики с ложными заявлениями о CSAM.
- Обсуждается давление на инфраструктуру (DNS-провайдеры), что создает опасный прецедент для цензуры и блокировок.
- Связь расследования FBI с archive.today вызывает спекуляции о политических мотивах или попытках скрыть компрометирующие данные.
- Подчеркивается важность архивов для сохранения истории и риски блокировок для свободы информации.
Комментарии (83)
Their video on YouTube, in English: https://www.youtube.com/watch?v=9vW12gQ4Klc These guys are quite well-known in China and have recently started uploading tto Youtube as well. Their videos are quite entertaining and have extremely high production value compared to many other cr
Spec-Driven Development: The Waterfall Strikes Back 💬 Длинная дискуссия
Spec-Driven Development (SDD) возрождает подход Waterfall с подробной документацией перед кодированием. Хотя он обещает структуру для ИИ-программирования, рискует погребать гибкость под слоями Markdown. Инструменты вроде Spec-Kit, Kiro и Tessl генерируют спецификации в виде Markdown-файлов, где даже простая функция может требовать 8 файлов и 1300 строк текста.
Процесс SDD создает цепочку документов: от первоначального запроса через спецификации к плану реализации и списку задач. Эти документы затем передаются кодирующему агенту (Claude Code, Cursor, Copilot), который должен написать качественный код. Однако автор сомневается, что такой формальный подход лучше подходит для современной разработки, предлагая вместо этого более итеративный подход с использованием естественного языка.
Комментарии (155)
- Спор вокруг Spec-Driven Development (SDD) в контексте LLM: одни считают, что спецификация — это лишь «точка входа» для модели, другие же видят в ней водопадную модель разработки.
- Сторонники SDD подчеркивают, что спецификация позволяет избежать «vibe-coding» и снижает количество багов, а критики указывают на то, что писать спецификации сложнее, чем код, и что она не покрывает итеративную разработку.
- Обсуждение затронуло TDD и Event-B как смежные практики, а также подняло вопрос о том, как именно спецификация должна выглядеть: как полноценный документ или как краткий конспект.
Комментарии (75)
- Боты-сканеры ищут уязвимости через PHP-файлы, а не скрапят контент, и часто прерывают запросы после получения HTTP-кода.
- Для борьбы используются методы: блокировка по заголовкам (например, отсутствие Accept-Language), honeypots с ложными файлами, генерация бесполезных данных (Nepenthes) или zip-бомбы.
- Этический спор: публичный контент доступен для скрапинга, но агрессивные боты создают нагрузку на серверы, а AI-скраперы воруют контент без отдачи владельцам.
- Эффективные стратегии: фильтрация по User-Agent, возврат ошибок (418 I'm a teapot), ограничение доступа по регионам или использование fail2ban/crowdsec.
- Проблема AI-скраперов: они могут "отравлять" модели мусором, но их защита сложнее из-за обхода мер (например, residential-IP).
A graph explorer of the Epstein emails 🔥 Горячее
—
Комментарии (70)
- Обсуждение показало, что визуализация и анализ больших наборов данных (включая электронные письма, документы и т.д.) может быть полезен для журналистов и исследователей, но при этом вызывает вопросы о конфиденциальности, этике и ответственности.
- Участники обсуждали, что такие инструменты могут быть использованы для "вычисления" связей между людьми и событиями, что может быть использовано как для обнаружения преступлений, так и для их сокрытия.
- Также обсуждались технические аспекты, такие как выбор между RDF и property graph, производительность и маштабируемость, и как сделать такие инструменты доступными для широкой общественности.
- Участники также обсуждали, что такие инструменты могут быть использованы для "вычисления" связей между людьми и событиями, что может быть использовано как для обнаружения преступлений, так и для их сокрытия.
- В конце обсуждения было отмечено, что несмотря на все вышеупомянутое, такие инструменты могут быть полезны для журналистов и исследователей, если они будут использованы ответственно и этично.
TCP, the workhorse of the internet 🔥 Горячее
TCP — невидимый герой интернета, обеспечивающий надежную передачу данных вопреки его ненадежности. В то время как IP-адрес доставляет пакеты на нужный компьютер, TCP через порты направляет их правильным приложениям, как письма в квартиры одного здания. Протокол скрывает от разработчиков хаос сети: потерю, повреждение, дублирование и переупорядочивание пакетов, позволяя приложениям просто работать.
Ключевые механизмы TCP — контроль потока и перегрузки — предотвращают коллапс сети. Контроль потока через буфер приема и "окно" определяет, сколько данных может обработать получатель. Контроль перегрузки избегает повторной отправки потерянных пакетов, усугубляющих congestion collapse. В 1986 году интернет замедлился до 40 бит/с из-за этой проблемы. TCP с механизмами "back off" спасает сеть от саморазрушения, позволяя нам наслаждаться стабильным соединением.
Комментарии (149)
- TCP считается оптимальным решением для надежного потока данных над ненадежным дейтаграммным уровнем, но имеет ограничения: маленькое окно для современных скоростей и проблемы с безопасностью.
- Альтернативы (SCTP, QUIC, RUDP) обсуждаются как решения для мультиплексирования потоков и улучшения производительности, но сталкиваются с проблемами поддержки и сложности.
- Технически возможно создание собственных протоколов поверх IP, но маршрутизаторы и NAT часто требуют TCP/UDP или блокируют другие протоколы.
- Простота TCP объясняется ограничениями старых компьютеров, а управление перегрузкой тогда было неочевидным решением.
- HTTP/3 (QUIC) набирает популярность как замена TCP для веба, но его сложность вызывает опасения.
Designing a Language (2017)
Проектирование языка программирования — это итеративный процесс, включающий четыре фазы, которые необходимо повторять многократно. При реализации компилятора часто обнаруживается, что некоторые части языка спроектированы некорректно, что требует возврата к предыдущим этапам. Успех в создании языка зависит от глубоких знаний в трех ключевых областях: программных парадигмах (императивной, декларативной, объектно-ориентированной и др.), концепциях языков (последовательность выполнения, типизация, параллелизм и др.) и знакомстве с существующими языками. Автор рекомендует изучить десятки языков — от Python и Smalltalk до Haskell и Rust, а также ознакомиться с классическими работами по проектированию языков.
Комментарии (100)
- Предложение включить Raku в список языков из-за встроенных грамматик для парсинга и объектно-ориентированной природы.
- Вопросы о компиляции целевых языков, их пайплайне сборки и контексте выполнения.
- Размышления о создании нового языка: необходимость, наличие ресурсов/команды, сроки выпуска MVP.
- Критика исходного материала как "AI slop", рекомендация использовать "programming language checklist".
- Споры об AI-происхождении текста (находки 2017 года) и упоминание забавного элемента (SnekQL).
Комментарии (53)
- Пользователи обсуждают, что Grafana/Prometheus-стек не масштабируется без Kafka и требует постоянной переработки, что делает его неподходящим для большинства пользователей, и что Grafana отказывается открытым исходникам.
- Сообщество отмечает, что Grafana не предоставляет удобной замены для Loki, Prometheus и Tempo, что делает его незаменимым, и что Grafana не предоставляет удобной замены для Tempo.
- Участники обсуждают, что Grafana не предоставляет удобной замены для Loki, Prometheus и Tempo, что делает его незаменимым, и что Grafana не предоставляет удобной замены для Tempo.
- Участники обсуждают, что Grafana не предоставляет удобной замены для Loki, Prometheus и Tempo, что делает его незаменимым, и что Grafana не предоставляет удобной замены для Tempo.
- Участники обсуждают, что Grafana не предоставляет удобной замены для Loki, Prometheus и Tempo, что делает его незаменимым, и что Grafana не предоставляет удобной замены для Tempo.
Vortex: An extensible, state of the art columnar file format
Vortex — это современный расширяемый столбчатый формат файлов, который теперь развивается как проект на стадии инкубации в LFAI&Data под эгидой Linux Foundation. Изначально технология создавалась в SpiralDB, а теперь перешла под крыло некоммерческой организации, что говорит о зрелости проекта и его потенциале для стандартизации в индустрии.
Проект позиционируется как передовое решение для эффективного хранения и обработки больших данных, используя преимущества столбчатой организации для ускорения запросов и экономии места. Статус инкубационного проекта в Linux Foundation подразумевает активное развитие и открытость для вклада со стороны сообщества, что может ускорить его принятие в экосистеме больших данных.
Комментарии (21)
- Vortex формат файлов предназначен для быстрого чтения и записи на GPU, но не является конкурентом Delta Lake и Iceberg, а скорее дополняет их.
- Vortex не является табличным форматом, в отличие от Delta Lake и Iceberg, и поэтому не сравним с ними напрямую.
- Vortex может быть полезен для ускорения обучения моделей, но не для хранения данных в продакшене.
- Vortex не является форматом для хранения данных, а скорее форматом для обучения моделей.
Samsung's 60% DRAM price hike signals a new phase of global memory tightening 🔥 Горячее 💬 Длинная дискуссия
—
Комментарии (381)
I'm so mad about this, I need DDR5 for a new mini-PC I bought and prices have literally gone up by 2.5x..128GB used to be 400$ in June, and now it's over $1,000 for the same 2x64GB set..I have no idea if/when prices will come back down but it sucks. All I can say is,- the insane