Комментарии (68)
- Дискуссия вращается вокруг того, кто несёт ответственность за защиту персональных данных: компания, которая собирает данные, или исследователи, которые хотят получить к ним доступ.
- Участники подчеркивают, что Cambridge Analytica начиналась как «исследовательский» запрос, и что в конечном счёте именно компаниям придётся нести ответственность за злоупотребление данными.
- Поднимается вопрос о том, что если правовая рамка не предусматривает чёткого механизма обмена данными и защиты, то может ли быть этически оправдано, чтобы компании просто отказались предоставлять доступ к данным, даже если это означает нарушение закона.
- Обсуждается, что если данные собираются в рамках американских компаний, то они могут быть использованы для влияния на выборах, и это вызывает вопрос о том, кто должен нести ответственность за последствия такого использования данных.
Llamafile Returns
Mozilla.ai принимает проект llamafile для продвижения открытого, локального, ориентированного на приватность ИИ. Компания обновит кодовую базу, модернизирует основы и формирует дорожную карту с участием сообщества. Llamafile позволяет легко распространять и запускать большие языковые модели локально с помощью одного исполняемого файла, что делает ИИ-технологии более доступными и приватными.
Проект, начатый в 2023 году на базе библиотеки cosmopolitan, теперь официально присоединен к организации Mozilla.ai на GitHub. Компания приглашает пользователей поделиться обратной связью через GitHub Discussion, Discord или Hacker News, чтобы определить наиболее важные функции для следующей версии. "Мы строим следующее поколение llamafile в открытом доступе, и хотим, чтобы наши решения по дорожной карте основывались на ваших реальных потребностях и случаях использования", — отмечают разработчики.
Комментарии (19)
- Mozilla AI запустил проект, который вызвал всплеск энтузиазма и надежд на будущее развитие.
- Сообщество обсуждает, как лучше всего распространять и поддерживать модели, включая предложения использовать llamafile как упаковщик и дистрибьютор.
- Пользователи выразили обеспокоенность судьбой проекта llamafile и его интеграции с Mozilla AI.
- Обсуждается, как сделать так, чтобы модели были более доступны и удобны в использовании, включая идеи о "агентном режиме" и инструментарии для профилирования.
- Участники обсуждают, как лучше всего взаимодействовать с сообществом и поддерживать продукт, включая предложения по улучшению документации и созданию инструментов.
Responses from LLMs are not facts
Статья призывает прекратить цитировать ИИ как авторитетный источник, подчеркивая, что ответы больших языковых моделей — это не факты, а предсказания наиболее вероятных последовательностей слов. ИИ может генерировать убедительную, но потенциально неточную информацию, подобно человеку, который прочитал тысячи книг, но не помнит, где что встречал. Авторы предупреждают против копирования ответов чат-ботов как авторитетных утверждений, отмечая, что это лишь частые сочетания слов, а не истина.
В статье приводится список ресурсов, подтверждающих риски ИИ: исследования Оксфордского университета о вреде ложных ответов в науке, MIT-исследование о чрезмерном доверии к медицинской информации от ИИ, случаи искажения фактов в юридических документах и даже судебные иски к разработчикам ИИ. Эти примеры демонстрируют реальные последствия некритического использования ИИ-генерируемого контента.
Комментарии (119)
- Люди продолжают цитировать LLM без проверки, что подтверждает старую мудрость: «если ты не можешь объяснить, как ты получил результат, ты не понимаешь его».
- Подобно тому, как Wikipedia не является первоисточником, LLM не является таковым, и цитировать их без критической оценки не стоит.
- Сайт «Stop citing AI» — это не столько информативный, сколько самоутверждение для тех, кто уже решил, что LLM не стоит доверия.
- Парадокс в том, что LLM часто прав, но не может объяснить, почему. Это делает его неподходящим для научной цитируемости, но не делает его бесполезным инструментом.
- В конце концов, мы должны научиться критически оценивать, что мы читаем, независимо от того, откуда это пришло.
How the U.S. National Science Foundation enabled Software-Defined Networking
Инвестиции Национального научного фонда США в программно-определяемые сети (SDN) за последние два десятилетия сыграли ключевую роль в революции проектирования и эксплуатации сетей. Эта государственная поддержка позволила исследователям преодолеть инерцию традиционных сетевых архитектур и создать гибкие, управляемые программой решения, которые сегодня используются как в государственном, так и в частном секторах.
Авторы статьи, Ник Маккиоун и Дженнифер Рексфорд, подчеркивают, что именно финансирование NSF позволило превратить академические идеи в коммерчески успешные технологии, изменившие отрасль. Без этой поддержки развитие SDN могло бы занять значительно больше времени или пойти по иному пути. Статья служит примером того, как государственное финансирование фундаментальных исследований может привести к трансформационным инновациям с широким практическим применением.
Комментарии (27)
- История SDN началась с фундаментального исследования, финансируемого NSF, но сегодняшние инвесторы требуют результата за 2-3 года, что делает невозможным повторение такого пути.
- Проект 100x100, который должен был обеспечить 100 Мбит/с для 100 миллионов домов, не достиг цели, но привел к созданию OpenFlow и SDN.
- Вместо того, чтобы строить фундаментальную инфраструктуру, мы теперь имеем гиперскейл облачные провайдеры, которые используют эти идеи в коммерческом контексте.
- Это показывает, что исследовательские идеи могут быть успешно коммерциализированы, но требуют "терпеливого капитала", который сегодня почти исчез.
How to Obsessively Tune WezTerm
Статья посвящена глубокому и детальному тюнингу терминала WezTerm. Автор подробно рассматривает различные аспекты настройки, включая конфигурацию клавиатурных сочетаний, оптимизацию производительности и визуальные кастомизации. Особое внимание уделяется созданию персонализированной рабочей среды с помощью Lua-скриптов, которые позволяют полностью контролировать поведение терминала.
Автор демонстрирует, как добиться максимальной эффективности через тонкую настройку параметров рендеринга, управление сессиями и интеграцию с другими утилитами. В статье представлены практические примеры кода для реализации сложных функций, таких как кастомные обработчики событий, расширенные возможности буфера обмена и интеграция с Git. Читателям предлагается подход к WezTerm не просто как к эмулятору терминала, а как к полноценной рабочей среде.
Автор подчеркивает, что obsessive tuning — это создание эко-системы вокруг терминала, которая минимизирует необходимость переключения между приложениями. Статья завершается советами по поддержанию читаемости конфигурационного файла при его постоянной доработке.
Комментарии (52)
- Пользователи обсуждают преимущества и недостатки WezTerm, включая его кроссплатформенность, конфигурация на Lua, мультиплексирование и поддержку графики, но также отмечают проблемы с производительностью, стабильностью и отсутствием поддержки на некоторых системах.
- Некоторые пользователи жалуются на баги, включая проблемы с изменением размера панели, вылеты при использовании мультиплексора и отсутствие скроллбара.
- Обсуждается влияние отсутствия активной разработки на стабильность и перспективы проекта.
- Участники обмениваются советами по конфигурации и скриптами, включая настройку цветов, шрифтов и других параметров.
- Некоторые пользователи сравнивают WezTerm с другими терминалами, такими как iTerm2, Kitty и Alacritty, и обсуждают их преимущества и недостатки.
Комментарии (13)
- Подтверждение воспроизводимых сборок (reproducible builds) вызывает у участников противоположные реакции: от признания важности до обвинений в растрате ресурсов.
- Некоторые участники подчеркивают, что такие сборки защищают от теоретических угроз, которые могут быть не более чем гипотетическими.
- Подчеркнуто, что если бы кто-то смог внедрить вредоносный код в процесс сборки, то эти логи позволили бы это обнаружить.
- Представлен инструмент sourcespotter для отслеживания исходников.
- В то же время, обсуждение выявило, что не все разделяют убеждение в ценности или приоритете таких усилий, считая их растратой ресурсов на защиту от гипотетических угроз.
Uv is the best thing to happen to the Python ecosystem in a decade 🔥 Горячее 💬 Длинная дискуссия
Инструмент uv, созданный компанией Astral, представляет собой революционное решение для управления Python-проектами, которое, по мнению автора, является лучшим событием в экосистеме Python за последнее десятилетие. Написанный на Rust, он обеспечивает поразительную скорость работы и объединяет в себе установку Python-версий, управление пакетами, создание виртуальных сред и быстрое разрешение конфликтов зависимостей.
Установка uv осуществляется через простую однострочную команду для Linux/Mac или Windows, и она не затрагивает существующие Python-установки. Основной рабочий процесс включает использование uv init для создания нового проекта с файлом pyproject.toml, uv sync для настройки окружения с зависимостями, и uv run для выполнения команд в правильном виртуальном окружении. Команда uv add позволяет легко добавлять пакеты с указанием версий, а uv python pin фиксирует конкретную версию Python для проекта.
Главное преимущество uv заключается в его исключительной скорости и удобстве, значительно упрощая процессы, которые раньше требовали множества шагов и вызывали сложности при синхронизации окружений между коллегами. Инструмент создает файл uv.lock с точными версиями всех пакетов, обеспечивая воспроизводимость окружений на любой платформе.
Комментарии (1154)
- uv и его команда Astral продвинули экосистему Python вперёд, но вызывают вопросы о монополизации и коммерциализации.
- uv делает многое, но не всё: он не решает проблему CUDA-версий, не умеет в conda-эквивалент
conda list --explicit, и не может быть установлен безопасно, если вы не используетеpip install uv. - Некоторые пользователи всё ещё предпочитают pip/venv, особенно в контексте Docker и CI, где uv может быть нестабилен.
- Но для многих разработчиков, особенно в ML и data science, uv стал незаменимым инструментом, который делает их жизнь проще.
Extropic is building thermodynamic computing hardware
Extropic разрабатывает термодинамическое вычислительное оборудование, радикально более энергоэффективное, чем GPU. Их термодинамические сэмплерные блоки (TSU) по своей сути вероятностны, идеально подходящие для вероятностных ИИ-нагрузок. Компания представила платформу прототипа XTR-0, обеспечивающую низколатентную связь между чипами Extropic и традиционными процессорами, а также выпустила открытую библиотеку Python THRML для разработки термодинамических алгоритмов.
Технология Extropic основана на принципах термодинамики, что позволяет создавать принципиально новый тип вычислительного оборудования. Компания активно участвует в конференциях, посвященных искусственному интеллекту и глубоким технологиям, демонстрируя свой подход к созданию более эффективных вычислительных систем для будущего ИИ.
Комментарии (91)
- Extropic представляет собой аппаратный генератор случайных чисел, который, по заявлениям, может быть более энергоэффективен для узкого класса задач, таких как денойзинг в диффузионных моделях.
- Участники обсуждения подчеркивают, что это не просто "железо", а целый стек технологий, включая новый подход к вычислениям, который может быть применим к обучению и выводу больших языковых моделей.
- Некоторые участники выражают скепсис в отношении того, что продукт может быть использован для обучения больших моделей, и что он может быть совместим с существующими стеком технологий.
- Обсуждение также касается вопроса о том, насколько продукт может быть полезен для обучения больших моделей, и о том, что может быть последствиями для существующих предобученных моделей.
Dithering – Part 1 🔥 Горячее
Дизеринг — это техника создания иллюзии оттенков с ограниченной палитрой путём стратегического расположения пикселей. Вместо простого сопоставления каждого пикселя ближайшему доступному цвету (чёрному или белому), что создаёт резкие переходы, дизеринг использует специальные узоры из чёрных и белых пикселей для имитации полутонов. В тёмных областях пиксели чёрные более плотные, в светлых — белые.
Одним из методов упорядоченного дизеринга является использование карты пороговых значений — сетки яркости от 0 (самый тёмный) до 1 (самый светлый). Каждый входной пиксель сравнивается с соответствующим порогом: если его яркость превышает порог, он становится белым, иначе — чёрным. Эти узоры с разной плотностью чёрных и белых пикселей создают иллюзию оттенков при просмотре на расстоянии. Это первая часть трёхсерийного материала, где автор планирует подробно рассмотреть алгоритмы создания карт порогов и метод распространения ошибки.
Комментарии (86)
- Обсуждение охватывает как классическое определение дитеринга как технику, так и его восприятие как «иллюзию» оттенков, а также затрагивает практические инструменты и библиотеки.
- Участники обсуждают, что такое дитеринг, как он отличается от полутоновой печати и какие есть инструменты для работы с палитрами и дитерингом.
- Некоторые участники делятся ссылками на инструменты и библиотеки, такие как Dithermark, Squoosh, SLK-img2pixel и другие.
- Обсуждается, что такое дитеринг и как он используется в графическом дизайне и в каких контекстах он применяется.
- Участники также обсуждают, что такое палитра и как она используется в дитеринге, а также затрагивается вопрос о том, какие есть инструменты для работы с палитрами и дитерингом.
The Internet runs on free and open source software and so does the DNS
Бесплатное и открытое программное обеспечение (FOSS) является фундаментом интернета, особенно в системе доменных имен (DNS). ICANN опубликовал документ SAC132, подчеркивающий, что FOSS не просто распространен в DNS, а является его неотъемлемой частью, от регистрации доменов до их извлечения. По мере разработки новых кибербезопасностей по всему миру, решения, принимаемые сегодня, напрямую повлияют на безопасность и устойчивость интернета завтра.
SAC132 предоставляет нетехнические рекомендации для политиков, чтобы новые регулирования укрепляли, а не ослабляли эту критическую инфраструктуру. Отчет включает четкие основы DNS, анализ кибербезопасности в США, Великобритании и ЕС, а также практические рекомендации по поддержке FOSS как краеугольного камня глобальной связности. Авторы призывают всех заинтересованных прочитать полный отчет и участвовать в обсуждении на ICANN84 в Дублине.
Комментарии (42)
- Обсуждение началось с идеи, что доступ к знаниям и инфраструктуре должен быть свободен и доступен всем, как в садоводстве и чтении книг, но в реальности всё это оказывается платным и ограниченным.
- Участники обсудили, что крупные технологические компании, такие как Microsoft, Google и Amazon, используют FOSS для DNS-резолвинга, но при этом не предоставляют альтернативы и не поддерживают открытые стандарты.
- Была поднята тема, что доменные имена и криптовалюты, которые продвигаются как "владение", на самом деле не дают никакого контроля и могут быть отняты без суда или предупреждения.
- Также обсуждалось, что в отличии от физического мира, где существуют альтернативные и открытые решения, в цифровом пространстве эти альтернативы не могут быть использованы из-за централизации и монополии.