Hacker News Digest

Обновлено: 28 ноября 2025 г. в 08:55

Постов: 4635 • Страница 274/464

Llama-Factory: Unified, Efficient Fine-Tuning for 100 Open LLMs (github.com)

LLaMA-Factory — это унифицированный инструмент для эффективной тонкой настройки более 100 языковых и визуально-языковых моделей, представленный на ACL 2024. Он позволяет разработчикам адаптировать модели под конкретные задачи с минимальными затратами ресурсов, поддерживая популярные архитектуры вроде LLaMA и Mistral, а также многомодальные модели.

Инструмент предлагает гибкие методы обучения, включая LoRA и полную настройку параметров, и работает с различными аппаратными конфигурациями, от одного GPU до распределённых кластеров. Это значительно упрощает эксперименты и развёртывание кастомизированных моделей, экономя время и вычислительные мощности.

by jinqueeny • 18 сентября 2025 г. в 23:48 • 105 points

ОригиналHN

#llama#mistral#lora#rl#gpu#nvidia#text-to-sql#fine-tuning#github#llm

Комментарии (15)

  • Обсуждаются возможности и библиотеки для тонкой настройки (SFT), предобучения и RL-тренировки больших языковых моделей, включая LLaMA Factory и сравнение с Unsloth.
  • Подчёркивается важность качественного подбора данных и аппаратного обеспечения (например, 8xH200 или A100 для серьёзных задач, потребительского GPU для меньших моделей).
  • Отмечается практическая пользя тонкой настройки для создания узкоспециализированных моделей под конкретные задачи (например, text-to-SQL), способных конкурировать с большими hosted-моделями.
  • Упоминаются альтернативные инструменты и подходы, такие как Axolotl для потребительского железа, Oumi (с синтезом данных и LLM-as-a-Judge) и коммерческие решения типа Nvidia NIM.
  • Высказываются критические замечания о поддержке конкретных моделей (например, Deepseek) и локализации документации.

Want to piss off your IT department? Are the links not malicious looking enough? (phishyurl.com) 🔥 Горячее 💬 Длинная дискуссия

Этот инструмент превращает любую ссылку в подозрительно выглядящий URL, который перенаправляет на исходный адрес, не причиняя реального вреда. Он работает по принципу редиректа, аналогично сервисам сокращения ссылок, но с противоположной целью — сделать адрес максимально похожим на фишинговый, чтобы проверить бдительность пользователей или пошутить над коллегами.

Вы можете выбрать тематику домена (например, криптовалюты, финансы или знакомства) и длину URL, от короткой до абсурдно длинной. Инструмент просто меняет внешний вид ссылки, сохраняя её функциональность, что делает его забавным способом подчеркнуть важность проверки URL перед переходом.

by jordigh • 18 сентября 2025 г. в 22:40 • 1012 points

ОригиналHN

#phishing#url#redirect#cybersecurity#it-security#microsoft#safelink#mimecast

Комментарии (295)

  • Пользователи делятся опытом, как корпоративные IT-системы (Microsoft Safelink, MimeCast) переписывают ссылки в письмах, делая их подозрительными и нечитаемыми, что парадоксально снижает безопасность.
  • Обсуждаются юмористические и потенциально опасные аспекты сервиса, который намеренно генерирует URL-адреса, выглядящие как фишинговые или вредоносные (например, cheap-bitcoin.online).
  • Поднимается тема о том, что подобные инструменты могут использоваться для троллинга или рикреоллинга, но также предупреждается о рисках, включая возможность реального фишинга или проблем с IT-безопасностью на работе.
  • Несколько комментаторов отмечают, что их корпоративные сети блокируют сгенерированные ссылки или подобные домены, что ограничивает использование сервиса.
  • Упоминаются альтернативные методы создания подозрительных ссылок и приводятся личные забавные случаи из корпоративной практики, связанные с безопасностью и фишингом.

AI tools are making the world look weird (strat7.com) 💬 Длинная дискуссия

Исследования в области поведенческих наук часто страдают от системной ошибки: они опираются на данные, собранные в западных, образованных, индустриальных, богатых и демократических обществах (WEIRD), а затем применяют выводы ко всему человечеству. Это приводит к искажённым результатам, поскольку такие популяции составляют лишь малую часть мирового населения и могут демонстрировать нетипичные психологические и социальные паттерны.

Например, многие классические теории о принятии решений или морали основаны на экспериментах с студентами американских университетов, чьи реакции часто не совпадают с поведением людей из других культур. Это ограничивает применимость исследований в глобальном масштабе и подрывает их ценность для бизнеса или политики, ориентированных на разнообразные аудитории.

Осознание этой проблемы — первый шаг к более инклюзивной и точной науке.

by gaaz • 18 сентября 2025 г. в 22:27 • 188 points

ОригиналHN

#llm#machine-learning#natural-language-processing#deepseek#mistral#bias#cultural-diversity

Комментарии (169)

  • Обсуждается культурная предвзятость ИИ (особенно ChatGPT), который демонстрирует сильное смещение в сторону западных, особенно американских, ценностей из-за преобладания англоязычных данных в обучении.
  • Участники отмечают, что исходные данные для обучения ИИ (например, с Reddit) перекошены в сторону взглядов западной, образованной, индустриализированной, богатой и демократической (WEIRD) аудитории, что ограничивает способность ИИ отражать глобальное разнообразие.
  • Поднимается вопрос, могут ли ИИ, обученные на других языках или данных (например, DeepSeek, Mistral), или использование специальных промптов снизить этот эффект и лучше отражать другие культуры.
  • Критикуется методология исследования, лежащего в основе статьи, за отсутствие деталей и возможную нерепрезентативность, а также обоснованность некоторых антропологических claims в рекомендованной книге.
  • Обсуждается, является ли проблема inherent ограничением архитектуры ИИ или же её можно смягчить за счёт более разнообразных данных и специализированного обучения для разных культурных контекстов.

Meta’s live demo fails; “AI” recording plays before the actor takes the steps (reddit.com) 🔥 Горячее 💬 Длинная дискуссия

by personjerry • 18 сентября 2025 г. в 20:50 • 335 points

ОригиналHN

#meta#llm#livestream#demo#windows-95#reddit

Комментарии (208)

  • Провал live-демонстрации Meta AI, где ИИ некорректно обработал запрос и дал ошибочные инструкции по приготовлению соуса
  • Обвинения в постановочности демо и ригированности, хотя многие признают сложность live-выступлений
  • Критика огромных инвестиций в ИИ на фоне сырых и несовершенных продуктов, несмотря на высокую рыночную капитализацию Meta
  • Сравнение провала с эпизодами из сериала «Кремниевая долина» и выступлением Билла Гейтса с BSOD в Windows 95
  • Защита смелого решения проводить live-демо в противовес заранее записанным презентациям, как у Apple
  • Обсуждение аппаратной части очков как впечатляющей технологии, затмеваемой неудачным софтом
  • Разделение мнений: одни видят в провале конец AI-пузыря, другие — необходимый этап развития технологий

Apple: SSH and FileVault (keith.github.io) 🔥 Горячее 💬 Длинная дискуссия

Когда на macOS включен FileVault, том с данными остается заблокированным до ввода пароля при загрузке, что делает SSH недоступным, так как его конфигурация хранится на этом томе. Однако если активирована опция Remote Login, можно аутентифицироваться по паролю через SSH даже в заблокированном состоянии, что позволяет удаленно разблокировать диск.

После успешной аутентификации система ненадолго разрывает SSH-соединение, пока монтирует том и запускает зависимые сервисы, после чего полноценный доступ возобновляется. Эта функция, появившаяся в macOS 26 Tahoe, полезна для администрирования устройств без физического присутствия.

by ingve • 18 сентября 2025 г. в 20:15 • 476 points

ОригиналHN

#ssh#filevault#macos#remote-login#security#encryption#apple

Комментарии (166)

  • В macOS 26 Tahoe появилась возможность удалённой разблокировки зашифрованного тома (FileVault) по SSH до входа в систему, что решает давнюю проблему для удалённых серверов на Mac.
  • Пользователи подтверждают работоспособность функции: после перезагрузки можно подключиться по SSH, ввести учётные данные для разблокировки, после чего соединение разрывается, и система завершает загрузку.
  • Функция высоко оценена корпоративными пользователями и администраторами, так как позволяет использовать Mac mini в стойках и ЦОД без необходимости физического доступа для ввода пароля после сбоя питания.
  • Обсуждаются технические детали реализации: использование системного тома (read-only), перезагрузка пользовательского пространства после разблокировки для избежания race condition.
  • Некоторые пользователи выражают озабоченность по поводу потенциальных векторов атаки и необходимости использования аутентификации по паролю для SSH в этом сценарии.

Shipping 100 hardware units in under eight weeks (farhanhossain.substack.com)

by M_farhan_h • 18 сентября 2025 г. в 20:11 • 143 points

ОригиналHN

#hardware#ios#prototyping#voice-control

Комментарии (86)

  • Критика продукта за потенциальное поощрение использования телефона за рулем и риски для безопасности
  • Вопросы о технической реализации устройства, включая захват экрана и обход ограничений iOS
  • Обсуждение проблем совместимости с чехлами, ценовой политики и будущей конкуренции с нативными функциями ОС
  • Высокая оценка скорости разработки и качества исполнения аппаратного прототипа
  • Дебаты о потенциальных применениях технологии, включая доступность и голосовое управление

U.S. already has the critical minerals it needs, according to new analysis (minesnewsroom.com) 💬 Длинная дискуссия

Американские шахты уже добывают все необходимые стране критические минералы — от кобальта до редкоземельных элементов — но они попадают в отвалы как побочные продукты при добыче золота или цинка. Исследование показывает, что даже 1% извлечения этих ценных ресурсов из хвостов мог бы покрыть почти все внутренние потребности, сократив зависимость от импорта.

Например, менее 10% неиспользуемого кобальта хватило бы для всего рынка аккумуляторов США, а 1% германия — для нужд оборонной и электронной промышленности. Проблема в экономической целесообразности и технологиях извлечения, которые требуют инвестиций в исследования и политическую поддержку. Это не только вопрос ресурсной безопасности, но и возможность снизить экологические риски от хранения отходов.

by giuliomagnifico • 18 сентября 2025 г. в 19:41 • 248 points

ОригиналHN

#critical-minerals#rare-earth-elements#cobalt#germanium#mining#sustainability#environmental-impact#supply-chain#thorium#waste-management

Комментарии (323)

  • Зависимость от Китая в поставках редкоземельных металлов создает стратегические риски для оборонных и высокотехнологичных программ США и их союзников.
  • Основными препятствиями для развития собственной добычи и переработки в США являются высокие экологические издержки, регулирование и отсутствие политической воли.
  • Китай доминирует на рынке благодаря низким затратам, готовности игнорировать экологический ущерб и стратегии подавления конкурентов.
  • Решение проблемы требует инвестиций в НИОКР, создания альтернативных цепочек поставок (например, в Австралии) и пересмотра политики ценообразования.
  • Вопрос утилизации токсичных отходов и ядерных материалов (например, тория) остается ключевым вызовом для отрасли.

Tldraw SDK 4.0 (tldraw.dev)

tldraw SDK 4.0 introduces major updates for developers building interactive whiteboards in React, focusing on accessibility, licensing, and new starter kits. The release includes a CLI tool for quick project setup and four MIT-licensed starter kits tailored for AI chatbots, workflow tools, branching chats, and multiplayer apps, making it easier to prototype canvas-based applications.

Significant improvements include WCAG 2.2 AA compliance for accessibility, benefiting all users, and a new licensing model requiring keys for production use—though free 100-day trials are available. The project has seen substantial growth, with 40,000 GitHub stars and 70,000 weekly installs, reflecting its expanding community and practical utility.

by bpierre • 18 сентября 2025 г. в 19:21 • 78 points

ОригиналHN

#reactjs#tldraw#llm#accessibility#licensing#cli

Комментарии (38)

  • Пользователи выражают обеспокоенность новой моделью лицензирования и высокими ценами на коммерческое использование tldraw (от $500/мес до $6K/год).
  • Критикуется короткий 90-дневный пробный период и отсутствие гибких тарифов для малого бизнеса, стартапов и хобби-проектов.
  • Отмечается, что некоторые ключевые функции (например, несколько страниц на холсте) стали платными, что расценивается как движение в сторону централизации.
  • Разработчики tldraw объясняют изменения необходимостью сделать проект устойчивым и коммерчески жизнеспособным.
  • Обсуждаются технические аспекты: сравнение с Excalidraw и React Flow, поддержка iPad, обратная совместимость с версией 3.x.
  • Высказываются предположения, что новая ценовая политика нацелена на хорошо финансируемые компании, особенно в сфере ИИ.
  • Часть сообщества рассматривает переход на альтернативы или форки проекта из-за недовольства лицензией.

Calculator Forensics (2002) (rskey.org)

Вычисление сложной тригонометрической формулы arcsin(arccos(arctan(tan(cos(sin(9))))) в градусном режиме на разных калькуляторах даёт заметно отличающиеся результаты, что демонстрирует различия в точности и алгоритмах чипов. Некоторые модели, особенно на чипах General Instruments CF596, выдают ровно 0.0, в то время как другие показывают значения около 6.58, 8.84 или 8.99.

Наиболее точные результаты, приближающиеся к 9, дают калькуляторы с чипами от Sharp, Toshiba и National Semiconductor, что указывает на их улучшенную математическую обработку. Эта разница подчёркивает, как аппаратная реализация и firmware влияют на итоговые вычисления даже для, казалось бы, простых операций.

by ColinWright • 18 сентября 2025 г. в 18:43 • 82 points

ОригиналHN

#mathematics#algorithm#firmware#hardware#error-analysis#calculator#trigonometry

Комментарии (37)

  • Обсуждается тест для идентификации калькуляторов по результату вычисления arcsin(arccos(arctan(tan(cos(sin(9))))) в градусном режиме, где ожидаемый точный ответ — 9.
  • Участники отмечают, что разные модели калькуляторов и математические библиотеки (HP Prime, TI Nspire, Numworks, CORE-MATH) дают различные результаты из-за ошибок округления и особенностей реализации трансцендентных функций.
  • Поднимается вопрос о численной сложности вычисления из-за промежуточных значений, близких к локальному максимуму косинуса, что усугубляет ошибки.
  • Обсуждается, что даже современные системы (включая гипотетический ИИ) могут давать некорректный ответ из-за проблем с точностью, и как происходит самокоррекция или верификация результата.
  • Упоминается, что сайт с результатами теста служит «базой отпечатков» для определения чипа или модели калькулятора по его результату.

When Knowing Someone at Meta Is the Only Way to Break Out of "Content Jail" (eff.org)

Пользователи Meta сталкиваются с системой модерации, которая часто ошибочно блокирует контент, а единственный эффективный способ обжалования — личные связи внутри компании. Это подрывает доверие к платформе и создаёт неравенство, где обычные пользователи лишены справедливого доступа к поддержке.

EFF отмечает, что автоматизированные системы и недостаточная прозрачность процессов апелляции приводят к длительным блокировкам без объяснений. Такая практика ставит под вопрос ответственность tech-гигантов за свободу выражения и доступ к информации.

by 01-_- • 18 сентября 2025 г. в 18:30 • 249 points

ОригиналHN

#meta#moderation#content-moderation#user-experience#algorithm#privacy#social-media#user-rights

Комментарии (131)

  • Пользователи сталкиваются с произвольными блокировками аккаунтов на крупных платформах (Google, Meta, Reddit, YouTube, Anthropic) без внятного объяснения причин и с отсутствием эффективных каналов апелляции.
  • Автоматические системы модерации и поддержки часто не справляются, обратная связь от реальных людей недоступна, а единственным способом решить проблему становится публичный скандал в соцсетях.
  • Потеря аккаунта ведет к безвозвратной утрате личных данных, контента, контактов и цифровой идентичности, что особенно болезненно для коммерческих организаций и личных воспоминаний.
  • Централизованные платформы воспринимаются как ненадежные, что подчеркивает важность владения собственным сайтом и доменом для контроля над своим онлайн-присутствием.
  • Отмечается враждебная политика компаний в отношении пользователей, которые рассматриваются как продукт, а не как клиенты (noreply-почта, отсутствие поддержки, скрытые алгоритмы).
  • Проблема носит системный характер и затрагивает не только политически чувствительный контент, но и обычных пользователей, предпринимателей и рекламодателей.
  • Существуют опасения по поводу будущего, где от решений алгоритмов будет зависеть доступ к критически важным сервисам (Uber Eats, LinkedIn) без возможности обжалования.