Hacker News Digest — Страница 217/464

Which table format do LLMs understand best? (improvingagents.com)

Эксперимент показал, что формат данных существенно влияет на точность понимания таблиц LLM. Лучший результат показал Markdown-KV (key-value пары в markdown) с точностью 60,7%, но он потребовал в 2,7 раза больше токенов, чем самый экономный CSV. XML и INI также показали высокую точность (56% и 55,7%), тогда как CSV и JSONL оказались наихудшими — около 44%. Это указывает на возможность улучшения RAG-пайплайнов простой сменой формата данных, хотя эффективность часто требует компромисса с количеством токенов.

by oidar • 03 октября 2025 г. в 02:59 • 181 points

Оригинал • HN

#markdown #csv #jsonl #xml #ini #python #sql #llm #gpt-4

Комментарии (83)

Результаты тестирования GPT-4.1-nano показали, что точность извлечения данных из таблиц варьируется от 40% до 60% в зависимости от формата, при этом Markdown-KV показал наилучший результат.
Многие участники раскритиковали методологию исследования, указав на использование только одной, слабой модели (GPT-4.1-nano) и недостаточный размер данных для оценки влияния контекстного окна.
Было высказано сомнение в практической целесообразности использования LLM для обработки табличных данных, учитывая доступность более точных и эффективных традиционных инструментов (например, Python-скриптов, SQL).
В качестве альтернативы предложены агентные подходы, где LLM генерирует код (например, SQL-запросы или функции) для последующего выполнения, что показало высокую эффективность в реальных задачах.
Обсуждались потенциально более эффективные форматы данных (XML с короткими тегами, TOML, KSON) и необходимость тестирования на более мощных моделях (GPT-5, Claude, Gemini) для получения репрезентативных результатов.

Stdlib: A library of frameworks, templates, and guides for technical leadership (debuggingleadership.com)

Чёткое делегирование полномочий значительно упрощает управление инцидентами, снижая хаос и ускоряя восстановление. Практические стратегии помогают командам сохранять фокус на поставках даже при внезапных сбоях.

Инженерные процессы часто переоценивают: ключ к успеху — люди и динамика команды, а не строгие методологии. Признание индивидуального вклада и развитие психологической безопасности, где ошибки обсуждаются без драмы, важнее формальных правил.

by mooreds • 03 октября 2025 г. в 02:33 • 94 points

Оригинал • HN

#technical-leadership #incident-management #team-dynamics #psychological-safety #content-curation #llm

Комментарии (14)

Критика выбора названия 'stdlib' из-за конфликта с общепринятым значением (стандартная библиотека языка программирования)
Положительные оценки дизайна и полезности сайта, отмечающие его полированность и обилие ресурсов
Вопросы о методах отбора и агрегации контента на сайте (ручная curation vs. автоматизированное сканирование и AI-суммаризация)
Пояснение автора проекта, что это часть более крупной разработки, а не самостоятельный продукт
Скептические комментарии о мотивах создания сайта и использовании технического сленга

FyneDesk: A full desktop environment for Linux written in Go (github.com)

Fynedesk — это полноценная десктопная среда для Linux/Unix, построенная на основе инструментария Fyne. Она предлагает минималистичный интерфейс с акцентом на простоту и производительность, используя Go для кросс-платформенной разработки. Проект включает стандартные компоненты: панель задач, меню приложений, управление окнами и настройки темы, что делает его готовым к повседневному использованию.

Ключевое преимущество — лёгкость кастомизации и расширения благодаря модульной архитектуре и чистой кодовой базе на Go. Это позволяет разработчикам быстро адаптировать или дополнять функциональность под свои нужды. Fynedesk позиционируется как альтернатива тяжёлым средам вроде GNOME или KDE, особенно для ресурсоограниченных систем или пользователей, ценящих скорость и минимализм.

by xk3 • 03 октября 2025 г. в 02:13 • 226 points

Оригинал • HN

#go #fyne #linux #unix #wayland #x11 #github

Комментарии (124)

Обсуждение фокусируется на поддержке Wayland в FyneDesk, с ожиданием её реализации в будущих версиях и критикой текущей зависимости от X11.
Участники отмечают потенциал проекта как современной кроссплатформенной среды на Go, но выражают озабоченность по поводу скорости разработки и активности коммитов.
Поднимаются вопросы о мотивации и статусе разработки (хобби, коммерческий или академический проект), а также о простоте использования и настройки.
Обсуждаются технические аспекты: производительность, возможность кастомизации, сравнение с другими средами и работа на мобильных устройствах.
Некоторые пользователи выражают скептицизм, считая проект устаревшим или игрушечным без поддержки Wayland, в то время как другие защищают его и призывают к поддержке.

Mister Macintosh (2004) (folklore.org)

Стив Джобс предложил добавить в Macintosh мистического персонажа — мистера Макинтоша, который должен был изредка появляться в меню, подмигивать пользователю и исчезать. Идея заключалась в создании легенды, чтобы люди гадали, реальность это или вымысел. Энди Херцфельд, инженер, поддержал задумку, но из-за нехватки места в ПЗУ реализовал её через специальный хук «MrMacHook», позволявший сторонним программам встраивать подобные сюрпризы. Хотя сам мистер Макинтош так и не появился в системе, этот механизм позже использовали для других скрытых функций, а история стала частью фольклора Apple.

by HypnoticOcelot • 03 октября 2025 г. в 02:03 • 97 points

Оригинал • HN

#apple #macintosh #easter-eggs #user-experience #jeff-raskin

Комментарии (44)

Обсуждается нереализованная идея анимации Mr. Macintosh для оригинального Macintosh, как пример стремления Apple к созданию игривого и приятного пользовательского опыта.
Упоминается художник Жан-Мишель Фолон, автор образа Mr. Macintosh, и его другие работы, включая заставку для французского телеканала.
Поднимается тема исчезновения пасхальных яиц (easter eggs) в современном ПО из-за требований безопасности, профессионализма и риска быть неправильно понятыми.
Участники делятся ностальгическими историями и ресурсами о классических Mac, включая офис Apple «Texaco Towers» и сайты для эмуляции старых систем.
Высказываются противоположные мнения: одни считают такие элементы интерфейса очаровательными, другие — раздражающими или потенциально пугающими для пользователей.

I spent the day teaching seniors how to use an iPhone (forums.macrumors.com) 🔥 Горячее 💬 Длинная дискуссия

Обучение пожилых людей использованию iPhone оказалось сложной задачей из-за фундаментальных различий в восприятии технологий. Пользователи старшего возраста часто испытывают трудности с интуитивными для молодёжи жестами, такими как свайпы и долгие нажатия, а также путаются в интерфейсе из-за обилия иконок и настроек.

Многие просят письменные инструкции, но сталкиваются с тем, что современные устройства рассчитаны на визуальное и тактильное взаимодействие, а не текстовые руководства. Это подчёркивает необходимость адаптации интерфейсов и методов обучения для разных возрастных групп, чтобы технологии стали доступнее всем.

by dabinat • 03 октября 2025 г. в 01:20 • 335 points

Оригинал • HN

#iphone #ux #accessibility #usability #mobile #user-experience #interface-design #technology-adoption

Комментарии (473)

Современные смартфоны, особенно iPhone, критикуются за излишнюю сложность интерфейса, непонятные жесты и запутанный процесс первоначальной настройки, что создает серьезные барьеры для пожилых пользователей.
Многие пользователи предлагают создание упрощенных режимов (вроде Assistive Access) и возможность кастомизации интерфейса с самого начала настройки устройства, оставляя только самые необходимые функции (звонки, сообщения).
Отмечается, что проблема не только в Apple, но и в общей тенденции усложнения UX across all platforms (Android, Windows), а также в плохо спроектированных приложениях (банки, госуслуги), которые часто требуются для повседневной жизни.
Подчеркивается важность терпения и индивидуального подхода при обучении, фокусируясь только на тех задачах, которые действительно нужны пользователю, а не на демонстрации всех возможностей устройства.
Обсуждается, что пожилые пользователи — не монолитная группа; некоторым удается успешно освоить устройства, в то время как для других даже упрощенные смартфоны остаются слишком сложными, и иногда более подходящим решением может быть простой кнопочный телефон.

Apple takes down ICE tracking apps after pressure from DOJ (foxbusiness.com) 🔥 Горячее 💬 Длинная дискуссия

Apple удалила из App Store приложение для отслеживания агентов иммиграционной службы ICE после давления со стороны Министерства юстиции США. Приложение позволяло пользователям сообщать о местонахождении сотрудников ICE в реальном времени, что вызвало обеспокоенность властей из-за потенциальных угроз безопасности.

Решение Apple отражает растущую напряжённость между технологическими компаниями и правительством по вопросам контроля за приложениями, связанными с иммиграционной политикой. Это также поднимает вопросы о балансе между свободой слова и национальной безопасностью в цифровую эпоху.

by aspenmayer • 03 октября 2025 г. в 00:34 • 349 points

Оригинал • HN

#apple #google #app-store #immigration #national-security #censorship #privacy #web-applications

Комментарии (212)

Критикуется централизованный контроль Apple и Google над магазинами приложений, который позволяет правительствам принуждать к цензуре.
Отмечается, что подобные удаления приложений по политическим мотивам — не новость и ослабляют аргументы в пользу «закрытых экосистем».
Предлагается использовать веб-сайты вместо нативных приложений для большей устойчивости к цензуре и удалению.
Подчёркивается, что монополия и контроль над установкой софта создают риски для пользователей и ограничивают их свободу.
Указывается на противоречие между публичной позицией Apple о приватности и её готовностью подчиняться государственному давлению.

Basic Math Textbook: The Napkin Project (web.evanchen.cc)

Проект Napkin — это обширное введение в высшую математику, охватывающее темы от уровня бакалавриата до первого года магистратуры. Он даёт обзор ключевых идей и концепций, сочетая точность определений и формулировок теорем с интуитивными объяснениями, почему результаты должны быть верны, вместо строгих доказательств. Это делает материал доступным для тех, кто уже знаком с доказательствами, но хочет получить общее представление о различных областях математики.

Текущая версия 1.6 включает новые главы, исправления опечаток и художественную обложку, хотя некоторые разделы всё ещё находятся в разработке. Проект открыт для предложений и исправлений через GitHub, что позволяет сообществу участвовать в его улучшении. Практический вывод: Napkin служит мостом между популярной литературой и учебниками, помогая систематизировать знания перед углублённым изучением.

by eapriv • 02 октября 2025 г. в 23:46 • 203 points

Оригинал • HN

#math #mathematics #theory #education #github #theory-of-groups

Комментарии (65)

Обсуждение касается книги по математике, которую одни считают слишком сложной для начинающих, а другие — полезным обзором для тех, у кого уже есть математическая подготовка.
Участники спорят о целевой аудитории и уместности использования термина «базовый» для описания содержания, которое включает абстрактные концепции вроде теории групп.
Отмечается ценность книги как обзора, охватывающего множество тем, но критикуется её формат (PDF) за отсутствие интерактивности, которая могла бы улучшить обучение.
Упоминаются альтернативные ресурсы и учебники (например, Сержа Ланга, Шелдона Акслера), которые могут быть более подходящими для самостоятельного изучения.
Затрагиваются частные вопросы, такие как спор о включении нуля в множество натуральных чисел и необходимость большей интуитивности в объяснении сложных концепций.

What makes 5% of AI agents work in production? (motivenotes.ai)

Большинство ИИ-агентов (95%) терпят неудачу в продакшене не из-за недостатка интеллекта моделей, а из-за проблем с контекстной инженерией, управлением памятью и безопасностью. Ключевая идея: базовые модели — это почва, а контекст — семя. Успешные команды избегают тонкой настройки, вместо этого фокусируясь на продвинутом RAG с селективным отбором контекста, валидацией и гибридными архитектурами (семантический слой + метаданные).

Они применяют подход, схожий с feature engineering: версионирование, аудит и тестирование контекста, а не работа с ним как с неструктурированным текстом. Например, text-to-SQL системы редко работают из-за неоднозначности естественного языка и специфичности бизнес-терминологии. Решение — встраивание доменных онтологий и строгих схем, превращающих контекст в управляемый актив, а не в случайный набор данных.

by AnhTho_FR • 02 октября 2025 г. в 22:30 • 94 points

Оригинал • HN

#llm #ai-agents #rag #text-to-sql #machine-learning #natural-language-processing

Комментарии (85)

Обсуждается разрыв между завышенными ожиданиями от AI (восприятие как "магии") и реальностью, где 95% развертываний AI-агентов терпят неудачу из-за проблем с инфраструктурой, а не с моделями.
Подчеркивается важность контекстного инжиниринга, проверенных бизнес-логик и шаблонов, а не прямого генеративного подхода (например, text-to-SQL).
Многие решения на основе LLM сводятся к детерминированным системам (деревьям решений), что ставит под вопрос их необходимость вместо более простых и надежных альтернатив.
Отмечается, что успех зависит от инженерии ("строительных лесов") — валидации, безопасности, слоев памяти — а не от интеллекта модели.
Высказывается критика в адрес маркетинга AI как "волшебства" и генерации контента с помощью AI, который часто оказывается многословным и бессодержательным.

The strangest letter of the alphabet: The rise and fall of yogh (deadlanguagesociety.com) 🔥 Горячее 💬 Длинная дискуссия

В английском алфавите существовала буква йог (ȝ), которая появилась в староанглийский период как вариант написания звука [g]. Она выглядела как нечто среднее между «z» и «3» и использовалась наряду с каролингской «g», пришедшей из латинской письменности. После нормандского завоевания йог постепенно исчез, но оставила после себя запутанное наследие: многие слова, где раньше писалась эта буква, теперь используют «gh» (как в «night» или «thought»), что объясняет множество непроизносимых сочетаний в современном английском.

Йог — наглядный пример того, как исторические изменения орфографии усложнили письменность. Её исчезновение привело к появлению «немых» букв и неочевидных правил чтения, которые до сих пор затрудняют изучение языка. Это ещё один штрих к портрету английской орфографии — системы, где каждая странность имеет глубокие корни.

by penetralium • 02 октября 2025 г. в 21:34 • 273 points

Оригинал • HN

#linguistics #orthography #english-language #history #etymology

Комментарии (251)

Участники обсуждают историю и сложности английской орфографии, включая утраченные буквы (например, yogh, thorn) и нефонетическое написание.
Поднимается вопрос о реформе английского правописания для большей фонетичности, но отмечаются трудности из-за множества диалектов и исторической ценности текущей системы.
Обсуждаются примеры из других языков (например, финский, французский) для сравнения фонетических и нефонетических систем письма.
Упоминаются конкретные проблемы, такие как избыточность букв (c, q, x), неоднозначные звуки (ch, gh) и роль непроизносимых букв в сохранении этимологии.
Шутливо предлагается создать репозиторий для pull requests по изменению английского языка или использовать альтернативные алфавиты (например, Shavian).

Solveit – A course and platform for solving problems with code (answer.ai)

Новый инструмент Solveit от Answer.AI предлагает альтернативу пассивному использованию ИИ для генерации кода, вместо этого фокусируясь на активном обучении и развитии навыков решения проблем. Основанный на принципах математика Джорджа Пойа, подход включает четыре шага: понимание задачи, разработка плана, выполнение и рефлексия. Это позволяет избежать накопления «технического долга» из-за непонимания сгенерированного кода и способствует постепенному росту компетенций.

Платформа поддерживает итеративную разработку в блокнотной среде, где быстрые циклы обратной связи и совместный контекст с ИИ делают процесс более эффективным. Solveit уже используется для системного администрирования, веб-разработки и даже юридической работы. С 20 октября стартует пятинедельный курс, где создатели и Эрик Райс поделятся практиками осознанного применения ИИ без потери контроля над процессом.

by eries • 02 октября 2025 г. в 21:21 • 95 points

Оригинал • HN

#llm #education #problem-solving

Комментарии (84)

Обвинения в астротурфинге: несколько комментариев от пользователей с малым количеством кармы и истории, хвалящих курс, вызвали подозрения в искусственной накрутке.
Неясность предложения: многие пользователи выразили недоумение по поводу того, что такое SolveIt на самом деле (курс, методология, платформа), и раскритиковали статью за отсутствие четкого объяснения.
Сомнения в ценности и цене: высокая стоимость курса ($400) и необходимость 5 недель обучения вызвали скептицизм относительно его необходимости и целесообразности, учитывая обилие существующих AI-инструментов.
Положительные отзывы от участников: некоторые пользователи, утверждающие, что были в первом когорте, высоко оценили методологию, сообщество и то, как инструмент меняет подход к решению задач с ИИ.
Споры о сути проекта: обсуждение свелось к тому, является ли SolveIt революционным инструментом, улучшенным чат-интерфейсом, курсом по методологии или комбинацией всего вышеперечисленного.