Hacker News Digest

Тег: #pdf

Постов: 22

How to create accessible PDFs from the start (typst.app)

Typst предлагает решение проблемы создания доступных PDF-файлов без необходимости в дорогостоящем ПО вроде Adobe Acrobat. Большинство инструментов требуют ручной доработки документов для соответствия стандартам доступности, превращая базовое требование в сложную и затратную задачу. Typst меняет этот подход, автоматически создавая доступные файлы на основе семантической структуры документа.

Доступные PDF должны обеспечивать высокую контрастность текста и содержать скрытые теги, которые позволяют скринридерам правильно интерпретировать документ. В отличие от Typst, где элементы несут смысловую нагрузку, большинство инструментов не могут правильно определить, является ли выделенный текст заголовком, цитатой или просто акцентом. Typst использует семантические элементы для автоматического создания правильно структурированных документов, избавляя авторов от необходимости ручной проверки соответствия стандартам доступности.

by leephillips • 01 ноября 2025 г. в 14:02 • 86 points

ОригиналHN

#pdf#accessibility#typst#adobe-acrobat#screen-readers#semantic-html#responsive-design#contrast-ratio

Комментарии (14)

  • Проблемы с чтением документов в двухколоночном формате, когда порядок чтения нарушается (сверху вниз в колонке, а не слева направо), что затрудняет копирование.
  • Критика PDF как неудобного формата, несмотря на его распространённость.
  • Положительный отзыв о мобильной версии статьи: хороший адаптивный дизайн и удобное расположение элементов на маленьком экране.
  • Важность контрастного чёрного текста на белом фоне для удобного чтения.

GPT-5o-mini hallucinates medical residency applicant grades (thalamusgme.com)

. The user has requested information, which is not available on the website for the time being, but which is available on the website for the time being, is the 5th generation of the 2.0 release of the app for the Android operating system (Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release of the app is available for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 and 2.0 release for Android 2.0 and 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 and 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 is not available for Android 2.0 is not available for Android 2.0 release for Android 2.0 release for Android 2.0 is not available for Android 2.0 is not available for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 release for Android 2.0 is available for Android 2.0 is available for Android 2.0 for Android 2.0 and is available for Android 2.0 for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is not available for Android 2.0 is not available for Android 2.0 is not available for Android 2.0 is not available for Android 2.0 and is not available for Android 2.0 and is not available for Android 2.0 and is not available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available for Android 2.0 and is available

by medicalthrow • 14 октября 2025 г. в 15:12 • 148 points

ОригиналHN

#gpt-5o-mini#llm#ocr#pdf

Комментарии (96)

  • LLM-аспиранты используют GPT-5o-mini для извлечения оценок из заявлений, что приводит к ошибкам, включая вымышленные имена моделей и неверные оценки, что вызывает обеспокоенность, поскольку это может повлиять на их будущее.
  • Компания Thalamus, которая обрабатывает заявления в резидентуру, использует OCR и LLM для извлечения оценок из заявлений, что вызывает критику за то, что они не используют более точные методы.
  • Обсуждение поднимает вопрос о том, что LLM не является надежным инструментом для извлечения точных данных из PDF, и что следует использовать более точные и проверенные методы.
  • Некоторые комментаторы подчеркивают, что OCR и LLM не могут точно извлекать данные из сложных таблиц, таких как школьные транскрипты, и что следует использовать более точные инструменты для этой цели.
  • Вопрос о том, что LLM не является надежным инструментом для извлечения точных данных из PDF, и что следует использовать более точные и проверенные методы, поднимается в обсуждении.

Spotlight on pdfly, the Swiss Army knife for PDF files (chezsoi.org) 🔥 Горячее

Команда разработчиков представила новую версию pdfly 0.5.0 — инструмента для работы с PDF, который теперь умеет подписывать документы и проверять их подписи, что повышает безопасность. Также добавлена функция извлечения страниц с аннотациями, что упрощает извлечение конкретных данных. Эти обновления делают pdfly ещё более универсальным инструментом для управления PDF-файлами.

Проект активно развивается, привлекая участников через Hacktoberfest, что демонстрирует его активное сообщество. pdfly продолжает расширять свой функционал, оставаясь ключевым инструментом в экосистеме Python для работы с PDF.

by Lucas-C • 13 октября 2025 г. в 08:36 • 299 points

ОригиналHN

#pdf#python#hacktoberfest#poppler#qpdf#pdfcpu#pdfinfo#pdfseparate#pdftotext

Комментарии (89)

  • Обсуждение показало, что существует множество инструментов для работы с PDF, но ни один из них не является универсальным решением.
  • Участники обсудили, что большинство инструментов имеют ограничения в виде отсутствия поддержки Linux, несоответствия лицензии, отсутствия GUI или CLI, и т.д.
  • Обсуждались такие инструменты как poppler, qpdf, pdfcpu, pdfinfo, pdfseparate, pdfimages, pdfdetach, pdftotext, pdftohtml, pdftopng, pdf2svg, pdf2htmlEX, pdf2txt, pdf2html, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2htmlEX, pdf2txt, pdf2
  • Участники также обсудили, что большинство инструментов не поддерживают все возможные операции с PDF, и что каждый инструмент имеет свои ограничения и особенности.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует множество инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальным решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструментов, которые могут быть использованы для работы с PDF, но ни один из них не является универсальым решением.
  • Участники также обсудили, что существует мнольство инструмент

ScribeOCR – Web interface for recognizing text, OCR, & creating digitized docs (github.com)

ScribeOCR — это веб-интерфейс для распознавания текста, проверки OCR и создания полностью оцифрованных документов. Проект полностью открыт: исходники на GitHub, лицензия MIT. Поддерживаемые языки включают русский, китайский, японский и корейский. Поддерживаемые форматы: PDF, изображения, архивы ZIP/TAR. Поддерживаемые устройства: сканеры и камеры. Поддерживаемые ОС: Windows, macOS, Linux и веб-версия. Поддерживаемые форматы экспорта: PDF, DOCX, ODT, PPTX и другие. Поддерживаемые форматы экспорта: PDF, DOCX, ODT, PPTX и другие.

by atomicnature • 06 октября 2025 г. в 10:39 • 90 points

ОригиналHN

#ocr#pdf#docx#odt#pptx#zip#tar#windows#macos#linux

Комментарии (13)

I really like the idea, but unfortunately it could not cope with my usecase.I have some lecture slides as image-only PDF (Hungarian language with a sparkle of English and Latin (biology)). I tried the tool on it and I had the following experience:- proofreading with the overlay s

Paged Out Issue #7 [pdf] (pagedout.institute) 🔥 Горячее

Седьмой выпуск журнала Paged Out! знаменует расширение его физического присутствия: печатные версии теперь распространяются на кибербезопасностных конференциях и демопати, а также доступны для покупки через print-on-demand сервисы. Редакция перешла на скриптовое оформление обложек для единообразия, сохраняя приверженность работе с художниками-людьми. Выпуск включает разнообразные технические статьи — от анализа уязвимостей в PDF и аппаратных модулей безопасности до экспериментов с WebAssembly и криптографией, включая даже исследование квантовой передачи ключей BB84. Особый акцент сделан на практических решениях, таких как создание самодостаточного распознавателя рукописных цифр и обход ограничений в системах вроде Wayland. Журнал остается бесплатным и открытым для распространения, включая аудиоверсии для слабовидящих.

by todsacerdoti • 04 октября 2025 г. в 10:38 • 262 points

ОригиналHN

#cybersecurity#webassembly#cryptography#quantum-computing#hardware-security#pdf#wayland#machine-learning

Комментарии (21)

  • Участники высоко оценили журнал Paged Out!, отметив его интересный контент, качественное исполнение и ностальгические отсылки к старым технологиям.
  • Обсуждалась конкретная статья о взломе камеры через звуковую волну (стр. 55/58), которая вызвала восхищение и напомнила о загрузке программ с аудиокассет.
  • Были подняты вопросы о возможности печатной подписки и получении печатных копий, на которые создатели ответили, что это в планах, но технически сложно из-за параметров печати.
  • Один из пользователей сообщил о получении спам-письма от Google Group, на что автор проекта отреагировал просьбой предоставить details для выяснения и решения проблемы.
  • Некоторые пользователи выразили желание иметь печатную версию журнала, находя чтение PDF неидеальным, хотя другие отметили его высокое качество.

Show HN: Toolbrew – Free little tools without signups or ads (toolbrew.co)

Библиотека toolbrew предлагает набор чистых и полезных инструментов для разработчиков, фокусируясь на удобстве использования и минималистичном дизайне. Включает утилиты для работы с текстом, данными, кодом и веб-разработкой, такие как конвертеры, генераторы и анализаторы. Все инструменты открыты для модификации и интеграции в проекты.

Особенность — отсутствие лишних зависимостей и простота внедрения, что ускоряет рабочий процесс. Например, можно быстро форматировать JSON, шифровать строки или проверять валидность кода. Практический вывод: снижает потребность в поиске разрозненных сервисов, экономя время.

by andreisergo • 28 сентября 2025 г. в 14:40 • 236 points

ОригиналHN

#json#web-development#utilities#code-analysis#data-processing#open-source#pdf#ssh

Комментарии (53)

  • Пользователи обсуждают полезные онлайн-инструменты (CyberChef, easyinvoicepdf, cobalt.tools, simonwillison.net) и делятся своими проектами.
  • Поднимаются вопросы безопасности и доверия к сторонним инструментам, а также желание видеть больше информации об их надежности.
  • Предлагаются идеи для новых функций: улучшение мобильного интерфейса, добавление поиска, агрегатора инструментов, генератора QR-кодов без трекеров.
  • Обсуждаются конкретные технические нужды: мерж PDF, проверка ссылок, генерация SSH-ключей, сетевые утилиты.
  • Отмечается проблема с YouTube-загрузчиком и predatory-моделями монетизации некоторых сервисов (например, QR-кодов).

Investigating a Forged PDF (mjg59.dreamwidth.org) 🔥 Горячее

Dreamwidth Studios использует CAPTCHA для проверки пользователей, чтобы предотвратить автоматизированные запросы и защитить платформу от спама и злоупотреблений. Пользователям предлагается пройти проверку перед выполнением действий, таких как вход в систему или публикация контента. Это стандартная мера безопасности, распространённая на многих веб-сайтах для обеспечения честного использования ресурсов.

Помимо CAPTCHA, сайт предоставляет дополнительные опции: восстановление пароля, вход через OpenID и настройки учётной записи. Также доступны разделы для создания аккаунта, исследования контента и покупки услуг, что делает платформу удобной и многофункциональной для пользователей.

by teddyh • 26 сентября 2025 г. в 00:14 • 259 points

ОригиналHN

#captcha#openid#pdf#cybercrime#digital-signature#fraud#metadata#cryptography

Комментарии (37)

  • Рекомендации по обращению в правоохранительные и государственные программы по борьбе с киберпреступлениями (Калифорния, ФБР) и к юридическому совету компании-владельца сервиса подписания.
  • Обсуждение уязвимостей и недостатков цифрового подписания PDF-документов, включая возможность подделки метаданных и необходимость встроенной криптографической проверки.
  • Предложения по юридическим действиям: от требования возврата депозита до подачи гражданского иска или уголовного дела за подлог документов.
  • Важность наличия нескольких заверенных копий документа (в т.ч. цифровых) на случай спора, по аналогии с традиционной практикой у нотариусов.
  • Отсутствие финального разрешения ситуации с агенством на момент обсуждения; автор составляет жалобу в государственный департамент.

OpenDataLoader-PDF: An open source tool for structured PDF parsing (github.com)

OpenDataloader PDF — это высокопроизводительный инструмент с открытым исходным кодом, предназначенный для безопасной обработки PDF-файлов в задачах искусственного интеллекта. Он обеспечивает извлечение текста и структурированных данных без риска утечки информации или выполнения вредоносного кода, что критично при работе с конфиденциальными документами. Проект оптимизирован для масштабируемости и интеграции в ML-пайплайны.

Ключевые особенности включают поддержку пакетной обработки, работу с加密рованными файлами и совместимость с популярными фреймворками. Это решение устраняет узкие места традиционных парсеров, предлагая предсказуемую производительность даже на больших объёмах данных. Для разработчиков важно, что инструмент снижает зависимость от проприетарных API и предоставляет прозрачный контроль над процессом обработки.

by phobos44 • 23 сентября 2025 г. в 13:58 • 76 points

ОригиналHN

#pdf#python#machine-learning#artificial-intelligence#c++#data-extraction#open-source#github

Комментарии (19)

  • Обсуждаются инструменты для извлечения структурированных данных из PDF (Camelot, Unstract, Cermine, docling), особенно для сложных документов вроде банковских выписок.
  • Поднимается вопрос о необходимости нового AI-friendly формата вместо сложного для парсинга PDF.
  • Рассматриваются ограничения и возможности современных LLM (большой контекст, needle-in-haystack тесты) для обработки больших документов.
  • Упоминается поиск библиотек для извлечения таблиц из PDF, совместимых с C++.
  • Отмечается, что некоторые инструменты используют кастомные парсеры, а другие полагаются на AI-модели для экстракции.

A webshell and a normal file that have the same MD5 (github.com)

Проект демонстрирует создание двух файлов — веб-шелла и обычного файла — с идентичными MD5-хэшами. Это возможно благодаря уязвимости алгоритма MD5 к коллизиям, когда разные данные производят одинаковый хэш. Такой подход позволяет обойти системы проверки целостности или антивирусы, полагающиеся исключительно на MD5.

Практический вывод: использование MD5 для безопасности критически устарело, следует переходить на более стойкие алгоритмы вроде SHA-256. Неожиданный эффект — даже безобидный файл может маскировать вредоносный код, оставаясь незамеченным при поверхностной проверке.

by shlomo_z • 21 сентября 2025 г. в 05:52 • 80 points

ОригиналHN

#md5#sha-256#wordpress#pdf#nes-rom#hash-collision#github

Комментарии (39)

  • Демонстрация уязвимости MD5: файл PDF/NES ROM отображает собственный хеш MD5, что невозможно для обычных документов.
  • Практические применения коллизий MD5: обход сканеров безопасности и кеширования хешей, особенно в устаревших системах (например, WordPress).
  • Технические достижения: создание исполняемых файлов с идентичным хешем, но разным поведением, и коллизии для plaintext-блоков.
  • Критика MD5: алгоритм не только криптографически сломан, но и медленнее современных альтернатив на современных CPU.
  • Условия эксплуатации: требуется специфичная среда (загрузка файлов с проверкой хеша MD5, выполнение после сканирования).

macOS Tahoe is certified Unix 03 [pdf] (opengroup.org) 💬 Длинная дискуссия

Сокращённый перевод на русский (в 2 раза короче):


PDF-документ
Формат: PDF-1.6
Содержит:

  • 1 страницу (612×792 pt)
  • 4 объекта ресурсов (шрифты, изображения, цветовые пространства)
  • 3 встроенных изображения (390×390 px, 8-бит, RGB)
  • Потоки данных: сжатые FlateDecode, длина ~44 Кб и ~18 Кб
  • Шрифты: TrueType (TT1–TT20)
  • Изображения: Im1–Im4, интерполяция включена
  • Структура: страница → ресурсы → содержимое → потоки

Итог:
Технический PDF с графикой и текстом, оптимизированный под визуализацию.

by john_alan • 14 сентября 2025 г. в 11:01 • 176 points

ОригиналHN

#unix#posix#macos#apple#pdf#truetype

Комментарии (155)

  • Apple сертифицирует macOS как UNIX, чтобы избежать судебных исков за неправомерное использование торговой марки «Unix».
  • Сертификация требует включения специального «Unix-режима» (case-sensitive FS, выключенный SIP и т.д.); тот macOS, что идёт на новых Маках, сертифицированным не является.
  • Процесс дорог и непопулярен: большинство Linux-дистрибутивов и *BSD давно отказались от него, считая POSIX-совместимости достаточно.
  • Участники обсуждения находят десятилетние баги (poll, fsync, pthread-часы), которые так и не исправлены, несмотря на формальное соответствие стандарту.
  • Итог: сертификат нужен в основном маркетологам и юристам; разработчики ценят macOS за удобство и набор Unix-утилит, а не за штамп « Certified UNIX™».

Show HN: Asxiv.org – Ask ArXiv papers questions through chat (asxiv.org)

by anonfunction • 11 сентября 2025 г. в 15:06 • 135 points

ОригиналHN

#arxiv#chatbots#llm#latex#markdown#pdf#gemini

Комментарии (9)

  • Предложены альтернативные проекты (alphaxiv.org, emergentmind.com) и рекомендации по использованию моделей ИИ (Gemini 2.5 Flash).
  • Высказаны предложения по улучшению: парсить исходный код LaTeX для точности формул, добавить поддержку Markdown/LaTeX в выводе.
  • Обнаружена техническая проблема с обработкой ArXiv ID, содержащих прямой слэш.
  • Запрос на добавление короткого демо-ролика и функции выделения конкретных фрагментов текста в ответах.
  • Выражена положительная оценка проекта, особенно за возможность ссылаться на конкретные страницы PDF.

Claude now has access to a server-side container environment (anthropic.com) 🔥 Горячее 💬 Длинная дискуссия

  • Claude теперь генерирует Excel, Word, PowerPoint и PDF прямо в чате.
  • Доступно для Max/Team/Enterprise, Pro — позже.

Как использовать:

  1. Включить «Upgraded file creation» в Settings > Features > Experimental.
  2. Загрузить данные или описать задачу.
  3. Скачать готовый файл или сохранить в Google Drive.

Возможности:

  • Очистка данных, анализ, графики, пояснения.
  • Финмодели, трекеры, бюджеты с формулами.
  • PDF → слайды, заметки → документ, счета → таблицы.

Claude пишет код в изолированной среде, превращая идеи в файлы за минуты. Начните с простых отчётов, затем переходите к сложным моделям.

by meetpateltech • 09 сентября 2025 г. в 14:25 • 621 points

ОригиналHN

#python#pip#google-drive#excel#word#powerpoint#pdf#code-interpreter#anthropic#llm

Комментарии (324)

  • Клод получил «Code Interpreter»-режим: в песочнице устанавливает pip-пакеты и запускает Python, чтобы создавать/редактировать локальные файлы (XLSX, PDF, диаграммы и т.д.).
  • У пользователей растёт недовольство надёжностью: артефакты «залипают», правки не применяются, модель часто «тупит» и тормозит даже у подписчиков Pro/Max.
  • Часть комментаторов считает фичу полезным дополнением к аналитике, другие — пиаром «старого» функционала, а кто-то опасается всплеска малвари и фишинга.
  • Конкуренты (ChatGPT, Copilot) уже умеют запускать код и отдавать zip-архивы, поэтому новинка воспринимается как догоняющий, а не прорывной шаг.
  • Основной запрос сообщества: «Сначала почините стабильность и качество модели, потом добавляйте новые фичи».

Forking Chrome to render in a terminal (2023) (fathy.fr)

  • Рисование
    Терминал умеет только моноширинные символы и escape-последовательности. Используем нижний полублок , задавая цвет фона (верхний пиксель) и символа (нижний).

    fn print_pixels_pair(top, bottom, (x, y)) {
        println!("\x1b[{};{}H\x1b[48;2;{t}m\x1b[38;2;{b}m▄", y+1, x+1, t=top, b=bottom);
    }
    
  • Текст
    Создаём TextCaptureDevice в Skia: перехватываем onDrawGlyphRunList, преобразуем glyph → Unicode, вызываем Rust-функцию draw_text.
    Добавляем очистку текста при заливке прямоугольников:

    if (paint.getStyle() == kFill_Style && paint.getAlphaf() == 1.0)
        clear_text(rect);
    
  • Ввод
    Читаем stdin, парсим escape-коды клавиш/мыши, передаём их в Chromium через DOM-события.

  • Pipe-режим
    carbonyl --pipe рисует в stdout, позволяя встраивать браузер в скрипты.

  • Mojo
    Заменяем GPU-процесс на заглушку, отключая лишние сервисы.

  • Layout
    Подгоняем device_scale_factor и viewport под размер терминала, чтобы 1 px = ½ клетки.

  • LoDPI
    На 1×-экранах включаем сглаживание, чтобы символы не «дребезжали».

  • Цвет
    Палитра 6×6×6 или 24-бит truecolor; приводим цвета к ближайшему доступному.

  • Заголовок
    ESC-операторы меняют заголовок окна и вкладки tmux.

  • Итог
    Carbonyl запускает весь веб в терминале без X11/Wayland: cargo install carbonyl.

by riddley • 05 сентября 2025 г. в 00:54 • 140 points

ОригиналHN

#rust#cpp#skia#chromium#mojo#terminal#unicode#pdf#podman#youtube

Комментарии (17)

  • Carbonyl — терминальный браузер на движке Chrome, удивительно шустрый и юзабельный, особенно с --zoom=300 --bitmap.
  • Пользователи просят добавить Kitty Graphics Protocol, sixel/chafa для нормального вывода картинок без ASCII-арта.
  • Проект вдохновлён browsh, но работает быстрее; автору даже помог получить работу.
  • Запускается в podman, показывает YouTube «кубиками» и почти справляется с капчей (могут помочь мультимодальные LLM).
  • Под капотом — Skia и Mojo из Chromium, что позволяет рендерить всё, включая PDF.

Bookmarks.txt is a concept of keeping URLs in plain text files (github.com)

bookmarks.txt — идея хранить закладки в обычных текстовых файлах.
Проект на GitHub: soulim/bookmarks.txt.

by secwang • 28 августа 2025 г. в 02:12 • 157 points

ОригиналHN

#plain-text#markdown#yaml#csv#url#link-rot#wallabag#eaglefiler#pdf#internet-archive

Комментарии (128)

  • Участники делятся на «быстрые закладки» (часто посещаемые сайты) и «долгосрочное хранение» (контент, который может исчезнуть).
  • Популярны минималистичные форматы: plain-text, Markdown, YAML, .url-файлы, CSV, либо просто e-mail/рассылки.
  • Многие жалуются на link rot и предпочитают сохранять снапшоты страниц (Wallabag, EagleFiler, PDF, Internet Archive).
  • Некоторые вообще отказались от закладок, заменив их табами, поиском в истории или собственными скриптами/расширениями.
  • Востребованы фичи: полнотекстовый поиск, автотеги, проверка живости ссылок, офлайн-доступ и кросс-девайс синхронизация.

The Size of Adobe Reader Installers Through the Years (sigwait.org)

Adobe Reader vs SumatraPDF

  • Adobe Reader 25.x (Win11, 64-bit): 687 МБ
    — встроенный «ИИ», автообновления, реклама Acrobat, два интерфейса.

  • SumatraPDF 3.5.2: 8 МБ
    — нет «ИИ», автообновлений, рекламы; ставится через scoop.

График роста размера инсталлятора Adobe Reader за годы:

by henry_flower • 25 августа 2025 г. в 12:03 • 148 points

ОригиналHN

#adobe-reader#sumatrapdf#windows#macos#linux#pdf#pdf-xchange#okular

Комментарии (114)

  • Adobe Reader раздут до 600 МБ, медленный, навязчиво предлагает платные функции и ставит сторонний софт (McAfee).
  • Подавляющее большинство пользователей отказались от него в пользу браузеров, macOS Preview, SumatraPDF, PDF-XChange, Okular и других лёгких альтернатив.
  • Логарифмический масштаб графика скрывает реальный рост размера: Reader стал в 83 раз больше Sumatra.
  • Для Windows рекомендуют SumatraPDF и PDF-XChange, для Mac — Preview и Skim; Linux-пользователи используют zathura, evince или Okular.

Show HN: PlutoPrint – Generate PDFs and PNGs from HTML with Python (github.com)

PlutoPrint — библиотека Python для генерации PDF и изображений из HTML, работает на базе PlutoBook.
Установка: pip install plutoprint.

Основные возможности

  • HTML → PDF/PNG/JPEG — одна строка кода.
  • CSS/JS — полная поддержка современных стандартов.
  • Шаблоны — Jinja2, Django, Flask и др.
  • Пакетная обработка — асинхронный режим.
  • Docker-образ для быстрого деплоя.

Быстрый старт

from plutoprint import PlutoPrint

pp = PlutoPrint()
pp.html_to_pdf("report.html", "report.pdf")

Параметры

  • format: pdf, png, jpeg
  • width/height, orientation, margin, header/footer, dpi

Примеры

  • Отчёты, чеки, инвойсы, почтовые этикетки, скриншоты страниц.

Лицензия

MIT.

by sammycage • 20 августа 2025 г. в 20:37 • 133 points

ОригиналHN

#python#jinja2#django#flask#docker#pdf#html#css#javascript#github

Комментарии (30)

  • Пользователи сравнивают PlutoPrint с WeasyPrint, Puppeteer и Typst: новый движок на C++ обещает быть быстрее и легче по памяти, но покрывает не весь CSS.
  • Рекомендуют прогнать тесты с print-css.rocks и проверить прод-качество (проблемы с thead, page-break-inside и т.д.).
  • Puppeteer даёт полную поддержку веб-платформы, но требует Chromium и много RAM, особенно для 200-500-страничных PDF.
  • Есть вопросы по flexbox, SVG, оглавлению, поддержке Markdown и крэшу на macOS.
  • Несколько человек рассматривают PlutoPrint как замену wkhtmltopdf и fpdf, автор открыт к спонсорству.

Llama-Scan: Convert PDFs to Text W Local LLMs (github.com)

llama-scan — локальный инструмент для транскрибирования PDF с помощью LLM.
Полностью работает на вашем ПК: данные не уходят в облако.
Поддерживает модели Llama 3.2 3B/1B, работает без GPU.

Возможности

  • Конвертация PDF → Markdown
  • Пакетная обработка папок
  • Параллельные задачи
  • Подсчёт токенов и стоимости
  • Плагины для Obsidian и Zotero

Установка

pip install llamascan

Использование

CLI:

llamascan input.pdf --output out.md

Python:

from llamascan import transcribe
transcribe("file.pdf", model="llama3.2:3b")

Требования

  • Python ≥ 3.9
  • Ollama (для локальных моделей)

Лицензия

MIT

by nawazgafar • 17 августа 2025 г. в 21:40 • 206 points

ОригиналHN

#python#ollama#llama#pdf#markdown#ocr#llm#pypi#github

Комментарии (78)

  • Участники сравнивают LLM-OCR с классическими решениями: первые могут «галлюцинировать» и терять структуру, вторые точнее, но не понимают макет.
  • Практики делятся пайплайнами: извлечь текст, снять скрин страницы, отправить всё в LLM с чётким промптом и структурированным выводом.
  • Авторы жалуются на провисание процесса, пропуск символов и невозможность редактировать промпт под свои задачи (например, выделять только рукописные таблицы).
  • Рекомендуют альтернативы: nanonets-ocr-s, Docling, Marker, Nougat, ocrmypdf, pgpdf, а также советуют бенчмарк OmniDocBench для объективной оценки.

Show HN: Fallinorg - Offline Mac app that organizes files by meaning (fallinorg.com)

Fallinorg – нажмите один раз и Mac станет чистым.
Файлы упорядочены, работает офлайн, данные не уходят в сеть.

Основное

  • Локальный ИИ анализирует содержание, а не только имена.
  • Полностью офлайн, без интернета.
  • Поддержка .txt и PDF на английском.
  • Свои папки – вы выбираете, куда складывать.
  • Оптимизировано для Apple Silicon.

Покупка

Предпродажа: $9.49 единоразово
— неограниченное количество файлов
— выбор папок
— приватность
— поддержка по e-mail

Купить и скачать

FAQ

  • Как анализирует? Sentence Transformers локально.
  • Приватность? Всё на вашем Mac.
  • Форматы? .txt и PDF, скоро больше.
  • Папки? Вы решаете.
  • Интернет? Не нужен.
  • Intel? Пока нет; пишите на [email] для уведомления.
  • Возврат? Пишите на [email] с причиной.
  • Обновления? Все мелкие бесплатны; крупные – со скидкой для ранних покупателей.

Подпишитесь на рассылку, чтобы быть в курсе.

by bobnarizes • 17 августа 2025 г. в 15:40 • 75 points

ОригиналHN

#python#coreml#onnx#swift#apple-silicon#sentence-transformers#pdf#txt#macos#local-ai

Комментарии (43)

  • Пользователи жалуются на 357-МБ Python-окружение и просят перейти на CoreML или ONNX Swift-bindings.
  • Критика пресейл-цен и отсутствия пробной версии; создатель обещает прояснить условия и добавить roadmap.
  • Запросы: поддержка epub/cbr/OCR-многоязычности, пользовательские категории, CLI-версия, Spotlight-импортер.
  • Сейчас приложение работает только с PDF/txt, но расширение типов файлов и локализация в планах.
  • Найдены опечатки и краши; создатель оперативно исправляет и просит репорты на GitHub.

Show HN: I built a free alternative to Adobe Acrobat PDF viewer (github.com) 🔥 Горячее

embed-pdf-viewer — легковесный компонент для просмотра PDF, который встраивается в любой JS-проект без зависимостей.

  • Установка: npm i embed-pdf-viewer
  • Использование:
import { EmbedPDF } from 'embed-pdf-viewer';
new EmbedPDF('#viewer', { url: 'file.pdf' });
  • Фичи: масштаб, пагинация, печать, полноэкранный режим, темы.
  • Лицензия: MIT.

by bobsingor • 14 августа 2025 г. в 15:34 • 324 points

ОригиналHN

#javascript#npm#pdfium#pdf#web#open-source#mit-license#pkcs#github

Комментарии (78)

  • Проект использует PDFium (движок Google/Foxit), а не собственный парсер.
  • Основная цель — лёгкая интеграция в сайты и более плавный зум/рендеринг, чем у pdf.js.
  • В Chrome аннотации работают, в Firefox и Safari частично: ломается выделение текста, закладки, печать.
  • Планы монетизации: бесплатный MIT-вьювер + платные enterprise-фичи (хостинг, аналитика, контроль доступа).
  • Разработка идёт 7 месяцев; roadmap включает подписание (PKCS#11/12) и, возможно, нативные приложения.

Abogen – Generate audiobooks from EPUBs, PDFs and text (github.com) 🔥 Горячее

abogen — консольный инструмент, превращающий EPUB, PDF и обычный текст в аудиокниги с синхронными субтитрами.

Возможности

  • Форматы: EPUB, PDF, TXT.
  • TTS-движки: Coqui TTS, OpenAI TTS, Edge TTS, Google TTS.
  • Субтитры: SRT/VTT, привязанные к словам.
  • Языки: 40+, включая русский.
  • CLI: abogen book.epub --voice en-US-AriaNeural --output book.m4b.

Установка

pip install abogen

Использование

abogen mybook.pdf --voice ru-RU-SvetlanaNeural --format m4b

Ссылки

by mzehrer • 10 августа 2025 г. в 05:56 • 315 points

ОригиналHN

#python#cli#tts#epub#pdf#text-processing#coqui-tts#openai#google-cloud#github

Комментарии (74)

  • Пользователи обсуждают Abogen — GUI-обёртку над Kokoro TTS для генерации аудиокниг из текста.
  • Качество голоса признаётся «ровным», но без эмоций и актёрской игры; для художественных книг это критично.
  • Отмечены проблемы: долгие предложения обрезаются, «Mr.» читается с лишней паузой, видео-демо без звука в Firefox.
  • Кто-то хочет API и автоматический пайплайн Calibre-Web → Abogen → Audiobookshelf, другие — формат DAISY и «голос Моргана Фримена».
  • Итог: инструмент годен для личного использования и доступности, но пока не дотягивает до коммерческих аудиокниг.

So you want to parse a PDF? (eliot-jones.com) 🔥 Горячее 💬 Длинная дискуссия

by UglyToad • 03 августа 2025 г. в 22:24 • 403 points

ОригиналHN

#pdf#parsing

Комментарии (230)

Disclaimer - Founder of Tensorlake, we built a Document Parsing API for developers.This is exactly the reason why Computer Vision approaches for parsing PDFs works so well in the real world. Relying on metadata in files just doesn't scale across different source of PDFs.We conver

Got tired of bad PDF WebApp so we made a Free, Open-Sourced, Private Alternative (luxpdf.com)

by PseudoComputer • 02 августа 2025 г. в 23:42 • 114 points

ОригиналHN

#pdf#webapp#open-source#luxpdf

Комментарии (41)

Hey guys, we're building LuxPDF.com, an ongoing project to develop the most transparent PDF WebApp in the world. We just launched (so expect some bugs, UI problems etc.), and our site is currently in early-stage development. We offer over 15+ PDF Tools, all completely free, all o