Тег: #r — Hacker News Digest

S.A.R.C.A.S.M: Slightly Annoying Rubik's Cube Automatic Solving Machine (github.com) 🔥 Горячее

В предоставленном тексте нет информации о проекте SARCASM (Slightly Annoying Automatic Rubik's Cube Solving Machine). Текст представляет собой навигационное меню GitHub, но не содержит описания самого проекта, его особенностей или технических деталей.

Для создания точного пересказа необходима информация о самом проекте: как он работает, какие компоненты использует, как решает кубик Рубика и какие результаты демонстрирует. Без этих деталей невозможно выделить главную идею или отметить ключевые факты проекта.

by chris_overseas • 31 октября 2025 г. в 23:03 • 259 points

Оригинал • HN

#rubiks-cube #robotics #automation #3d-printing #github #r

Комментарии (55)

Обсуждение вращается вокруг создания робота для решения кубика Рубика, включая рекордные 103 мс и эстетику проекта.
Участники также обсуждают автоматическое перемешивание кубика, как более полезную задачу, поскольку кубер тратит больше времени на перемешивание, чем на решение.
Поднимается вопрос о количестве потраченного времени и усилий, вложенных в проект, и о том, сколько кубиков было сломано в процессе.
Также обсуждается возможность использования робота для перемешивания кубика в обратном направлении.
Наконец, участники делятся впечатлениями о том, как проект вдохновляет людей приобрести 3D-принтер и как он может быть использован для обучения или демонстрации в контексте кубик Рубика.

Zoo of array languages (ktye.github.io)

Пользователь ktye поделился информацией о языке программирования K, который представляет собой диалект APL, оптимизированный для быстрых вычислений. Язык использует синтаксис, похожий на APL, с операторами для сложения, вычитания, умножения, деления и других операций, включая специальные функции вроде decode и encode.

Код включает примеры работы с массивами, включая создание, манипуляции и агрегацию данных. Есть поддержка условных операторов, циклов и работы со строками. Также представлены ссылки на документацию и другие ресурсы, включая реализацию на разных платформах.

В сообщении показано, что K — это лаконичный и выразительный язык, подходящий для работы с данными и математическими вычислениями. Он имеет функционал, схожий с другими языками программирования, но с акцентом на краткость и эффективность. Интересно, что пользователь адаптировал язык для разных платформ, что делает его универсальным.

by mpweiher • 14 октября 2025 г. в 11:01 • 160 points

Оригинал • HN

#k #apl #j #q #bqn #uiua #matlab #r #array #functional

Комментарии (46)

Обсуждение охватывает APL, J, K, Q, BQN, Uiua и другие языки массивов, но не упоминает R, MATLAB, Nial и другие, что вызывает удивление.
Участники обсуждают, какие языки считаются "массивными", и почему некоторые, такие как MATLAB и R, не упоминаются.
Обсуждается, какие языки считаются "массивными", и почему некоторые, такие как MATLAB и R, не упоминаются.
Участники обсуждают, какие языки считаются "массивными", и почему некоторые, такие как MATLAB и R, не упоминаются.
Участники обсуждают, какие языки считаются "массивными", и почему некоторые, такие как MATLAB и R, не упоминаются.

It's just a virus, the E.R. told him – days later, he was dead (nytimes.com) 💬 Длинная дискуссия

—

by wallflower • 06 октября 2025 г. в 03:57 • 196 points

Оригинал • HN

Комментарии (331)

Проблемы информационных систем и автоматических оповещений в больницах, которые могут блокировать процесс лечения и отвлекать врачей.
Нехватка медицинского персонала и ресурсов, усугубленная старением населения и пандемией COVID-19, ведущая к снижению качества обслуживания.
Врачебные ошибки и сложности диагностики, особенно в случаях с нетипичными симптомами, такие как сепсис.
Выгорание врачей из-за высокой нагрузки, работы с хроническими пациентами и бюрократической системы, ориентированной на прибыль, а не на пациента.
Необходимость системных изменений: увеличения числа врачей, улучшения подготовки, упрощения иммиграционных путей для иностранных специалистов и реформы оплаты труда.

Babel is why I keep blogging with Emacs (entropicthoughts.com)

Автор испытывает двойственные чувства к своему блогинговому процессу в Emacs. С одной стороны, он завидует простым статическим генераторам сайтов, которые можно написать за пару тысяч строк кода и полностью контролировать. С другой, он продолжает использовать Org mode со встроенной публикацией, несмотря на её сложность и непрозрачность — экспортный код Org составляет свыше 20 000 строк, что делает его глубокое понимание практически невозможным.

Ключевая причина, по которой он не переходит на простой кастомный движок — это Babel, мощная система Org для выполнения кода прямо во время экспорта. Она позволяет запускать блоки кода на множестве языков, вставлять результаты (включая таблицы и изображения) в статью и использовать сессии для переиспользования данных. Это незаменимо для одновременной работы с данными, графиками и текстом, особенно в R.

Таким образом, несмотря на желание упростить процесс, необходимость в функциональности Babel перевешивает — её реализация с нуля заняла бы месяцы, что неприемлемо при ограниченном времени. Автор смиряется с сложностью Emacs, ценя его уникальные возможности.

by ibobev • 02 октября 2025 г. в 18:06 • 248 points

Оригинал • HN

#emacs #org-mode #babel #r #hugo #zola #pelican #astro #pandoc #quarto

Комментарии (71)

Участники обсуждают использование Emacs и Org-mode для ведения блогов, включая выполнение кода через Babel и экспорт в различные форматы.
Многие перешли на статические генераторы сайтов (Hugo, Zola, Pelican, Astro) из-за простоты или ограничений Org-mode, но некоторые интегрируют его через ox-hugo.
Поднимаются вопросы о недостатках привязки разметки к редактору, преимуществах чистого Markdown и альтернативах вроде Pandoc или Quarto.
Некоторые предпочитают минималистичные подходы: публикация сырых текстовых файлов или использование собственных скриптов для загрузки на S3.
Отмечаются сложности с поддержкой формул, интерактивностью и зависимостями в различных инструментах.

Correctness and composability bugs in the Julia ecosystem (2022) (yuri.is)

После многолетнего активного использования Julia для анализа данных и разработки пакетов автор перестал рекомендовать язык из-за серьёзных проблем с корректностью и композируемостью. В экосистеме Julia наблюдается высокая частота критических ошибок, которые проявляются даже в базовых операциях: например, функции sum! и prod! иногда молча возвращают неверные результаты, а выборка из распределений может давать смещённые или некорректные значения.

Особенно уязвимы комбинации пакетов или нестандартные типы данных — Euclidean Distance не работает с векторами Unitful, а макрос @distributed ломается при использовании OffsetArrays. Многие ошибки приводят к выходу за границы памяти или тихим неверным вычислениям, что ставит под сомнение надёжность любых сложных расчётов. Практический вывод: в проектах, где важна точность, Julia может представлять неприемлемый риск.

by cs702 • 30 сентября 2025 г. в 15:46 • 89 points

Оригинал • HN

#julia #python #rust #go #pytorch #jax #tensorflow #tidyverse #r

Комментарии (36)

Участники обсуждают проблемы с корректностью и стабильностью экосистемы Julia, включая критические баги в базовых пакетах и проблемы совместимости.
Высказываются опасения, что эти проблемы делают язык неподходящим для проектов, где важна точность, несмотря на его элегантность и производительность.
В качестве альтернатив для научных вычислений упоминаются Python с библиотеками (PyTorch, Jax, TensorFlow), R (и tidyverse), а также Rust и Go.
Некоторые пользователи делятся негативным опытом из-за невыполненных обещаний (например, быстрая компиляция) и переходят на другие языки.
Обсуждается актуальность критики, поскольку некоторые примеры проблем датируются 2024 годом, несмотря на то, что исходный пост мог быть написан ранее.

Statistical Physics with R: Ising Model with Monte Carlo (github.com)

Проект isingLenzMC реализует метод Монте-Карло для классической модели Изинга с использованием высокопроизводительной библиотеки на языке C. Основная цель — эффективное моделирование фазовых переходов в магнитных системах, где спины атомов могут находиться в двух состояниях. Алгоритм учитывает взаимодействие ближайших соседей через гамильтониан Ленз-Джонса, что позволяет точно описывать критические явления.

Код оптимизирован для многопоточных вычислений и поддерживает различные конфигурации решётки, что делает его полезным для исследований в статистической физике и материаловедении. Проект включает примеры использования, документацию и тесты, упрощающие интеграцию в научные расчёты. Практическая ценность заключается в ускорении симуляций без потери точности, что особенно важно для изучения свойств материалов вблизи точки Кюри.

by northlondoner • 19 сентября 2025 г. в 09:19 • 99 points

Оригинал • HN

#r #c #monte-carlo #ising-model #statistical-physics #multithreading #scientific-computing #quantum-ergodicity #github

Комментарии (60)

Обсуждается внезапный интерес к старому репозиторию с методами статистической физики, возможно, связанный с новой статьей Google по квантовой эргодичности.
Участники просят порекомендовать учебные материалы по методам Монте-Карло для начинающих и делятся ссылками на книги и лекции.
Затрагивается вопрос о различии терминов "Statistical Physics" и "Statistical Mechanics" (признаны синонимами).
Обсуждается роль экосистемы R для воспроизводимых исследований и её потенциальная конкуренция с Python в области научных вычислений.
Высказывается мнение, что моделирование одномерной модели Изинга является базовым упражнением, но может быть полезно для понимания эргодичности.

R MCP Server (github.com)

Разработан сервер RMCP для взаимодействия с моделями через стандартизированный протокол MCP (Model Context Protocol). Это позволяет инструментам разработки, таким как редакторы кода и IDE, безопасно подключаться к ИИ-моделям и получать от них данные, контекст и исполняемые команды.

Сервер обеспечивает стандартизированный интерфейс для запросов к моделям, упрощая интеграцию ИИ в рабочие процессы разработки. Подход повышает безопасность и контролируемость, отделяя инструменты от конкретных реализаций моделей.

by neehao • 17 сентября 2025 г. в 00:18 • 93 points

Оригинал • HN

#r #mcp #llm #data-analysis #statistics #github

Комментарии (13)

Обсуждение выражает скептицизм по поводу способности инструмента преодолеть фундаментальные проблемы анализа данных, такие как смещения в данных и ошибки в построении выборок.
Участники отмечают существование альтернативных решений (пакет mcptools) и задаются вопросом о целесообразности разработки именно этого проекта.
Высказываются опасения, что автоматизация статистического анализа с помощью ИИ усугубит проблемы p-хакерства и приведет к потоку некачественных исследований.
Поднимается вопрос о практической необходимости сервера для R, учитывая, что современные ИИ (например, GPT-5) уже могут использовать Python для вычислений.
Отмечается, что инструмент не защищает пользователей от статистической безграмотности и не заменяет критического мышления и понимания процесса сбора данных.

If all the world were a monorepo (jtibs.substack.com) 🔥 Горячее

—

by sebg • 16 сентября 2025 г. в 08:33 • 255 points

Оригинал • HN

#r #cran #monorepo #dependency-management #backward-compatibility #python #npm #api-versioning #containerization #statistics

Комментарии (69)

Обсуждаются строгие правила CRAN для R-пакетов, требующие обратной совместимости и тестирования всех зависимых пакетов при обновлении, что сравнивают с монорепозиторием.
Поднимаются проблемы других экосистем (Python, npm), где распространены ломающие изменения и конфликты зависимостей, и отмечается стабильность R.
Участники спорят о практичности подхода CRAN: одни видят в нём бремя для разработчиков, другие — выгоду для научной воспроизводимости и пользователей.
Предлагаются альтернативы и обходные пути, такие как полное форкирование, версионирование API или контейнеризация.
Отмечается уникальная философия R-сообщества, ориентированная на статистиков, а не на разработчиков, что объясняет такие жёсткие требования.

R-Zero: Self-Evolving Reasoning LLM from Zero Data (arxiv.org)

R-Zero — это метод, который учит языковую модель рассуждать, не используя ни одного человеческого примера.
Ключевая идея: модель сама генерирует задачи, решает их, проверяет ответы и оставляет только правильные цепочки мыслей. Эти «чистые» примеры сразу же идут в дообучение. Процесс повторяется циклически: чем лучше становится модель, тем сложнее и качественнее задачи она себе придумывает.

Алгоритм за один цикл:

Сэмплируем случайный топик и просим модель придумать задачу.
Просим сгенерировать решение в виде цепочки рассуждений.
Даём модели тот же вопрос, но теперь требуем краткий финальный ответ.
Сравниваем два ответа; если совпали — цепочка считается верной и сохраняется.
На собранных «правильных» примерах делаем шаг SFT.

Чтобы не «схлопнуться» на простых темах, в генерацию добавляют случайный уровень сложности и случайный предмет. Для проверки используются как точные (арифметика, логика), так и приближённые критерии (самосогласованность, повторное голосование).

Эксперименты на базе Llama-3-8B показали:

Всего 10 циклов × 20k примеров → +20% на GSM8K и +15% на MATH без единого человеческого примера.
R-Zero догоняет модель, обученную на 750k размеченных цепочках от человека.
При добавлении 5k человеческих примеров результат превышает лучшие supervised-базлайны.

Вывод: модель может «вырасти» из нуля, постоянно улучшая себя собственными правильными рассуждениями.

by lawrenceyan • 10 сентября 2025 г. в 02:02 • 98 points

Оригинал • HN

#machine-learning #llm #self-supervised-learning #natural-language-processing #llama-3-8b #gsm8k #math #deepseek #arxiv #r

Комментарии (51)

Участники спорят, возможно ли «обучение с нуля» без внешних данных: кто-то видит в этом GAN-подобный процесс, кто-то называет «информационным вечным двигателем».
Главный вопрос — что служит «дискриминатором» реальности: если только внутренние игры Challenger/Solver, риск усиления галлюцинаций высок.
Название «R-Zero» вызвало недовольство: у DeepSeek уже была модель R-Zero, и путаница неуместна.
Скептики сравнивают идею с perpetuum mobile и шутят о «бесплатной энергии» через +0,25 % в год.
Практическая польза — экономия на дообучении: сжатие большой модели в меньшую без новых данных, но в рамках уже освоенного распределения.

LabPlot: Free, open source and cross-platform Data Visualization and Analysis (labplot.org)

LabPlot — бесплатное кроссплатформенное ПО с открытым кодом для визуализации и анализа данных.

Ключевые возможности

Качественные графики и интерактивные диаграммы в пару кликов
Статистика, регрессия, аппроксимация и фитинг пиков
Интерактивные блокноты Python, R, Julia и др.
Извлечение данных из изображений и поддержка потоковых данных
Импорт/экспорт множества форматов
Windows, macOS, Linux, FreeBSD, Haiku

Свежие новости

2.12.1 (18 авг 2025) — мелкие улучшения и исправления
2.12 (28 апр 2025) — крупное обновление после долгой разработки
Дек 2024 — обновлённое руководство пользователя

Скачать | Возможности

by turrini • 22 августа 2025 г. в 09:11 • 232 points

Оригинал • HN

#data-visualization #data-analysis #python #r #julia #sqlite #linux #windows #macos

Комментарии (37)

Участники обсуждают LabPlot как FOSS-альтернативу Origin/JMP/Tableau для научного графика.
Сравнивают: гибкость ggplot2, устарелость Excel/SAS, удобство GUI для не-программистов.
Плюсы: drag-and-drop, встроенный импорт CSV/TSV, лицензия GPLv2+.
Минусы: пока только SQLite, нет прямого REST/S3/Iceberg, неясно, как быстро копировать стили.
Целевая аудитория — инженеры и учёные, которым нужен GUI-построитель графиков без кода.

WebR – R in the Browser (docs.r-wasm.org)

WebR — R в браузере (v0.5.6-dev).
Старт: скачать, раздавать страницы, примеры.
Основы: обмен с воркером, выполнение R-кода, графика, сеть.
Объекты: управление, конвертация JS ↔ R, создание.
Пакеты: установка, сборка, монтирование данных.
API:
- R API
- JS API: модули Channel, Message, Proxy, Queue, WebR, …; классы WebR, RObject, RDataFrame, Console, Shelter, …; интерфейсы WebROptions, EvalROptions, InstallPackagesOptions, …

by sieste • 19 августа 2025 г. в 14:36 • 137 points

Оригинал • HN

#r #wasm #ggplot2 #blas #quarto #r-markdown #julia #pwa

Комментарии (32)

WebR запускает R прямо в браузере через WASM, позволяя строить ggplot2 и другие вычисления без сервера.
Пользователи делятся демо-репозиториями, минимальными HTML-примерами и расширениями Quarto/R Markdown.
Обсуждаются размер WASM-блоба (≈12 МБ), производительность BLAS и возможность офлайн-работы как PWA.
Упоминаются альтернативы: JupyterLite-xeus, Pluto.jl и попытки «Julia в браузере», но они ещё незрелые.

Positron, a New Data Science IDE (posit.co)

Positron — бесплатный IDE для дата-сайенса, поддерживающий Python и R.
Скачать

Продукты

Enterprise: Posit Connect, Workbench, Package Manager
Cloud: Posit Cloud, Connect Cloud, shinyapps.io

Open Source

IDE: Positron, RStudio, RStudio Server
Библиотеки: Tidyverse, ggplot2, dplyr, Quarto, Shiny, vetiver
Интеграции: dbplyr, sparklyr, googlesheets

Истории клиентов

Suffolk, Trillium, Unity Health, NASA, Dow

Партнёры

Платформы: Snowflake, Databricks, SageMaker
Облака: AWS, Azure, GCP

by kgwgk • 19 августа 2025 г. в 14:20 • 135 points

Оригинал • HN

#positron #r #python #tidyverse #ggplot2 #dplyr #quarto #shiny #aws #azure

Комментарии (42)

Пользователи хвалят Positron за плавный переход из RStudio/VSCode и улучшенные возможности DS, но жалуются на отсутствие inline-графиков в Quarto и медленное внедрение.
Разработчики подтверждают: форк нужен, потому что VSCode-расширения не позволяют глубоко интегрировать языковые сервисы, тулбары и кастомные UI.
Некоторые считают продукт «ещё одним форком VSCode» и сомневаются в его нишевости между RStudio, VSCode, Spyder и PyCharm.
Поддержка WSL пока отсутствует, а цены на RStudio Server выросли, что усиливает интерес к Positron в академической среде.
Важнейший запрос — inline-вывод в Quarto; его уже рассматривают, и есть настройка для привычных хоткеев RStudio.

Simulating and Visualising the Central Limit Theorem (blog.foletta.net)

Кратко о ЦПТ
Если из любого распределения с конечным средним и дисперсией брать выборки размера n и считать их средние, то при n → ∞ распределение этих средних стремится к нормальному.

Эксперимент
Сгенерировано по 10 000 значений из шести распределений: uniform, normal, binomial, beta, exponential, χ².
Функция take_random_sample_mean() берёт случайную выборку размера 60 и возвращает среднее. Повторено 20 000 раз.

take_random_sample_mean <- function(data, n) {
  slice_sample(data, n = n) |> summarise(across(everything(), list(mean = mean, sd = sd)))
}

Результаты
Гистограммы 20 000 средних показывают, что даже для сильно ненормальных исходных распределений форма распределения средних близка к нормальной.

by gjf • 15 августа 2025 г. в 06:11 • 143 points

Оригинал • HN

#statistics #probability #central-limit-theorem #r #data-analysis #visualization #distributions #sampling

Комментарии (55)

Обсудили аналог ЦПТ для экстремумов — теорему Фишера–Типпета–Гнеденко (GEV).
Подчеркнули важность симуляций для интуитивного понимания ЦПТ и поделились ссылками на визуализации.
Отметили, что скорость сходимости к нормальному распределению зависит от исходного распределения (экспоненциальное сходится медленнее).
Упомянули обобщения ЦПТ: для распределений без конечной дисперсии, ряды Эджворта, устойчивые распределения.
Предупредили о риске завышенных ожиданий из-за «хорошо ведущих себя» примеров и дали ссылки на литературу.

The rising returns to R&D: Ideas are not getting harder to find (papers.ssrn.com)

Контекст: рост R&D не повышает агрегатную производительность, но это не потому, что «идеи труднее находить».
Данные: микростатистика Census Bureau по обрабатывающей промышленности США, 1976–2018.
Результаты:
- Эластичность TFP по R&D и предельная отдача от R&D резко выросли.
- Причина — ускоренное устаревание технологий из-за роста технологического соперничества.
Вывод: R&D становится эффективнее, но быстрая моральное устаревание инноваций сдерживает рост общей производительности.

by surprisetalk • 14 августа 2025 г. в 23:58 • 113 points

Оригинал • HN

#r-d #productivity #technology #innovation #oecd #patents #llm #gdp #r

Комментарии (48)

Авторы считают, что рост R&D не даёт прироста производительности из-за ускоренного устаревания, но альтернативное объяснение — внешние факторы снижают производительность, и R&D лишь компенсирует это.
OECD утверждает: Китай «обесценивает» западные R&D на ~$500 млрд в год, выгодно быть «быстрым последователем».
Патентные «минные поля» и AI-мониторинг нарушений делают идеи труднее применимыми, несмотря на их изобилие.
«Эффект красной королевы»: компании вынуждены всё больше тратить на R&D, лишь чтобы сохранять позицию.
В производстве одна новая инновация может аннулировать выгоды предыдущей, что искажает статистику.
Методология сравнения абсолютных затрат R&D с относительным ростом вызывает сомнения; корректнее смотреть долю R&D в ВВП или абсолютный прирост.