What's the strongest AI model you can train on a laptop in five minutes? 🔥 Горячее 💬 Длинная дискуссия
Сильнейшая модель за 5 минут на ноутбуке
Победитель: 1.8-млн-параметровный GPT-подобный трансформер, обученный на ~20 млн токенов TinyStories и показавший 9.6 перплексии. Пример:
Once upon a time, there was a little boy named Tim…
Ограничение времени
5 минут — это ~300 млн токен-шагов. Большие модели не успевают, мелкие (10 k) быстро выходят на плато. Оптимум — 1-2 млн параметров.
Скорость
На M1 Pro (MPS) достигал 3000 ток/с.
torch.compile
,float16
, MLX — без выгоды.- Градиентное накопление тормозит.
- Главное: минимальный размер модели и MPS.
Датасет
Simple Wikipedia давала факты без смысла («Paris, France is a city in North Carolina»).
TinyStories (рассказы уровня 4-летнего) — простые паттерны, мало имён, быстрая сходимость.
Комментарии (181)
- Обсуждение вращается вокруг тренировки маленьких языковых моделей на ноутбуке: почему это важно для науки и практики.
- Участники сравнивают ограничения по времени, энергии (джоулям) и железу; предлагают «AI-олимпиаду» за лучший результат на данный бюджет.
- Приводятся конкретные приёмы: Muon-оптимизатор, улучшенная инициализация, «cramming» за день на лэптопе, идея специализированных моделей «под задачу».
- Задаются вопросы о данных, переобучении, диффузных архитектурах и о том, когда марковская цепь окажется достаточной.
- В целом тон оптимистичен: даже на обычном ноутбуке можно быстро экспериментировать и учиться, не дожидаясь супер-кластеров.
Kodak says it might have to cease operations 🔥 Горячее 💬 Длинная дискуссия
Kodak предупредил о возможной остановке работы
133-летняя компания заявила, что из-за убытков и долгов в $1 млрд может прекратить операции. Пандемия и переход к цифровым технологиям ударили по продажам плёнки и фотобумаги.
Руководство ищет кредиты и рассматривает продажу активов, включая патенты. Акции упали на 40 %.
Комментарии (198)
- СМИ ошибочно объявили Kodak банкротом; компания опубликовала опровержение.
- Поводом стало стандартное SEC-раскрытие «going concern» из-за незавершённой продажи части пенсионных активов.
- Участники вспомнили банкротство 2012 г., провальный KodakCoin и упущенный переход к цифре.
- Сейчас Kodak держится на производстве киноплёнки и химикатов, но пенсии работников под угрозой сокращения выплат.
- Общий вывод: легендарный бренд ещё жив, но его будущее остаётся туманным.
Progress towards universal Copy/Paste shortcuts on Linux
На Linux Ctrl-C/Ctrl-V в терминале не работают, потому что Ctrl нужен для управляющих кодов. Приходится жать Ctrl+Shift+C/V. К 2025 году появится универсальное решение без лишнего ПО: старые коды клавиш Copy и Paste, которые Linux «знает» с древности.
Как это работает
-
Клавиатура
Программируемые клавиатуры (System76 Launch, Framework 16, ZSA Moonlander, Keychron Q10 и др.) позволяют назначить на любую клавишу слой, где C = Copy, V = Paste. Для активации слоя удерживается модификатор (например, «Raise» на моей Corne). -
Прошивка и конфигураторы
Производители дают свои утилиты (System76 Keyboard Configurator), а Vial поддерживает множество моделей. В слое можно вывести Copy/Paste на C/V, стрелки на домашний ряд и прочие удобства. -
ПО Linux
Приложения опираются на GUI-тулкиты GTK и Qt.- GTK добавил поддержку Copy/Paste-кодов в январе 2025.
- Qt внедрит их в версии 6.10 (сентябрь 2025).
Совокупность программируемого «железа» и обновлённых тулкитов даст единые горячие клавиши Copy/Paste во всех приложениях Linux без дополнительных твиков.
Комментарии (135)
- Участники жалуются на разнообразие клипбордов в Linux (X11, Vim, tmux) и их несогласованность.
- В терминалах приходится добавлять Shift к Ctrl-C/Ctrl-V, что ломает мышечную память и вызывает ошибки.
- Apple решает конфликт отдельным Cmd-ключом, но даже там приложения перехватывают сочетания непредсказуемо.
- Многие используют альтернативы: Ctrl/Shift-Insert, выделение + средняя кнопка мыши, ремап клавиш, покупку программируемых клавиатур.
- Единого механизма объявления и настройки шорткатов в Linux нет, поэтому Chrome и другие приложения игнорируют системные привязки.
Monero appears to be in the midst of a successful 51% attack 🔥 Горячее 💬 Длинная дискуссия
—
Комментарии (189)
- Группа Qubic собрала ~52 % хэшрейта Monero, но это не классический 51 %-атака: глобальный хэшрейт не вырос, другие пулы продолжают добычу, глубина реорганизации всего 6 блоков.
- Участники спорят, было ли это «доказательством концепции», тестом на уязвимости или просто спекулятивным шумом; официально Qubic называет это «плановым стресс-тестом».
- Стоимость поддержания атаки оценивается в $75 млн в день, что делает её экономически невыгодной, но позволяет временно цензурировать транзакции и проводить короткие реорганизации.
- Некоторые считают происходящее «фейком» или «ботовой вбросом», другие подозревают вмешательство государств, поскольку Monero — одна из немногих по-настоящему анонимных сетей.
- Вывод: доверие к сети пока не разрушено, но событие подчёркивает теоретическую уязвимость PoW-чейнов перед крупными игроками.
Qodo CLI agent scores 71.2% on SWE-bench Verified
Qodo Command набрал 71,2 % на SWE-bench Verified — стандартном бенчмарке для оценки способности агентов решать реальные задачи из GitHub.
- SWE-bench Verified включает 500 задач из 12 популярных репозиториев (Django, scikit-learn, sympy и др.).
- Каждая задача: описание бага/фичи + тест, который должен проходить после исправления.
- Оценивается только успешность прохождения тестов; стиль и качество кода не учитываются.
Результаты
- 71,2 % — новый рекорд среди публичных решений.
- +18,2 п.п. от предыдущего лидера (CodeStory Aide).
- +31,2 п.п. от первого релиза SWE-bench (2023).
Ключевые инсайты
- Контекст важнее модели: использование 128k-токенного окна и RAG-поиска по 500+ файлам дало +12 %.
- Итерации решают: 3–5 попыток сборки/тестов повышают успех на 8 %.
- Маленькие PR легче: задачи <30 строк кода решаются в 84 % случаев, >200 — лишь 38 %.
Что дальше
- Публикация детального тех-отчёта и открытого датасета.
- Расширение до 1 000 задач и добавление новых языков (Go, Rust).
Комментарии (43)
- Qodo показал 71,2 % на SWE-bench-verified — 5-е место, всего на 1 % уступая официальному Claude Sonnet 4.
- Участники сомневаются в честности результатов и просят независимую платформу с peer-review.
- Поднимаются вопросы о стоимости, эффективности, размере модели и специфике подготовки именно под тест.
- Обсуждают, что сам бенчмарк «закрыт» для Python-ошибок и не отражает реальную разработку.
- Некоторые уже отказались от Qodo в пользу BugBot и сомневаются в жизнеспособности «обёрток» над LLM.
Architecting large software projects [video]
-
YouTube
О проекте · Пресс-центр · Авторское право · Связаться · Авторам · Реклама · Разработчикам -
Правовые документы
Условия · Конфиденциальность · Политика и безопасность -
Дополнительно
Как работает YouTube · Тест новых функций · NFL Sunday Ticket
© 2025 Google LLC
Комментарии (51)
- Участники критикуют догматизм докладчика: его тезисы «всё — API без внутренностей», «модули пишет один человек» и «C89 навсегда» выглядят слишком жёсткими и не универсальными.
- Подчёркивают, что «good-enough-now API» неизбежны: требования меняются, а идеальный интерфейс предсказать невозможно.
- Отмечают, что советы могут работать для стабильных desktop-систем, но не для быстро меняющихся продуктов или веба.
- Напоминают о важности баланса: избыточная абстракция и YAGNI-функции создают техдолг, а полное отсутствие модульности — дублирование и баги.
ForgeFed: ActivityPub-based forge federation protocol
ForgeFed — протокол федерации для хостингов кода и инструментов разработки. Он позволяет разным сайтам обмениваться репозиториями, задачами, PR и т.д., не заставляя пользователей регистрироваться везде.
Расширяет ActivityPub: серверы обмениваются JSON-объектами, а репозитории и трекеры получают «входящие» для удалённого взаимодействия.
Статус
Следить за прогрессом можно в Fediverse и чатах Matrix/Libera.Chat #forgefed.
Реализации
Проект отдан в CC0; копируйте и делитесь!
Комментарии (33)
- Участники обсуждают, стоит ли связываться с ActivityPub/ForgeFed для федерации форджей или проще улучшить email-интеграцию.
- Forgejo уже начал внедрение, но до практической полезности ещё «годы работы»; GitLab тоже ведёт эпик по ActivityPub.
- Мечта — самостоятельно хостить репозитории, не теряя связи с сообществом, но пока приходится мириться с GitHub ради «сетевого эффекта».
- Сомнения в надёжности ActivityPub: пропадают медиа и часть ответов, хотя это скорее проблемы серверов, а не протокола.
- Прогресс полностью зависит от числа добровольцев: спецификация и реализации развиваются только тогда, когда люди берутся за код.
Show HN: XR2000: A science fiction programming challenge
XR2000 — новый программистский квест в жанре научной фантастики.
Он объединяет бинарные протоколы, криптографию и развёрнутый сюжет, который пока охватывает лишь первую главу. Дальнейшее зависит от интереса участников.
Вдохновение дали:
- TIS-100 — псевдоассемблер в игровой форме.
- Space Traders — космическая торговля через REST API.
- Protohackers — челленджи по сетевым протоколам.
Старт:
nc clearsky.dev 29438
Приятного погружения!
Комментарии (14)
- Участники делятся ссылкой на похожий Sci-Fi-контест 2006 года, где нужно писать собственную VM.
- Появился новый TCP-пазл на clearsky.dev:29438; при подключении требуется отправить 0-байт + «XR2K» для документации.
- Сервер перегружен HN, поэтому текст иногда не выводится или после команды ничего не происходит.
- Некоторые пробуют использовать LLM для упрощения игры.
- Один из игроков ждёт ответа «Colonel Arhci» по atlantiamail.
Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens
- Исследователи из Университета Аризоны показали: «цепочка мыслей» в LLM — хрупкая иллюзия.
- Модель хорошо копирует примеры из обучения, но при малейшем отклонении задачи логика рушится.
- Для проверки создали DataAlchemy: обучали крошечные LLM двум простым преобразованиям текста (ROT-шифр и циклический сдвиг), затем давали задания вне этой области.
- Даже умеренный сдвиг распределения резко снижал точность, подтверждая, что «рассуждение» — лишь имитация известных шаблонов.
Комментарии (83)
- Исследование на «игрушечных» GPT2-моделях вызывает споры: критики считают, что выводы нельзя экстраполировать на большие LLM.
- Участники сходятся во мнении, что LLM не «рассуждают», а лишь имитируют рассуждения, особенно при выходе за пределы обучающих паттернов.
- Некоторые считают такие работы полезными для развенчания гиперболы вокруг «магии» LLM и снижения завышенных ожиданий.
- Другие подчеркивают, что даже если модель «угадывает» ответ, это не доказывает наличие логики, а лишь показывает интерполяцию.
Compiler Bug Causes Compiler Bug: How a 12-Year-Old G++ Bug Took Down Solidity
Краткий обзор
- Проблема: компилятор Solidity (solc) падает на Ubuntu 22.04 при компиляции корректного кода.
- Причина: сочетание трёх факторов
- 12-летний баг G++ (< 14) в разрешении перегрузок.
- Устаревший паттерн сравнения в Boost.
- Новые правила симметричных сравнений C++20.
Цепочка событий
- Баг G++ (2012, GCC-53499): при
boost::rational<T> == 0
компилятор до 14-й версии выбирает нечлен-шаблон вместо член-шаблона. - C++20 добавляет автоматическую перестановку аргументов:
0 == rational<T>
→rational<T> == 0
. - Boost 1.74 предоставляет обе версии оператора, что приводит к бесконечной рекурсии и переполнению стека.
Минимальный пример
template<typename T>
struct rational {
template<class U>
bool operator==(const U&) const { return true; }
};
template<class U, class T>
bool operator==(const rational<T>&, const U&) { return false; }
int main() {
rational<int> r;
return r == 0; // g++11 выбирает free-функцию
}
Как починить
- Обновить GCC ≥ 14 или Clang, или
- Собрать Solidity без C++20 (
-std=c++17
), или - Патч Boost/использовать свежий Boost ≥ 1.82.
Итог
Ни один компонент по отдельности не «сломан», но их комбинация приводит к крашу компилятора на валидном коде.
Комментарии (74)
- 12-летний баг разрешения перегрузок в GCC + новый оператор <=> C++20 = краш компилятора Solidity.
- Проблема в том, что «каждый компонент по отдельности не сломан», но вместе дают сбой.
- Участники обвиняют чрезмерную сложность C++, отсутствие тестов при обновлении стандарта и «бесконечные надстройки» вроде spaceship-оператора.
- Кто-то предлагает «python2to3-момент» для C++, другие считают смарт-контракты плохой идеей из-за неизбежных багов.
- Лицензия SPDX в примере вызывает вопросы, но Solidity требует её наличие, иначе ошибка компиляции.