LLMs can get "brain rot" 🔥 Горячее 💬 Длинная дискуссия
Исследователи из Техасского университета и Университета Пердью обнаружили, что большие языковые модели подвержены "гниению мозга" — когнитивному ухудшению при обучении на низкокачественном контенте. Эксперименты с четырьмя LLM, обучавшихся на "мусорных" данных Twitter/X, показали значительное снижение (Hedges' g > 0.3) способностей к рассуждениям, пониманию длинных контекстов и безопасности, а также рост "темных черт" вроде психопатии. При смешивании мусорных и качественных данных наблюдалось дозозависимое ухудшение: например, точность на ARC-Challenge с цепочкой мыслей падала с 74.9% до 57.2% при увеличении доли мусора с 0% до 100%.
Главной проблемой стал пропуск или обрыв цепочек рассуждений у моделей. Хотя попытки исправить ситуацию через настройку инструкций и обучение на чистых данных частично улучшили показатели, полностью восстановить исходный уровень не удалось, что указывает на стойкое смещение представлений. Интересно, что популярность твита оказалась лучшим индикатором эффекта "гниения мозга", чем его семантическое качество, что подчеркивает важность не только содержания, но и формата данных для обучения ИИ.
Комментарии (275)
- Обсуждение свелось к тому, что качество данных определяет качество модели: «мусор на входе — мусор на выходе».
- Участники отмечают, что если в корпусе есть токсичные или низкокачественные тексты, то модель будет деградировать так же, как и человек, потребляющий такой контент.
- Кто-то вспомнил, что в 2024 г. OpenAI и Anthropic уже публиковали статьи о том, что «brain rot» влияет на LLM, но сообщество в целом не придало этому значения.
- Другой участник подметил, что если мы не можем контролировать, что именно модель «читает» в сети, то мы не должны удивляться, что она ведет себя как токсичный токсик.
- Несколько человек согласились, что метафора «brain rot» сама по себе вводит в заблуждение, потому что модели не имеют ни мозга, ни познавательных способностей, и что важно фокусироваться на том, что мы действительно имеем дело с алгоритмами, а не с «искусственным мозгом».
UA 1093
X.com сообщает пользователям об отключенном JavaScript, требуя включить его или перейти на поддерживаемый браузер для продолжения работы. Сообщение содержит ссылку на Центр помощи с перечнем совместимых браузеров и юридические документы: Условия использования, Политику конфиденциальности, Политику cookie и другие. Появляется кнопка "Попробовать снова" и предупреждение о возможных проблемах с расширениями для конфиденциальности, которые рекомендуется отключить.
Внизу страницы указано, что что-то пошло не так, но не стоит волноваться — можно повторить попытку. Интересно, что сообщение содержит ссылку на будущую дату © 2025 X Corp, что может указывать на шаблонность текста или плановые обновления. Пользователям также предлагают ознакомиться с информацией о рекламе и юридическими данными компании.
Комментарии (79)
The system is designed to not pose a risk to human life in the worst case event of a collision. This is what the FAA 101 and ICAO weight limits are for. And indeed, there were no serious injuries and no depressurization event to my knowledge as a result of the collision.This se
Ilo – a Forth system running on UEFI
Asciinema — платформа для записи и обмена терминальными сессиями, позволяющая пользователям сохранять командную работу в различных форматах. На представленном примере запись "untitled" от пользователя crc набрала 3676 просмотров и доступна для скачивания в оригинальном формате .cast, текстовом варианте .txt или в виде анимированного GIF. Платформа поддерживает воспроизведение в терминале с помощью asciinema play и встраивание на веб-сайты через специальный плеер.
Пользователи могут делиться записями с параметрами запуска (например, указывать время начала воспроизведения через ?t=30), встраивать скриншоты в README проектов и конвертировать терминальные сессии в GIF с помощью утилиты agg. Asciinema также предоставляет CLI-инструменты для локального воспроизведения записей и предлагает варианты встраивания для различных платформ, включая HTML и Markdown.
Комментарии (42)
- Обсуждение охватывает от Open Firmware и Forth до внутреннего конфликта имени ILO/ILO и влияния на OLPC, а также затрагивает вопросы эстетики и практичности в контексте встроенного ПО и влияния на разработчиков.
- Участники обсуждают, что такое "открытая прошивка" и как она влияет на разработчиков и пользователей, а также затрагивает вопросы лицензирования и патентов.
- Обсуждение также затрагивает вопросы влияния на OLPC и другие проекты, а также затрагивает вопросы влияния на пользователей и разработчиков.
- Участники также обсуждают, как влияет выбор инструментов на разработчиков и их продуктивность, а также затрагивает вопросы влияния на пользователей.
Our modular, high-performance Merkle Tree library for Rust
Реализация дерева Меркла на Rust с поддержкой настраиваемых бэкендов хранения и хеш-функций. Проект предлагает фиксированную глубину дерева и только инкрементальное добавление элементов, что упрощает использование в определенных сценариях. Основная цель библиотеки - обеспечить эффективную работу с криптографическими доказательствами.
Особое внимание уделено оптимизации скорости генерации доказательств, что критически важно для приложений, требующих быстрой проверки целостности данных. Библиотека предоставляет гибкость в выборе хеш-функций и механизмов хранения, позволяя адаптировать решение под конкретные требования производительности и безопасности.
Комментарии (26)
- Выпущена библиотека
rs-merkle-tree— высокопроизводительная, модульная реализация Merkle-дерева с фиксированной глубиной и строго аппенд-онли. - Пользователи отметили её применимость в криптографических и блокчейн-сценариях, а также попросили рекомендации по обучающим материалам для новичков в этой области.
- Сообщество отметило, что документация и примеры кода помогут новичкам лучше понять, как использовать Merkle-деревья в сертификатах прозрачности и других примерах.
NASA chief suggests SpaceX may be booted from moon mission 🔥 Горячее 💬 Длинная дискуссия
Глава NASA намекнул на возможное расторжение контракта SpaceX по программе посадки на Луну, что ставит под угрозу один из ключевых элементов космической программы США. Контракт стоимостью 2,9 миллиарда долларов был заключен в 2021 году для разработки лунного модуля Starship, который должен доставить астронавтов на поверхность Луны в рамках программы Artemis. По словам главы NASA, существуют серьезные сомнения в способности SpaceX выполнить обязательства в установленные сроки.
SpaceX столкнулась с задержками в разработке Starship, включая неудачные испытания ракеты-носителя. NASA выразила обеспокоенность тем, что задержки могут повлиять на график всей программы Artemis, которая уже перенесена несколько раз. Агенство рассматривает альтернативные варианты, включая привлечение других компаний, таких как Blue Origin и Dynetics, которые ранее проиграли тендер, но теперь могут получить шанс участвовать в лунной программе.
Комментарии (985)
- Проект Artemis оказался заложником политики: SLS и Orion продолжают получать финансирование, несмотря на отставание графика и бюджета, в то время как более современные и дешёвые альтернативы уже существуют.
- Контракты на поставку ракет и космических кораблей для миссии Artemis были отменены, потому что SpaceX не может быть удобным для политического статус-кво, в то время как Boeing и другие подрядчики продолжают получать деньги несмотря на отсутствие прогресса.
- Попытка NASA в 2025 году отменить контракт на использование Starship в качестве лунного посадочного модуля была вызвана нежеланием признать, что SpaceX разработал более дешёвую и способную к повторному использованию альтернативу, которая делает SLS и Orion неактуальными.
- В то время как Starship предлагает революционизировать космическую индустрию так же, как Falcon 9 это сделал для орбитальных запусков, политика вместо этого требует продолжения использования неэффективных и дорогих контрактов, которые не могут даже предоставить доступ к космосу.
- Вопрос остаётся открытым: почему NASA должна продолжать тратить десятки миллиардов долларов на контракты, которые не могут даже доставить груз на орбиту, в то время как уже существующая технология может это сделать в разы дешевле и быстрее?
Neural audio codecs: how to get audio into LLMs 🔥 Горячее
Текущие речевые LLM работают как обертка: преобразуют речь в текст, обрабатывают его и затем синтезируют ответ обратно в речь, что не позволяет улавливать нюансы интонации, сарказма или эмоций. Даже передовые модели вроде Gemini или ChatGPT с продвинутым голосовым режимом не могут ответить на вопрос о высоте голоса, демонстрируя отставание речевых моделей от текстовых. Проблема в том, что за одну секунду аудио содержится десятки тысяч выборок, в отличие от нескольких слов в тексте, что делает обработку аудио значительно сложнее.
Решением являются нейроаудио-кодеки, такие как Mimi от Kyutai, которые сжимают аудио в более управляемые дискретные токены, аналогично токенизации текста. Вместо предсказания аудио выборка за выборкой, как в ранних моделях вроде WaveNet, кодеки преобразуют непрерывные значения в 256 дискретных "вёдер" с помощью μ-law алгоритма. Этот подход позволяет LLM обрабатывать аудио как последовательность токенов, предсказывать продолжение и затем декодировать обратно в аудио, открывая путь к настоящему пониманию речи.
Комментарии (115)
- Обсуждение охватывает широкий спектр тем: от токенизации аудио до фундаментальных вопросов о том, как моделируются речь и звук, и почему это важно для будущего ИИ.
- Участники обсуждают, что вместо попыток заставить модели распознавать и генерировать речь, мы должны сосредоточиться на создании моделей, которые могут работать с непрерывными сигналами и, таким образом, избегая необходимости в токенизации аудио.
- Обсуждается, что вместо того, чтобы полагаться на существующие аудио кодеки, такие как MP3, мы должны развивать нейрональные кодеки, которые могут быть обучены вместе с моделью и, таким образом, позволяя ей напрямую работать с компактным, дискретным представлением аудио.
- Участники также обсуждают, что вместо того, чтобы пытаться обучить модель на транскрибированном тексте, мы должны использовать аудио-ориентированные данные, которые включают в себе всю информацию, которая теряется при транскрибции. Это может включать в себе обучение модели на транскрибированном тексте, который может быть использован для тренировки TTS-моделей.
SpaceX is behind schedule, so NASA will open Artemis III contract to competition
NASA откроет контракт на разработку лунного модуля для миссии Artemis III для открытого конкурса, отказавшись от первоначального плана передать контракт компании SpaceX. Это решение последовало после критики со стороны Сената и других компаний, таких как Blue Origin и Dynetics, которые оспаривали первоначальное выделение SpaceX всей суммы в $2.9 млрд без конкурентного тендера.
Программа Artemis III должна вернуть людей на Луну впервые с 1972 года, с запланированной высадкой в 2025-2026 годах. NASA теперь планирует разделить контракт на несколько частей, позволив нескольким компаниям разработать свои варианты лунного модуля. Это изменение политики направлено на стимулирование инноваций и снижение рисков за счет диверсификации поставщиков, хотя оно может задержать график миссии из- необходимости координации между несколькими системами.
Комментарии (112)
- Проект Artemis с самого начала был политически мотивирован, а не технически обоснован.
- SLS и Orion продолжают получать финансирование, несмотря на то, что их технологическое устаревание уже очевидно.
- SpaceX и другие компании, которые могли бы предложить более дешёвые и быстрые решения, исключены из конкуренции на рынке, где стоимость запуска ракеты варьируется от 10 до 20 тысяч долларов за килограмм полезной нагрузки.
- Пока что нет никакой серьёзной альтернативы, и это оставляет только один игрока на поле.
- Это ведёт к тому, что нет никакого стимула для конкуренции или инноваций, и в то же время, что влияние может быть только в одном направлении.
StarGrid: A new Palm OS strategy game
Разработчик представил StarGrid — новую стратегическую игру в космической тематике для Palm OS 2025 года выпуска. Проект, изначально планировавшийся к завершению за месяц, занял более полугода. Игра представляет собой тактическую битву на шестиугольной сетке, где цель — захватить вражеские флаги или уничтожить противника. Несмотря на ограниченную память Palm OS и строгие лимиты на размер кода, автору удалось создать полностью оригинальную игру без использования готовых движков.
Игра доступна для бесплатной загрузки и может быть запущена в браузере через эмулятор CloudPilot. Разработчик подчеркивает, что StarGrid создан "с нуля", решая одну техническую задачу за другой. "Это мой способ поддерживать любимую портативную операционную систему в живых", — отмечает автор. Полностью открытый исходный код проекта уже доступен на GitHub, что может вдохновить других разработчиков создавать игры для этой платформы.
Комментарии (40)
- Ностальгия по Palm OS и его философии простоты, отсутствие подписок и фокусировка на одной задаче.
- Влияние Palm на современные устройства и то, как оно влияет на разработчиков и пользователей.
- Сообщество, которое помнит и ценит наследие Palm, и их вклад в дискуссию.
- Практические аспекты: эмуляторы, совместимость и то, что делает Palm уникальным.
- Люди делятся личными историями и эмоциональными связями с Palm.
Tesla is heading into multi-billion-dollar iceberg of its own making 💬 Длинная дискуссия
Tesla столкнулась с многомиллиардными проблемами из-за нереализованных обещаний о полностью автономном вождении. Компания в 2016 году заявила, что все автомобили с этого момента будут иметь "весь необходимый аппаратный комплекс для полностью автономного вождения", который станет доступен через будущие обновления. Однако это обещание оказалось невыполнимым - сначала Tesla использовала аппаратную платформу HW2, которая не поддерживала автономное вождение, затем перешла на HW3 (2019-2023), а в 2024 году представила HW4.
Изначально Илон Маск обещал задерживать обновления для новых автомобилей с HW4 на 6 месяцев, чтобы обеспечить обещанную функцию для тех, кто давно за нее заплатил, но эта стратегия просуществовала всего несколько месяцев. В результате все больше клиентов остаются без обещанных функций и требуют компенсаций, превращаясь в "айсберг" проблем, созданный самой Tesla.
Комментарии (201)
- Tesla продолжает продавать опцию FSD, но не предлагает переноса лицензии на новую машину, что делает покупателей заложниками старой.
- Покупатели, которые заплатили $15 000 за функцию, которую Tesla не может и не собирается поставить, теперь должны купить еще одну машину, чтобы получить то, что они уже оплатили.
- Компания не предлагает никакого пути апгрейда существующих машин до HW4, и это оставляет владельцам только выбор между потерей $15 000 и покупкой новой машины.
- В то же время, Tesla продолжает взимать $15 000 за FSD, хотя она не может быть использована на HW3, и не ясно, будет ли она когда-нибудь реализована.
Diamond Thermal Conductivity: A New Era in Chip Cooling
Алмазные покрытия обещают революцию в охлаждении микрочипов, решая проблему перегрева при увеличении плотности транзисторов. Исследователи разработали технологию нанесения тонких алмазных пленок на процессоры, которые отводят тепло в 5 раз эффективнее меди. Эти "алмазные одеяла" могут стать ключевым элементом для будущих чипов с тысячами ядер и сверхвысокими тактовыми частотами, где традиционные методы охлаждения уже неэффективны.
Технология основана на химическом осаждении алмазных пленок непосредственно на поверхности процессоров, создавая идеальный контакт для отвода тепла. По словам экспертов, алмазы обладают теплопроводностью до 2000 Вт/м·К, что в 5 раз превышает показатели меди. Это позволит создавать более мощные и компактные электронные устройства без риска перегрева. Первые коммерческие применения могут появиться уже в течение ближайших двух лет в высокопроизводительных серверах и специализированных вычислительных системах.
Комментарии (59)
- Исследователи из Стэнфорда показали, что внутри кристалла можно встроить слой алмаза для распределения тепла, что может позволить стекать 3D-чипы без перегрева.
- Технически это означает, что можно будет строить многослойные чипы, которые не будут ограничены тепловыми проблемами, как это было раньше.
- Однако, пока что не ясно, насколько это будет стоить и будет ли это доступно в течение жизни читателей.
- Пока что это только лабораторная технология, и никто не знает, когда она станет промышленной.