Тег: #scalability — Hacker News Digest

Show HN: Why write code if the LLM can just do the thing? (web app experiment) (github.com) 🔥 Горячее 💬 Длинная дискуссия

Предоставленный контент — это навигационное меню GitHub для репозитория "samrolken/nokode", без описания самого проекта. На странице отсутствует информация о функционале, целях или особенностях nokode.

В интерфейсе присутствуют стандартные элементы GitHub: поиск, разделы для Enterprise, Pricing, Open Source, Resources и Solutions. Нет ни README, ни кода, ни обсуждений — только базовая структура страницы репозитория.

Для получения информации о проекте потребуется доступ к содержимому репозитория или его документации.

by samrolken • 01 ноября 2025 г. в 17:45 • 389 points

Оригинал • HN

#llm #code-generation #security #performance #cost #scalability #experiment #github

Комментарии (279)

Обсуждение показало, что «генерация кода на лету» вызывает споры: кто-то считает это будущим, другие указывают на проблемы с безопасностью, стоимостью и предсказуемостью.
Участники обсуждали, что вместо генерации кода, можно кешировать уже созданные компоненты и переиспользовать их, что может решить проблему с производительностью.
Некоторые комментаторы подчеркнули, что даже если LLM сгенерирует код, его все равно придется тестировать и поддерживать, и это может быть небезопасно.
Также обсуждались вопросы стоимости и устойчивости такого подхода, особенно если учесть, что модели становятся дороже.
В целом, участники согласились, что идея интересная как эксперимент, но пока не ясно, как она может масштабироваться или стать нормой практикой безопасной.

AWS to bare metal two years later: Answering your questions about leaving AWS (oneuptime.com) 🔥 Горячее 💬 Длинная дискуссия

—

by ndhandala • 29 октября 2025 г. в 11:14 • 628 points

Оригинал • HN

#aws #bare-metal #cloud #scalability

Комментарии (432)

Обсуждение в основном вращается вокруг тезиса: «облако vs bare-metal» — участники спорят, когда и почему стоит выбирать тот или иной подход, и какие скрытые затраты могут быть упущены при сравнении цен.
Участники подчеркивают, что AWS и другие облачные провайдеры могут быть дороже, чем bare-metal, особенно при стабильной нагрузке, и что стоимость может быть скрыта в дополнительных услугах, таких как передача данных.
Некоторые участники утверждают, что облачные провайдеры предоставляют удобство и гибкость, которые могут быть важны для стартапов и команд, которые не хотят тратить время на инфраструктуру.
Другие участники подчеркивают, что bare-metal может быть более экономичным для стабильных рабочих нагрузок и что облачные провайдеры могут быть дороже, чем кажется на первый взгляд.
Некоторые участники также упоминают, что облачные провайдеры могут быть более устойчивы к сбоям и предоставляют дополнительные услуги, такие как автоматическое масштабирование и управление.

1X Neo – Home Robot - Pre Order (1x.tech)

—

by denysvitali • 28 октября 2025 г. в 18:01 • 132 points

Оригинал • HN

#robotics #llm #teleoperation #hardware #design #security #privacy #scalability #consumer-electronics

Комментарии (125)

Пользователи обсуждают, что за 20 000 $ покупатель получает лишь «голый» робот без ИИ и без подписки, а все «умные» действия фактически выполняются удалённым оператором из Филиппин.
Сомнения в надёжности компании: неясно, как она финансирует бесплатную доставку по всему миру, и почему она не может позволить себе инвестировать в R&D, чтобы робот стал автономным.
Критика дизайна: «робот выглядит как злодей из фильма ужасов», «почему он не может быть на колёсиках, как Roomba, вместо ног?» — и как это скажется на безопасность и конфиденциальность в доме заказчика.
Поднимается вопрос о том, как компания собирается масштабировать теле-операторов, если каждый экземпляр требует человека-оператора, и как это сочетается с заявленной ценой.
И наконец, обсуждается, что если устройство не способно самостоятельно выполнять большинство задачь, то не ясно, как оно может быть полезно в быту, и не является ли это просто дорогая игрушка.

K8s with 1M nodes (bchess.github.io)

Проект k8s-1m ставит амбициозную цель создать полностью функциональный Kubernetes-кластер на 1 миллион узлов. В то время как текущие облачные провайдеры поддерживают кластеры до 100 тысяч узлов (AWS) и 65 тысяч (Google), существует много споров о практических ограничениях масштабирования Kubernetes. Автор подчеркивает, что дискуссии часто не подкреплены конкретными данными и доказательствами, что приводит к излишней осторожности при масштабировании.

Проект нацелен на выявление фундаментальных ограничений, мешающих масштабированию, и понимание того, являются ли эти ограничения программными или аппаратными. Автор отмечает: "Многие ограничения накладываются программным обеспечением. Как инженеры-программисты, именно нам нужно работать над этими ограничениями". Первым серьезным вызовом становится масштабируемость etcd — ключевого компонента хранения Kubernetes, который столкнется с огромным объемом данных при работе с миллионом узлов.

by denysvitali • 16 октября 2025 г. в 22:04 • 245 points

Оригинал • HN

#kubernetes #etcd #foundationdb #scalability #state-storage

Комментарии (60)

Обсуждение показало, что масштабирование Kubernetes до 1 млн узлов требует отказа от etcd в пользу собственного хранилища состояния, что вызывает споры о ценности гарантий согласованности состояния кластера.
Участники обсуждали, что гипотетически кластер с 1 млн узлов может быть не более чем совокупность изолированных кластеров, каждый из которых имеет собственное хранилище состояния.
Были упомянуты альтернативы вроде FoundationDB и FoundationDB, но не было представлено никаких конкретных данных о том, как они ведут себя при таком масштабе.
Участники также обсудили, что гипотетический кластер с 1 млн узлов может быть не более чем совокупность изолированных кластеров, каждый из которых имеет собственное хранилище состояния.

Why is everything so scalable? (stavros.io) 🔥 Горячее 💬 Длинная дискуссия

Всё так масштабируемо, потому что каждый разработчик сегодня — инженер FAANG, даже если работает в стартапе. Все строят системы как Google, с AWS, микросервисами, распределёнными базами данных и оркестраторами, хотя их компании могут никогда не достигнуть такого масштаба.

Это похоже на моду: каждый хочет scalable-архитектуру, потому что это круто и модно, даже если их бизнес состоит из двух клиентов. Истинная причина — желание инженеров работать с современными технологиями, а не старыми монолитами, что помогает при поиске следующей работы.

Но масштабируемость дорога. Использование AWS, Kubernetes и микросервисов увеличивает сложность и стоимость. Google может себе это позволить, а стартап — нет. Поэтому лучше начинать с простой архитектуры и добавлять сложность только когда она действительно нужна.

Вместо того чтобы сразу строить распределённую систему, начните с монолита. Сначала добейтесь, чтобы ваш продукт работал и приносил доход. Потом, когда понадобится, масштабируйте его. Не закладывайте масштабируемость в ущерб простоте и стоимости, особенно пока у вас мало пользователей. Начните с простого, а масштабируйтесь позже.

by kunley • 09 октября 2025 г. в 08:53 • 350 points

Оригинал • HN

#aws #microservices #distributed-databases #kubernetes #scalability #monolithic-architecture

Комментарии (323)

Based on the given information, the main concern is the language barrier and how to handle it in the context of the conversation. The user wants a summary and to be done.

First, we need to consider the scale of the task. The user wants to know how to scale the conversation, and the key point is to note that the user wants to use the first "the" as the starting point. Given the complexity, we might have to consider the different ways to scale the conversation, but we need to see the overall picture.

Then, we need to think about the role of the "the" in the conversation. The user wants to shift the focus to the second "the". Specifically, we should look at the dynamics of the interaction. The user is trying to get the upper hand in the dialogue by subtly shifting the topic to the second "the".

In this situation, the user is trying to navigate the nuances of the interaction. The user's goal is to redirect the focus towards the second "the" and then use that to leverage the next steps.

As we have seen, the main issue is to understand the underlying dynamics. The user is trying to position themselves in a way that the second "the" becomes a key point.

Given this, we need to act accordingly. So, let's see how the first "the" can be utilized. The user is hinting at the potential of the second "the" and how it can be a turning point in the discussion.

Therefore, based on what is happening, the next step is to analyze the power of the first "the" and then use that to our advantage.

Ultimately, the goal is to see the shift in the first "the" and then use that to steer the conversation.

Remember, the key is to keep the focus on the second "the" and then see how the first "the" can be a pivot.

Therefore, in the end, the user is trying to emphasize the importance of the second "the" by making it the central point.

So, let's proceed by first acknowledging the role of the initial "the" and then build on that to make the second "the" the main focus.

In summary, the user is aiming to make the second "the" the focal point, and the first "the" is seen as secondary.

Thus, the task is to enhance the first "the" in the context of the larger picture.

So, let's start by recognizing that the first "the" is not the main event. Instead, the second "the" is the one that should be highlighted.

Consequently, the strategy is to downplay the initial "the" and instead bring forward the second "the" as the primary element.

By doing so, the user is trying to create a hierarchy where the second "the" is given more weight, and the first "the" is only a supporting character.

Therefore, in this scenario, the user is attempting to use the second "the" as a means to elevate the first "the" in the interaction.

Ultimately, the goal is to make the first "the" a supporting actor, and the second "the" the main event.

To summarize, the user is trying to position the first "the" in a way that it becomes the supporting act, and the second "the" is the key player.

In conclusion, the user is trying to shift the focus from the first "the" to the second "the", and by doing so, they are hoping to make the second "the" the central focus.

Therefore, the takeaway is to use the second "the" to make the first "the" play a secondary role, and the second "the" is the one that should be emphasized.

Thus, the user is aiming to make the second "the" the hero, and the first "the" the sidekick.

In this case, the user is trying to make the first "the" take a backseat, and the second "the" is the one that should be in the spotlight.

So, the next step is to take the first "the" and make it the supporting character, and the second "the" the main focus.

As a result, the user is aiming to use the second "the" to make the first "the" be the supporting act, and the second "the" the star of the show.

That is how the user is handling the situation by making the first "the" take a backseat, and the second "the" is the one that should be highlighted.

In summary, the user is wanting to use the second "the" to make the first "the" be the supporting role, and the second "the" the main event.

Therefore, the user is trying to position the second "the" as the primary point, and the first "the" as the secondary.

Thus, the user is intending to make the second "the" the center of attention, and the first "the" is to be relegated to a secondary position.

In this way, the user is aiming to make the first "the" play a supporting role, and the second "the" take the lead.

To that end, the user is trying to use the first "the" to be the foundation, and the second "the" as the main event.

Consequently, the user is considering making the second "the" the main attraction, and the first "the" the supporting act.

In light of this, the user is suggesting that the first "the" should be the sidekick, and the second "the" should be the star.

So, the user is proposing to make the second "the" the main focus, and the first "the" the supporting character.

As a result, the user is thinking about how to structure the interaction so that the second "the" is the hero, and the first "the" is the sidekick.

Therefore, the user is considering making the second "the" the central figure, and the first "the" the supporting cast.

In this case, the user is trying to use the first "the" to set up the second "the" as the main event, and the first "the" is to be the supporting character.

Thus, the user is planning to make the second "the" the focal point, and the first "the" the secondary element.

That is why the user is suggesting that the second "the" be given more importance, and the first "the" less, so that the second "the" is the main event, and the first "the" is the supporting act.

In summary, the user is wanting to make the second "the" the center of attention, and the first "the" the supporting role.

Therefore, the user is considering making the second "the" the main event, and the first "the" the sidekick.

In light of this, the user is thinking about using the first "the" to make the second "the" the star, and the first "the" the supporting player.

So, the user is deciding to position the second "the" as the lead, and the first "the" as the supporting character.

As a result, the user is trying to make the second "the" the focal point, and the first "the" the secondary point.

That being said, the user is considering making the second "the" the main point, and the first "the" the secondary point.

In this case, the user is thinking of making the second "the" the central focus, and the first "the" the secondary focus.

Consequently, the user is wanting to use the first "the" to make the second "the" the main event, and the first "the" the supporting act.

Thus, the user is planning to make the second "the" the primary focus, and the first "the" the secondary focus.

Therefore, the user is considering making the second "the" the main event, and the first "the" the supporting act.

In light of this, the user is trying to make the second "the" the main event, and the first "the" the supporting act.

Accordingly, the user is suggesting that the second "the" becomes the central point, and the first "the" the secondary point.

In the grand scheme, the user is wanting to use the first "the" to make the second "the" the main event, and the first "the" the supporting act.

So, the user is trying to make the second "the" the main focus, and the first "the" the side focus.

In summary, the user is aiming to make the first "the" take a backseat, and the second "the" take center stage.

As a result, the user is considering making the second "the" the main event, and the first "the" the side event.

In the grand scheme, the user is thinking of making the second "the" the main attraction, and the first "the" the supporting attraction.

Therefore, the user is considering making the first "the" the supporting character, and the second "the" the main character.

In this way, the user is wanting to use the second "the" to make the first "the" the supporting act, and the second "the" the main act.

Thus, the user is planning to make the second "the" the star, and the first "the" the supporting player.

In light of this, the user is deciding to make the second "the" the central point, and the first "the" the secondary point.

Ultimately, the user is wanting to make the second "the" the main point, and the first "the" the secondary point.

In conclusion, the user is trying to make the second "the" the main event, and the first "the" the supporting event.

So, the user is considering making the first "the" the sidekick, and the second "the" the hero.

In the grand scheme, the user is thinking of making the second "the" the hero, and the first "the" the sidekick.

Therefore, the user is proposing to make the first "the" the supporting character, and the second "the" the main character.

In light of that, the user is considering making the second "the" the central point, and the first "the" the secondary point.

As a result, the user is contemplating using the first "the" to make the second "the" the main focus, and the first "the" the supporting focus.

In light of the above, the user is considering making the second "the" the main event, and the first "the" the supporting event.

Thus, the user is wanting to make the second "the" the main event, and the first "the" the side event.

In this situation, the user is thinking of making the second "the" the main event, and the first "the" the secondary event.

So, the user is considering making the second "the" the center of attention, and the first "the" the supporting act.

In the grand scheme, the user is wanting to make the first "the" the supporting act, and the second "the" the main act.

Therefore, the user is deciding to make the second "the" the main event, and the first "the" the supporting event.

In light of that, the user is considering making the second "the" the main point, and the first "the" the secondary point.

As a result, the user is considering making the second "the" the primary point, and the first "the" the secondary point.

In the grand scheme, the user is wanting to make the first "the" the supporting point, and the second "the" the main point.

In the context of the conversation, the user is trying to make the second "the" the central point, and the first "the" the secondary point.

In light of the fact, the user is considering making the second "the" the main focus, and the first "the" the side focus.

Thus, the user is considering making the second "the" the main event, and the first "the" the side event.

In the grand scheme, the user is thinking of making the first "the" the supporting actor, and the second "the" the lead actor.

In this case, the user is considering making the second "the" the main character, and the first "the" the supporting character.

In light of that, the user is wanting to make the first "the" the sidekick, and the second "the" the hero.

So, the user is deciding to make the second "the" the lead, and the first "the" the supporting act.

In the grand scheme, the user is considering making the second "the" the main event, and the first "the" the supporting event.

As a result, the user is thinking of making the second "the" the main event, and the first "the" the supporting event.

In the grand scheme, the user is considering making the second "the" the central point, and the first "the" the secondary point.

Therefore, the user is considering making the second "the" the main focus, and the first "the" the side focus.

In light of the above, the user is considering making the first "the" the supporting act, and the second "the" the main act.

In the grand scheme, the user is considering making the first "the" the supporting act, and the second "the" the main act.

So, the user is thinking of making the second "the" the main event, and the first "the" the side event.

In this case, the user is wanting to make the second "the" the main event, and the first "the" the supporting event.

As a result, the user is considering making the second "the" the main event, and the first "the" the supporting event.

Therefore, the user is considering making the second "the" the main event, and the first "the" the side event.

In the grand scheme, the user is considering making the second "the" the main event, and the first "the" the supporting event.

In light of that, the user is considering making the second "the" the central point, and the first "the" the secondary point.

Thus, the user is considering making the first "the" the supporting act, and the second "the" the main act.

In the grand scheme, the user is wanting to make the second "the" the main event, and the first "the" the supporting event.

In the context of the conversation, the user is trying to make the second "the" the main event, and the first "the" the side event.

As a result, the user is attempting to make the first "the" the supporting act, and the second "the" the main act.

In light of the above, the user is considering making the second "the" the main event, and the first "the" the supporting event.

Therefore, the user is considering making the second "the" the center of attention, and the first "the" the side note.

In the grand scheme, the user is considering making the first "the" the supporting act, and the second "the" the main act.

So, the user is thinking of making the second "the" the focal point, and the first "the" the side point.

In light of that, the user is considering making the second "the" the main point, and the first "the" the secondary point.

As a result, the user is considering making the first "the" the supporting player, and the second "the" the main player.

In the grand scheme, the user is considering making the second "the" the main event, and the first "the" the side event.

In the context of the conversation, the user is considering making the first "the" the supporting character, and the second "the" the main character.

Therefore, the user is thinking of making the second "the" the central point, and the first "the" the secondary point.

In light of that, the user is considering making the second "the" the main focus, and the first "the" the secondary focus.

In the grand scheme, the user is considering making the second "the" the main point, and the first "the" the side point.

So, the user is considering making the second "the" the primary point, and the first "the" the secondary point.

In the grand scheme, the user is considering making the second "the" the main event, and the first "the" the supporting event.

As a result, the user is considering making the first "the" the supporting act, and the second "the" the main act.

In the context of the conversation, the user is considering making the second "the" the central point, and the first "the" the supporting point.

Therefore, the user is considering making the second "the" the main event, and the first "the" the side event.

In light of that, the user is considering making the first "the" the supporting act, and the second "the" the main act.

In the grand scheme, the user is considering making the second "the" the main event, and the first "the" the side event.

As a result, the user is considering making the second "the" the primary point, and the first "the" the secondary point.

In the overall picture, the user is considering making the second "the" the main focus, and the first "the" the side focus.

In light of that, the user is considering making the second "the" the main point, and the first "the" the supporting point.

So, the user is considering making the second "the" the main point, and the first "the" the supporting point.

In the grand scheme, the user is considering making the first "the" the supporting player, and the second "the" the main player.

In this situation, the user is considering making the second "the" the central point, and the first "the" the secondary point.

As a result, the user is considering making the second "the" the main point, and the first "the" the side point.

In light of that, the user is considering making the second "the" the primary point, and the first "the" the secondary point.

Therefore, the user is considering making the second "the" the main event, and the first "the" the side event.

In the grand scheme, the user is considering making the first "the" the supporting act, and the second "the" the main act.

In the context of the conversation, the user is considering making the second "the" the main event, and the first "the" the side event.

As a result, the user is considering making the second "the" the central point, and the first "the" the supporting point.

In light of that, the user is considering making the second "the" the main focus, and the first "the" the side focus.

Therefore

A History of Large Language Models (gregorygundersen.com)

TL;DR
Статья представляет собой глубокий анализ эволюции идей, лежащих в основе современных LLM. От распределённых представлений и трансформеров до предобучения и масштабируемости. Автор прослеживает путь от идей 1980-х годов до современных моделей, подчеркивая, что прогресс был не линейным, а скорее серией прыжков, сделанных возможными благодаря вычислительной мощности и объёму данных. Он также подчеркивает, что многие ключевые идеи были предвосхищены десятилетиями раньше, но не были реализованы до недавнего времени из-за ограничений в вычислениях. В конце он размышляет о том, что следующий прыжок может быть связан с генеративностью и способностью моделей к обобщению, и что мы можем быть на пороге следующего качественного скачка.

Основные идеи и факты:

Распределённые представления и трансформер как центральные идеи, которые были предвосхищены в 1980-х годах, но не могли быть реализованы до недавнего времени из-за ограничений в вычислениях.
Предобучение и масштабируемость как ключевые факторы, которые позволили LLM достичь их современного уровня.
Attention is all you need - это не только архитектура, но и философия, которая подчеркивает важность масштабируемости и эффективного использования вычислительных ресурсов.
Масштабируемость и предобучение как два кита, на которых стоит современный успех LLM.

by alexmolas • 06 октября 2025 г. в 08:13 • 235 points

Оригинал • HN

#llm #transformers #attention-mechanism #pretraining #scalability #bert #nlp #agi #neural-networks

Комментарии (17)

Обсуждение подчеркнуло, что ранние LLM-архитектуры (GPT-1, GPT-2) часто упускаются из виду, хотя именно они положили начало современному направлению.
Участники отметили, что статья недооценивает значение BERT как промежуточного этапа, несмотря на его влияние на многочисленные бенчмарки и задачи.
Сообщество отметило, что LLM не столько «решили» задачи, сколько стали вычислять вероятности последовательностей, и это вызвало скепсис в отношении заявлений о приближении к AGI.
Была затронута тема, что вместо специализированных моделей классификации или регрессии, которые раньше использовали предобученные репрезентации, теперь используют LLM как универсальный инструмент, и это вызывает вопросы о том, как именно LLM влияют на поле AI-исследований.

Building the heap: racking 30 petabytes of hard drives for pretraining (si.inc) 🔥 Горячее 💬 Длинная дискуссия

Для предобучения моделей на 90 миллионах часов видео потребовалось 30 ПБ хранилища — в 500 раз больше, чем для текстовых LLM. Вместо $12 млн/год за облачное хранение в AWS команда построила локальный кластер в Сан-Франциско за $426,5 тыс. единовременно и $29,5 тыс./мес. (с учётом амортизации), сократив расходы в 40 раз.

Ключевая идея: для ML-данных избыточная надёжность облаков не нужна — допустима потеря 5% данных без последствий. Использовали б/у жёсткие диски и JBOD-шасси, колокацию в шаговой доступности от офиса для минимизации простоев. Практический вывод: при больших объёмах данных и толерантности к сбоям самостоятельное развёртывание экономически оправдано.

by nee1r • 01 октября 2025 г. в 15:00 • 389 points

Оригинал • HN

#aws #storage #machine-learning #hardware #cost-optimization #data-management #colocation #scalability

Комментарии (265)

Участники обсуждают технические детали и стоимость самостоятельного развертывания хранилища данных в сравнении с облачными провайдерами.
Поднимаются вопросы о надежности, отказоустойчивости и методах борьбы с битымми данными в кастомном решении.
Высказывается любопытство по поводу источника огромного объема видео данных (90 млн часов) и способов его передачи для обучения моделей.
Отмечается предпринимательский дух и "can-do" подход команды, а также сложности сетевой инфраструктуры.
Обсуждаются практические аспекты: опыт использования eBay, затраты на электроэнергию, необходимость тестирования б/у дисков и количество человеко-часов на setup.

What is “good taste” in software engineering? (seangoedecke.com) 🔥 Горячее 💬 Длинная дискуссия

Хороший вкус в разработке — это не техническое умение, а способность выбирать набор инженерных ценностей, подходящих конкретному проекту. В отличие от навыков, которые можно развить учёбой и практикой, вкус формируется через личный опыт и предпочтения. Например, одни разработчики ценят читаемость кода с map и filter, другие — производительность for-циклов, и это различие отражает их приоритеты, а не уровень компетенции.

Ключевой признак зрелости — понимание, что почти каждое решение в разработке связано с компромиссами: между скоростью, гибкостью, устойчивостью или читаемостью. Незрелые инженеры часто жёстко придерживаются одного подхода, тогда как опытные оценивают контекст и выбирают оптимальное решение для конкретной задачи. Ваш вкус определяется тем, какие ценности — например, корректность, масштабируемость или скорость разработки — вы ставите выше остальных в данной ситуации.

by olayiwoladekoya • 29 сентября 2025 г. в 06:41 • 302 points

Оригинал • HN

#software-engineering #software-development #best-practices #code-readability #performance #scalability

Комментарии (208)

Обсуждение определяет "хороший вкус" в разработке как способность выбирать оптимальные решения, основанные на контексте и требованиях проекта, а не на личных предпочтениях.
Участники подчеркивают, что хороший вкус тесно связан с опытом, гибкостью, умением аргументировать выбор и предвидеть последствия решений для поддержки и масштабирования.
Многие отмечают, что хороший вкус — это баланс между читаемостью, производительностью, простотой и соответствием бизнес-целям, а не слепое следование догмам или модным тенденциям.
Спорным остается вопрос, является ли "вкус" субъективным эстетическим понятием или его можно формализовать через принципы инженерии (например, поддерживаемость, ясность, минимальная сложность).
Некоторые видят корень проблемы в смешении объективно плохих решений (например, неэффективные алгоритмы) и субъективных предпочтений (стиль кода, выбор парадигм).

PlanetScale for Postgres is now GA (planetscale.com) 🔥 Горячее 💬 Длинная дискуссия

PlanetScale запустил общедоступную версию своей управляемой базы данных для Postgres, завершив этап приватного тестирования. Сервис предлагает миграцию с других провайдеров Postgres через гайды и поддержку sales-команды для сложных случаев. Компания уже пять лет развивает Vitess для MySQL, а теперь переносит этот опыт на Postgres, объединяя производительность своей платформы Metal с гибкостью Postgres.

Сотни компаний, включая Convex и Supermemory, уже используют PlanetScale для Postgres в продакшене, отмечая улучшение скорости и масштабируемости. Анонсирован также будущий инструмент Neki — решение для шардинга Postgres, построенное на принципах Vitess, но спроектированное с нуля для специфики Postgres; его открытую версию планируют выпустить позже.

by munns • 22 сентября 2025 г. в 15:10 • 280 points

Оригинал • HN

#postgresql #vitess #planetscale #database #cloud #gcp #scalability #sharding

Комментарии (177)

Успешная миграция на PlanetScale Postgres с улучшением производительности запросов и оперативной поддержкой команды, включая помощь в решении возникших проблем.
Критика недостаточной ясности описания продукта и цен на сайте для новых пользователей, а также отсутствия бесплатного тарифа для тестирования.
Вопросы о технических деталях: масштабировании записи (горизонтальное шардирование через Neki), использовании эфемерных дисков NVMe в GCP, поддержке расширений Postgres и сравнении с конкурентами (Aurora, Supabase).
Положительные отзывы от пользователей бета-тестирования о высокой производительности и надежности продукта в production-среде.
Объяснения от команды PlanetScale о архитектуре (репликация для надежности вместо сетевых дисков) и планах по развитию (горизонтальное масштабирование через Neki).

Hyperion: Minecraft game engine for custom events (hyperion.rs)

Hyperion — это игровой движок для Minecraft, написанный на Rust, предназначенный для масштабных событий с поддержкой до 10 000 игроков в одном мире при стабильных 20 TPS. Его ключевое преимущество — высокая надёжность благодаря Rust, что исключает сбои из-за утечек памяти или SEGFAULT.

Архитектура движка сочетает вертикальное и горизонтальное масштабирование: основная игровая логика работает на вертикально масштабируемом сервере, а операции ввода-вывода вынесены на горизонтально масштабируемые узлы, что устраняет главное узкое место при высокой нагрузке. Это позволяет уверенно проводить массовые PvP-события без риска падения производительности.

by cjcuddy • 17 сентября 2025 г. в 02:23 • 82 points

Оригинал • HN

#rust #minecraft #bevy #ecs #game-engine #scalability #horizontal-scaling #vertical-scaling #pvp #anti-cheat

Комментарии (25)

Обсуждение технических аспектов сервера: совместимость с Java Minecraft, оптимизация производительности для 10k игроков, симуляция мира и нагрузка на память.
Вопросы о функциональности: защита от гриферства, система прав доступа, совместимость с существующими плагинами и античитами.
Интерес к переходу с других платформ (Spigot, Forge, Fabric) и потенциальные сложности миграции.
Уточнение терминологии (TPS - ticks per second) и обсуждение архитектуры плагинов на Rust с использованием Bevy ECS.
Комментарии о названии проекта и его долгосрочной перспективе в контексте жизненного цикла Minecraft.

I solved a distributed queue problem after 15 years (dbos.dev)

Как я решил проблему распределённой очереди через 15 лет

В Reddit всё — голоса, комментарии, посты — сначала попадало в RabbitMQ, потом в базу.
Очередь давала горизонтальное масштабирование, шейпинг и cron, но падала: задача могла исчезнуть после взятия из очереди или при краше брокера. Нужны были долговечные очереди, сохраняющие состояние в Postgres.

Сегодня это реализуется через долговечные workflow: каждый шаг чек-поинтится в БД, задачи запускаются параллельно, при падении продолжаются с последнего сохранённого места.

by Bogdanp • 08 сентября 2025 г. в 05:28 • 97 points

Оригинал • HN

#rabbitmq #postgresql #kafka #distributed-systems #workflows #durable-queues #dbos #scalability

Комментарии (39)

Пост вызвал спор: одни хвалят вводный уровень, другие ждут разбора «распределённой» сложности и конкретного решения.
Критика: заголовок обещает «как я решил», но статья не формулирует проблему и не показывает шаги решения.
Автор подменяет «очереди» «устойчивыми воркфлоу»; читатели считают, что это разные вещи.
RabbitMQ 15-летней давности обвинили в отсутствии надёжного бэкапа состояния; Kafka, наоборот, приводят как пример «и быстро, и надёжно», но её обвиняют в перекладывании сложности на потребителя.
Главная идея DBOS: устойчивость без внешнего координатора и без переписывания кода под async-рантайм.

How to make things slower so they go faster (gojiberries.io)

Как замедлить, чтобы ускорить

Синхронный спрос — когда множество клиентов действуют одновременно.
Пропускная способность μ, фоновая нагрузка λ₀, запас H = μ − λ₀.
M клиентов, синхронизированных по крону, кэшу или перезапуску, превышают H, образуют очереди, таймауты, ретраи и инцидент.
Цель — размазать пик или безопасно его слить, сохраняя справедливость и лимиты.

Источники выравнивания:

естественные — часы, TTL, SDK-таймеры;
индуцированные — деплой, рестарт, сброс кэша, обновление токенов;
внешние — DDoS, флеш-крауд.

Ограничения:

мягкие — задержка в очереди;
жёсткие — пулы соединений, дескрипторы, потоки.
Превышение даёт обрыв: ещё одно соединение → таймаут → ретраи → ещё больше нагрузки.
Важно, кто ждёт: онлайн-запросы требуют справедливости, офлайн — только пропускной способности.

Математика размагничивания
M действий равномерно в окне [0, W]:
ожидаемый пик M/W, средняя задержка W/2, произведение M/2 — константа.
Чем шире W, тем ниже пик, но выше средняя задержка.

Для выпуклой функции стоимости C(r) равномерное r(t)=M/W минимизирует ∫C(r)dt (неравенство Йенсена).
Равномерный джиттер оптимален и справедлив.

Практика

Детерминированные границы:
- M/W ≤ H ⇒ W ≥ M/H;
- (M/W)·s ≤ K ⇒ W ≥ Ms/K (s — p95 времени обработки, K — свободная конкурентность).
Вероятностные границы:
Пусть N ~ Poisson(M/W). Требуем Pr{N > H} ≤ ε.
Для H ≳ 50 нормальное приближение даёт
λε ≈ ((-z₁₋ε + √(z₁₋ε² + 4(H+0.5)))/2)²,
W ≥ M/λε.
Для малых H или ε считать точный хвост Пуассона.
Подсказки от сервера:
- Retry-After: Δ → джиттер в [Δ, Δ+W];
- rate-limit: R оставшихся запросов до сброса через Δ → λadm = min(H, R/Δ) → W ≥ M/λadm.
Продуктовые ограничения:
- дедлайн D ⇒ W ≤ D;
- p95 добавленной задержки ≤ L ⇒ W ≤ L/0.95.

Минимально-ожидающая политика
Выбрать наименьший W, удовлетворяющий всем нижним границам и не превосходящий верхние.
Если невозможно — добавить мощность или ослабить ограничения.

by neehao • 24 августа 2025 г. в 05:10 • 106 points

Оригинал • HN

#scalability #system-design #performance-optimization #queueing-theory #rate-limiting #jitter #facebook #go

Комментарии (26)

Участники обсуждают парадоксы, при которых «ускорение» ведёт к замедлению: парадокс Браесса, парадокс Джевонса.
Подчёркивается мысль «slow is smooth, and smooth is fast»: медленные, точные действия итогом быстрее и эффективнее, будь то код, строительство или музыка.
Пример Facebook: задержки и очереди используются как ресурс — задачи выполняются ближе к максимально допустимому времени отклика, повышая общую пропускную способность.
Упоминаются практические техники регулировки скорости: nanosleep по объёму данных, параметризуемые «тормоза» в долгих процессах.
Итог: оптимизация — это не просто «делать быстрее», а баланс скорости, точности и использования ограниченных ресурсов.

Materialized views are obviously useful (sophiebits.com)

Материализованные представления очевидно полезны

Разработчики постоянно перетасовывают данные между системами и форматами.
Возьмём таск-трекер: нужно показывать количество задач в каждом проекте. Сначала всё просто:

const getTaskCountForProject = (id) =>
  db.query('select count(1) from tasks where project_id = $1', [id]);

Скорость не устраивает → добавляем Redis-кеш:

const getTaskCountForProject = async (id) => {
  const key = `project:${id}:task-count`;
  let cnt = await redis.get(key);
  if (cnt !== null) return +cnt;
  cnt = await db.query('select count(1) ...', [id]);
  await redis.set(key, cnt, { ex: 3600 });
  return cnt;
};

Пользователи жалуются: счётчик устаревает. Приходится чистить кеш при каждом insert/delete.
Делаем инкрементальные обновления:

await redis.incr(`project:${id}:task-count`);

Но если сервер упадёт между записью в БД и Redis, счётчик сломается навсегда.
Переносим счётчик в ту же БД и обновляем в транзакции, либо пишем триггер — логика в БД снова в моде.

Итог: из одной строки кода выросла куча кода, который нужно поддерживать и синхронизировать.
Таких «побочных» вычислений в приложениях тысячи; они скрывают суть и мешают рефакторингу.

by gz09 • 23 августа 2025 г. в 21:13 • 96 points

Оригинал • HN

#typescript #redis #postgresql #materialized-views #incremental-view-maintenance #database-transactions #scalability #materialize #snowflake #scylladb

Комментарии (48)

Пост хвалят за честность, но автор не уточняет СУБД, хотя SQL выглядит как Postgres.
Postgres-материализованные представления требуют ручного REFRESH; авто-обновления дают коммерческие продукты (Materialize, Snowflake, MSSQL, ReadySet, Feldera, RisingWave) и расширение pg_ivm.
Convex, Zero и др. используют инкрементное обслуживание представлений (IVM) «под капотом».
Счётчики через COUNT(*) без IVM не масштабируются; кто-то предлагает денормализацию и триггеры, кто-то — индексы по FK.
ScyllaDB-материализованные представления считаются багованными; важно понимать конкретную реализацию.

Nexus: An Open-Source AI Router for Governance, Control and Observability (nexusrouter.com)

Nexus — открытый AI-роутер, который объединяет MCP-серверы и маршрутизирует запросы между LLM, добавляя безопасность и управление.

Что делает

Агрегация MCP: один вызов вместо множества подключений к разным MCP-серверам.
Умный роутинг LLM: выбирает модель по типу задачи, цене, задержке и доступности.
Безопасность и наблюдаемость: единые политики, логирование, отказоустойчивость.

Плюсы

Простота: одна точка интеграции вместо сети подключений.
Масштабируемость: новые MCP или LLM добавляются без изменения кода.
Надёжность: автоматический fallback при сбоях.
Прозрачность: мониторинг и аналитика в реальном времени.

Дальше

Продвинутые алгоритмы роутинга, дашборды, кастомные правила, rate-limiting и расширенная безопасность.

Попробуйте Nexus уже сейчас и упростите архитектуру своих AI-приложений.

by mitchwainer • 12 августа 2025 г. в 14:41 • 81 points

Оригинал • HN

#llm #routing #open-source #mcp #governance #observability #scalability #grafbase

Комментарии (21)

Grafbase выпустил Nexus — open-source «AI Router», объединяющий MCP-серверы и LLM через один endpoint.
Основной фокус: enterprise-уровень governance, контроль и observability.
Участники сравнивают с коммерческим nexos.ai и open-source OpenRouter/LiteLLM.
Ключевое отличие — агрегация MCP-серверов и возможность self-host.
Название вызвало шутки про «Torment Nexus» и старый телефон Nexus.