Hacker News Digest

Тег: #data-mining

Постов: 2

How to become a pure mathematician or statistician (2008) (hbpms.blogspot.com)

План самообразования математика-чистяка (или статистика)

Этап 1

  • школьная база
  • дискретка, алгебра, анализ начального уровня

Этап 2

  • линейная алгебра
  • высшая алгебра
  • вещественный и комплексный анализ
  • диффуры, вероятность и статистика

Этап 3

  • анализ, абстрактная алгебра, теория чисел
  • топология, диффгеометрия
  • по желанию: моделирование, статвывод, стохастика, вычислительная статистика

Этап 4

  • фундамент: логика, множества, комбинаторика, криптография
  • анализ: функциональный, мера, гармонический
  • алгебра: группы, кольца, поля, гомологии
  • числа: алгебраическая и аналитическая теория, эллиптические кривые
  • геометрия и топология: алгебраическая, риманова, K-теория
  • опционально: диффуры в частных, матфизика, вероятность на мере, многомерная статистика, байес, выживание, data mining

Этап 5

  • читаем монографии и статьи, выбираем специализацию, делаем исследования

«Как пианист: сначала скучные этюды, потом — музыка» (Терри Тао).

by ipnon • 09 сентября 2025 г. в 07:10 • 77 points

ОригиналHN

#mathematics#statistics#linear-algebra#abstract-algebra#calculus#probability#topology#number-theory#data-mining

Комментарии (74)

  • Классические «дорожные карты» по чистой математике часто выглядят как бесполезные списки книг без объяснения, зачем и в каком порядке их читать.
  • Настоящий путь проще: крепкая линейная алгебра и анализ (Шилов, Рудин), дальше — основные учебники по геометрии, алгебре и анализу с доказательствами и наставником.
  • Единственный способ стать математиком — публиковать исследования; маршрут любой, лишь бы вам было интересно и вы могли его пройти.
  • Споры о «требуемом IQ 145» вызывают бурю критики: IQ не определяет креативность и усердие, а SAT/ACT лишь коррелируют с успехом, но не гарантируют его.
  • Проверять стоит не коэффициент интеллекта, а свои реальные успехи в математике: умеете ли вы читать и писать доказательства, получаете ли удовольствие от процесса.

Collecting All Causal Knowledge (causenet.org)

CauseNet — проект по сбору всей человеческой причинной информации из веба и отделению знаний от убеждений.

Получено 11,6 млн причинных связей (точность ≈ 83 %) из полуструктурированных и неструктурированных источников. Построен первый крупный граф причинности открытого домена.

Данные

  • CauseNet-Full — полный набор (11,6 млн связей, 12,2 млн понятий, 1,8 ГБ).
  • CauseNet-Precision — высокоточная выборка (200 тыс. связей, 80 тыс. понятий, 135 МБ).
  • CauseNet-Sample — мини-пример (264 связи, 524 понятия, 54 КБ).

Модель

Концепты соединяются отношениями «причина → следствие».
Каждая связь снабжена метаданными: источник, предложение, шаблон, временная метка и т.д.

Примеры

{
  "causal_relation": {
    "cause": {"concept": "smoking"},
    "effect": {"concept": "disability"}
  },
  "sources": [{
    "type": "clueweb12_sentence",
    "payload": {
      "sentence": "In Canada, smoking is the most important cause of preventable illness...",
      "path_pattern": "[[cause]]/N\t-nsubj\tcause/NN\t+nmod:of\t[[effect]]/N"
    }
  }]
}

Применение: ответы на причинные вопросы, аргументация, многошаговые выводы.

by geetee • 02 сентября 2025 г. в 05:26 • 209 points

ОригиналHN

#causal-reasoning#knowledge-graph#natural-language-processing#data-mining#big-data#machine-learning#artificial-intelligence#data-analysis

Комментарии (101)

  • Критики считают идею «базы всех причин» хрупкой и излишне упрощённой: примеры вроде «человеческая деятельность → изменение климата» слишком обобщены и бесполезны.
  • Многие проводят параллель с провалом проекта Cyc и предупреждают о повторении тех же ошибок.
  • Упрекают отсутствие неопределённости, контекста и механизмов: «болезнь → смерть» игнорирует вероятности, временные рамки и индивидуальные условия.
  • Источник — Википедия — вызывает скепсис; в базе даже встречаются ложные связи («вакцины → аутизм»), что подрывает доверие.
  • Пока не ясно, для чего это нужно: прогнозы, дообучение ИИ или просто каталог «что кто-то когда-то утверждал».