Тег: #bard — Hacker News Digest

IQ Tests Results for AI (trackingai.org) 💬 Длинная дискуссия

TrackingAI — сайт-трекер политических и когнитивных смещений ИИ.
Добавлен Claude 3.5 Sonnet.

Вдохновлено работой Дэвида Розадо, но в отличие от статических снимков — live-трекинг.

Почему ИИ левые?
Данные (Википедия) и обратная связь левых рейтеров.
Можно ли сделать ИИ центристом?
Да, но нужно менять данные или состав рейтеров.
Отказ от ответа?
Повторяем 10 раз; если отказ — фиксируем.
Контакт: maxim.lott@gmail.com

Максим Лотт, продюсер Stossel TV, создатель ElectionBettingOdds.com и TaxPlanCalculator.com.

by stared • 17 августа 2025 г. в 09:36 • 178 points

IQ-тесты для людей измеряют «g-фактор» при строгих ограничениях по времени; LLM не работают в этих условиях.
Модели часто «зубрят» ответы из обучающих данных, поэтому высокий балл ≠ человеческий интеллект.
Визуальные модели показывают худшие результаты, чем текстовые, из-за различий в формате заданий.
Нормированные IQ-оценки для машин — категориальная ошибка: тесты не учитывают их архитектуру и возможности.
Бенчмарк быстро теряет ценность из-за переобучения и отсутствия контроля за «подглядыванием» в данных.