NYC Telecom Raid: What's Up with Those Weird SIM Banks?
В Нью-Йорке Секретная служба провела рейд против крупной сети SIM-ферм, используемых для массовой рассылки спама и мошеннических звонков. Обнаружено необычное оборудование — так называемые SIM-банки, устройства, вмещающие сотни SIM-карт, организованные в симметричные стойки с антеннами. Это позволяло операторам управлять тысячами номеров одновременно, обходя ограничения мобильных операторов.
Подобные системы напоминают технические решения вроде сервиса Aereo, который использовал массивы антенн для ретрансляции ТВ-сигналов. Практический вывод: уязвимость телеком-инфраструктуры к масштабным злоупотреблениям остаётся высокой, а аппаратные средства для этого становятся всё изощрённее.
Комментарии (120)
- Обсуждение касается обнаруженных в Нью-Йорке устройств для массовой рассылки спама (SIM-банков или "модемных пулов"), которые используют сотни SIM-карт для обхода защиты.
- Участники предполагают, что основное применение таких устройств — мошенничество и спам, а не государственный шпионаж, как первоначально могло показаться.
- Поднимаются вопросы о том, почему операторы связи не могут обнаружить такую активность, и высказываются предположения, что MVNO (виртуальные операторы) могут не иметь стимулов или инструментов для этого.
- Отмечается, что подобное оборудование легко доступно на площадках вроде Alibaba и изначально использовалось для серых схем VoIP-звонков и спама в SMS.
- Обсуждаются технические аспекты, такие как возможность работы множества радиомодулей без помех и использование eSIM для снижения трудозатрат на управление SIM-картами.
Tau² benchmark: How a prompt rewrite boosted GPT-5-mini by 22%
Как переписывание промта повысило эффективность GPT-5-mini на 22%
Мы представляем результаты тестирования модели GPT-5-mini в рамках бенчмарка Tau², предназначенного для оценки языковых моделей. Оказалось, что простое переписывание промта повысило успешность небольшой модели более чем на 20%.
Тестирование LLM с Tau²
На летнем обновлении OpenAI заявили, что GPT-5 значительно улучшила агентские задачи. Для проверки использовали бенчмарк Tau², симулирующий реальные взаимодействия в телекоме, ритейле и авиалиниях. Однако улучшения GPT-5 были заметны только в телекоме, поэтому мы сосредоточились на этой области.
GPT-5-mini предлагает преимущества: вдвое меньше задержка, выше пропускная способность и в пять раз дешевле при 85–95% производительности полной GPT-5. Мы провели эксперимент, чтобы оценить, насколько хорошо GPT-5-mini справляется с бенчмарком и можно ли улучшить её результаты, изменяя политики агентов или описания задач.
Базовые результаты: 45% провалов
Мы запустили подмножество из 20 тестовых сценариев телекома. Результаты показали успешность всего 55%. GPT-5-mini с её ограниченными возможностями reasoning не приблизилась к флагманской GPT-5.
Бенчмарк также ввёл метрику pass^k, измеряющую надёжность агента при k попытках выполнения задачи, и выделил задачи, с которыми агент не справляется совсем.
Решение: переписывание промтов с помощью Claude
Мы поставили три цели: повысить общую успешность, "разблокировать" больше задач и улучшить надёжность агента. Используя генеративный ИИ, мы поручили Claude проанализировать политики агентов в телекоме и переписать их для упрощения понимания моделью GPT-5-mini.
Ключевые улучшения включали:
- Чёткие деревья решений и последовательные шаги
- Ясные условия и обработку ошибок
- Снижение когнитивной нагрузки через таблицы и шаблоны
- Действенные команды вместо описаний
После переписывания промтов успешность GPT-5-mini выросла до 77%, что на 22% выше исходного показателя. Это демонстрирует, что тонкая настройка промтов может значительно повысить эффективность небольших моделей без изменения их архитектуры.
Комментарии (57)
- Оптимизация структуры промптов (деревья решений, нумерованные шаги, проверки зависимостей) значительно улучшает работу ИИ-агентов.
- Использование Claude для перезаписи промпта повысило эффективность GPT-5-mini в телеком-бенчмарке, но методология вызывает вопросы о возможной утечке данных.
- Подход перезаписи промптов затратен по времени и ресурсам, не универсален для разных доменов и может нивелировать преимущества небольших моделей.
- Сообщество выражает скептицизм относительно долгосрочной стабильности и воспроизводимости результатов, полученных с помощью подобных техник.
- Многие отмечают, что описанные практики уже представлены в более продвинутых фреймворках, таких как DSPy.
- Обсуждается этический аспект: оптимизация промпта под конкретный бенчмарк может искажать оценку истинных агентских способностей модели.
- Отсутствие исходных промптов и деталей перезаписи затрудняет независимую верификацию и воспроизведение результатов.
Court rejects Verizon claim that selling location data without consent is legal 🔥 Горячее
- Апелляционный суд 2-го округа оставил в силе штраф FCC в $46,9 млн против Verizon за продажу геоданных без согласия абонентов.
- Verizon, T-Mobile и AT&T оспаривали санкции в разных срубах: Verizon и T-Mobile проиграли, AT&T выиграл в 5-м округе; появился судебный раскол, дело может уйти в Верховный суд.
- Суд отверг доводы Verizon, что данные о местоположении не подпадают под закон о конфиденциальной информации клиента (CPNI) и что штраф нарушает право на суд присяжных.
Комментарии (69)
- Verizon оспаривал штраф не из-за денег (40 млн — копейки против 9 млрд дохода за квартал), а чтобы протестировать, можно ли нарушать закон без последствий.
- Суд признал продажу геоданных без согласия незаконной, но штраф всё равно воспринимается как «цена вопроса»: компании уже заработали на сделке больше.
- Участники сходятся: пока сумма штрафа ≤ прибыли и никто не сядет, нарушения будут повторяться; требуют процент от выручки и уголовную ответственность.
- Опасения, что операторы просто спрячут согласие в 50-страничный договор или превратят отказ в дорогой тариф.
- Решение касается только голосовой «телеком-услуги», не распространяется на мобильные приложения, ОС и банки-продавцы транзакций.