Analyzing the memory ordering models of the Apple M1
- Цель: сравнить на M1 две модели упорядочения памяти: «слабый» ARM и x86-совместимый TSO, используемый эмулятором Rosetta 2.
- Метод: прогон SPEC2017 CPU FP и синтетические тесты.
- Результат: TSO медленнее ARM на 8,9 % в среднем; пиковые потери до 30 % на синтетике.
- Причина: чаще срабатывают барьеры памяти и дорогие атомарные инструкции ARMv8.3.