Введение
В этом руководстве рассматривается практический пример использования средств измерения производительности, объясняется, как собирать необходимую информацию и как использовать соответствующие функции визуализации. В этом руководстве вы проанализируете тестовое приложение FFT16M.
Тестовым приложением для анализа является программа FFT16M, которая входит в демонстрационный комплект Cell/B.E. SDK 3.0 и расположена в /opt/cell/sdk/src/demos/FFT16M. Это настраиваемое вручную приложение выполняет комплексное быстрое преобразование Фурье (FFT) над массивом, состоящим из 16777216 элементов, используя SIMD-команды в четыре потока. Приложение имеет два параметра командной строки:
Старый формат:
fft <ncycles> <printflag>
Новый формат:
fft <ncycles> <printflag> [<log2_spus> <numa_flag> <largepage_flag>]
Старый формат подразумевает, что log2_spus равен 3,
numa_flag равен 0, а
largepage_flag равен 1. Также:
- Если
numa_flag равно 1, то используется numa.
- Если
largepage_flag равно 1, то используются большие страницы.
Когда вы доберетесь до раздела «Сбор и обработка данных трассировки», вы увидите, что для сбора некоторых данных трассировки в этом разделе использовался новый формат.
|