英特爾? Parallel Amplifier 入門
英特爾? Parallel Amplifier 可分析并提供關(guān)于代碼性能的信息。英特爾? Parallel Amplifier 能夠顯示性能問題,使您能針對這些性能問題集中注意力進(jìn)行性能調(diào)優(yōu),并在最短時間內(nèi)獲得最大的性能提升。
本入門指南旨在介紹 Amplifier 的基本特性。
學(xué)完本指南后,您將能夠使用 Amplifier 分析代碼,從而找出可獲得最大性能提升的性能熱點。
本文將逐步為您介紹調(diào)優(yōu)示例應(yīng)用程序的全過程,并介紹其中的各個階段:
定位性能問題
修改代碼以消除問題
檢測新代碼的性能變化
如需直觀感受入門體驗,請觀看Show Me 視頻演示
本文分成以下幾個部分:
生成應(yīng)用程序
首先,您需要在 Microsoft* Visual Studio* 環(huán)境中建立示例應(yīng)用程序。本指南中的矩陣示例應(yīng)用程序用于計算矩陣變換。為便于分析并快速評估優(yōu)化效果,應(yīng)用程序中包含一個計時器,可顯示計算矩陣變換所用的時間。
建立應(yīng)用程序:
在 Visual Studio* 中,選擇 File > Open > Project/Solution,導(dǎo)航至
項目將被添加到 Visual Studio*,顯示在 Solution Explorer 中。選擇 Build > Build Solution。
即生成 matrix.exe 應(yīng)用程序。
程序在哪里浪費了時間?
生成應(yīng)用程序后,即可對
并發(fā)性在哪里存在不足?
此步驟中,您將運行并發(fā)性分析,了解應(yīng)用程序是否有效利用了所有處理器內(nèi)核,并識別哪些串行化程度較高的代碼需要并行化。查看詳情
程序在哪里等待?
此步驟中,您將運行鎖定和等待分析,了解 algorithm_3 中出現(xiàn)標(biāo)記為 OK 的串行 CPU 時間的原因。請點擊這里查看詳情。
實現(xiàn)了哪些優(yōu)化?
此步驟中,您將比較并發(fā)性分析結(jié)果。您將能夠按函數(shù)查看性能變化。通過將優(yōu)化前后的結(jié)果進(jìn)行比較,可以評估這些優(yōu)化對性能的影響及影響的程度。請點擊這里查看詳情。
后續(xù)步驟
本指南重點介紹了英特爾? Parallel Amplifier 的基本特性。要了解更多特性并通過英特爾? Parallel Amplifier 獲得更多收益,請點擊這里查看后續(xù)步驟。
評論
查看更多