⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 vtune的基本使用方法(转).txt

📁 VTUNE使用说明
💻 TXT
字号:
VTune(TM) Performance Analyzer 是针对Intel芯片的一款性能分析软件。安装文件在喻信ftp/Diansoftware/Temp/Intel VTune目录下。芯片是AMD的同学就不能用了:)

今天摸索着用了一下VTune,基本的用法还是比较简单的,基本使用步骤如下:
(1)新建一个工程:File->new project,一般选Quick Performence Analysis Wizard就可以了。
(2)选择要测试的程序,在弹出的对话框中有Application to Launch,填入Debug文件下的exe程序就行了。
(3)Run Activity:按工具栏上的绿色三角按钮就行了。本来还有些配置可以配的,不过比较麻烦,一般的分析就算了。
(4)完了就会生成很多表,最麻烦的就是怎么看这些数据。左边有这些数据的一个树型列表,可以选择看哪个统计表,中间就是相应的图表现实,图表下面还有一个Legend窗口,解释图表中的符号各是什么意思。下面简单介绍一下这些图表。

统计图表分为两部分:Sampling Result和Counter monitor Result,后面一个顾名思义
应该是时钟监视结果,我没怎么用,主要是前面一个。
Sampling Result又分为几个表,Run1是一个总的表,可以看到Instruction Requied(执行次数)、Clockticks(消耗的时钟时间)和CPI(每次执行消耗的时钟时间)的信息,这三个数据其实知道两个另外一个就可以算出来的,不过都列出来看起来比较方便,Legend窗口中有个绿色箭头可以选择按哪一个指标进行排序。
这时在所有的程序中找到自己要测的那一个,通常就是消耗时钟时间最多的,不是的话看名字也找得到。双击它就可以看到更进一步信息,这时上面的下拉菜单可以选择按函数、文件等查看。我选的是按函数查看,比较容易定位热点。
现在就可以根据占用的执行时间定位一些比较“热”的函数,有的可能是执行时间比较长的,有的可能是执行次数比较多的。然后双击某个函数,就可能看到它的源码,这时右边的列表中给出了一些指令的执行次数和执行时间。经过分析又可以定位一些比较“热”的指令。

接下来就是针对这些比较“热”的函数和函数中比较“热”的语句进行优化。

也可以单独看Instruction Requied的表和Clockticks的表,这时表中就分别只有一项信息,我还是比价喜欢看Run1那个表:)


借助英特尔? VTune? 可视化性能分析器, 便可在应用运行时收集多项执行标准。当一系列计数器可用时,有必要重点借助一个子集来使进程易于管理。
从下面一系列原始数值和派生比率开始: 时钟周期、退回的指令、每退回指令的时钟周期、退回的微操作、每退回微操作的时钟周期、浮点指令百分比。
通过比较线程前后的这些值,开始执行线程应用性能分析。

时钟周期:
应用的时钟周期数量可出色替代执行应用所需的 CPU 时间。对于单一的线程运行,乘以了时钟速率的总时钟周期即为应用的总运行时间。对于在支持多核或多线程技术的处理器上运行的多线程应用,时钟周期处理级的量即为所有线程的时钟周期总数。

退回的指令:
当一个程序运行时,处理器执行一系列指令,当各个指令执行完毕时,所有指令便被退回。该标准报告了在执行程序时退回的指令数量。

每退回指令的时钟周期(CPI):
CPI 是时钟周期与退回的指令之间的比值。是对处理器内部资源利用率的测算。这个值越高,说明资源利用率越低。

退回的微操作:
各指令进一步划分为由处理器执行的微操作。该标准报告了在执行程序时退回的微操作数量。该数量始终大于退回指令的数量。

每微操作的时钟周期


http://www.intelsoftware.com.cn/fenxiqi01.html

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -