博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Theano2.1.17-基础知识之剖析theano的函数
阅读量:6553 次
发布时间:2019-06-24

本文共 2793 字,大约阅读时间需要 9 分钟。

来自:http://deeplearning.net/software/theano/tutorial/profiling.html

Profiling Theano function

note:该方法是用来代替旧的ProfileMode.不要再使用ProfileMode了。

         在检查错误的同时,另一个重要的任务就是剖析你的代码。你会用到theano 的flags 或者参数,然后将它们传递给 

        最简单的剖析theano函数的方式就是使用下面介绍的theano flags。当进程存在的时候,它们会将信息输出到stdout(标准输出流)。

使用 ProfileMode 是一个三步过程

开启这个分析器是很简单的,只需要用到 flag .

确保内存分析器用到theano 的flag:  和 .

为了能够在theano优化的时候进行分析,使用theano 的flag:  和 .

你可以使用theano 的flags profiling.n_applyprofiling.n_ops 和profiling.min_memory_size 来修改打印信息的数量。

分析器会对每个theano函数进行分析,而且会分析打印出的分析的总和。每个分析包含4个部分:全局信息,类信息,ops信息和apply节点信息。

    在全局部分, “Message” 就是theano函数的名称, theano.function() 有一个可选的参数 name 而这个默认是为None。对name进行有意义的赋值有助于你分析许多theano函数 。在这个部分中,我们同样看到函数调用的次数和在所有这些调用上花费的总的时间。花费在Function.fn.__call__ 上和在块中的时间分析有助于理解theano的开销。

    同样的,我们看到在编译过程的两个阶段上时间的花费:优化(修改graph使得能够更加的稳定/快速) 和链接(编译c 代码并可以被python调用).

    类,ops和apply节点部分有着相同的信息:关于运行的apply节点的信息。ops部分会从apply部分得到有用的信息然后融合那些有着相同op的apply节点。如果在graph中两个apply节点有着两个相同的ops,那么它们会被融合。一些节点比如逐元素,如果它们的参数不同的话(被执行的标量),就不相等了。 所以类部分会比ops部分融合更多的apply节点。

    这里就是一个当我们禁用某些theano优化来更加直观清晰的理解不同的部分之间的差异的一个例子。在当所有的优化都启用的时候,那么在graph中就只剩下一个op了。

note:

为了剖析在gpu上内存使用的高峰情况,你需要:

* 在文件中 theano/sandbox/cuda/cuda_ndarray.cu, 设置宏  COMPUTE_GPU_MEM_USED to 1.* 然后调用 theano.sandbox.cuda.theano_allocated()  它返回一个有着2个int值的元组.第一个值就是指示当前的gpu分配给theano的内存;第二个就是theano占用gpu内存使用的峰值。

不要总是开启这个宏,这会减慢内存分配和释放。而且还会减慢计算速度,所以会影响到速度分析。所以不要在这些情况下开启这个。

运行这个例子:

THEANO_FLAGS=optimizer_excluding=fusion:inplace,profile=True python doc/tutorial/profiling_example.py

输出:

Function profiling==================  Message: None  Time in 1 calls to Function.__call__: 5.698204e-05s  Time in Function.fn.__call__: 1.192093e-05s (20.921%)  Time in thunks: 6.198883e-06s (10.879%)  Total compile time: 3.642474e+00s    Theano Optimizer time: 7.326508e-02s       Theano validate time: 3.712177e-04s    Theano Linker time (includes C, CUDA code generation/compiling): 9.584920e-01sClass---<% time> 

参考资料:

[1]官网:http://deeplearning.net/software/theano/tutorial/profiling.html

转载地址:http://dvjco.baihongyu.com/

你可能感兴趣的文章
Nacos Committers 团队首亮相,发布 0.9.0 版本
查看>>
软件中心哪家强?
查看>>
使用Linux的15大理由
查看>>
ONOS 项目与 Linux 基金会合作开发 SDN/NFV
查看>>
Django高亮Markdown代码
查看>>
第一周
查看>>
Python简介和入门
查看>>
linux常用熟练运用的命令
查看>>
当服务器出现意外时键盘dump
查看>>
java线程池的四种方法测试
查看>>
Mac系统和iphone概述
查看>>
从一个TabBar点击跳转到另一个TabBar(设置)里的页面
查看>>
IT兄弟连 Java Web教程 经典案例2
查看>>
微信分享到朋友圈,怎么自定义分享的标题,图片,内容?
查看>>
PMP-4整合管理
查看>>
mysql 日志
查看>>
php连接mysql
查看>>
salt 001
查看>>
shell文本行截取子串
查看>>
什么是你的核心竞争力之一?
查看>>