共计 2505 个字符,预计需要花费 7 分钟才能阅读完成。
作者 |Ujjwal Dalmia
编译 |VK
起源 |Towards Data Science
当咱们开始精通编程语言时,咱们不仅心愿实现最终目标,而且心愿使咱们的程序高效。
在这个教程中,咱们将学习一些 Ipython 的命令,这些命令能够帮忙咱们对 Python 代码进行工夫剖析。
留神,在本教程中,我倡议应用 Anaconda。
1. 剖析一行代码
要查看一行 python 代码的执行工夫,请应用 %timeit。上面是一个简略的例子来理解它的工作原理:
#### magics 命令 %timeit 的简略用法
%timeit [num for num in range(20)]
#### 输入
1.08 µs ± 43 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
次要注意事项:
- 在要剖析的代码行之前应用 %timeit
- 它返回代码运行的平均值和标准偏差。在下面的示例中,执行了 7 次,每次执行对该代码循环 100 万次 (默认行为)。这须要均匀 1.08 微秒和 43 纳秒的标准偏差。
- 在调用 magic 命令时,能够自定义运行和循环的数量。示例如下:
#### 在 %timeit magic 命令中自定义运行和循环数
%timeit -r5 -n100 [num for num in range(20)]
1.01 µs ± 5.75 ns per loop (mean ± std. dev. of 5 runs, 100 loops each)
应用命令选项 - r 和 -n,别离示意执行次数和循环次数,咱们将工夫配置文件操作定制为执行 5 次和循环 100 次。
2. 剖析多行代码
本节向前迈进了一步,并解释了如何剖析残缺的代码块。通过对 %timeit magic 命令进行一个小的批改,将单百分比(%)替换为双百分比(%%),就能够剖析一个残缺的代码块。以下为示例演示,供参考:
#### 应用 timeblock%% 代码剖析
%%timeit -r5 -n1000
for i in range(10):
n = i**2
m = i**3
o = abs(i)
#### 输入
10.5 µs ± 226 ns per loop (mean ± std. dev. of 5 runs, 1000 loops each)
能够察看到 for 循环的均匀执行工夫为 10.5 微秒。请留神,命令选项 - r 和 - n 别离用于管制执行次数和循环次数。
3. 代码块中的每一行代码进行工夫剖析
到目前为止,咱们只在剖析一行代码或代码块时查看摘要统计信息。如果咱们想评估代码块中每一行代码的性能呢?应用 Line_profiler。
Line_profiler 包可用于对任何函数执行逐行剖析。要应用 line_profiler 软件包,请执行以下步骤:
- 装置—Line_profiler 包能够通过简略的调用 pip 或 conda Install 来装置。如果应用的是针对 Python 的 anaconda 发行版,倡议应用 conda 装置
#### 装置 line_profiler 软件包
conda install line_profiler
加载扩大 —一旦装置,你能够应用 IPython 来加载 line_profiler:
#### 加载 line_profiler 的 Ipython 扩大
%load_ext line_profiler
工夫剖析函数 —加载后,应用以下语法对任何预约义函数进行工夫剖析
%lprun -f function_name_only function_call_with_arguments
语法细节 :
- 对 line_profiler 的调用以关键字 %lprun 开始,后跟命令选项 -f
- 命令选项之后是函数名,而后是函数调用
在本练习中,咱们将定义一个承受高度(以米为单位)和分量(以磅为单位)列表的函数,并将其别离转换为厘米和千克。
#### 定义函数
def conversion(ht_mtrs, wt_lbs):
ht_cms = [ht*100 for ht in ht_mtrs]
wt_kgs = [wt*.4535 for wt in wt_lbs]
#### 定义高度和分量列表:
ht = [5,5,4,7,6]
wt = [108, 120, 110, 98]
#### 应用 line_profiler 剖析函数
%lprun -f conversion conversion(ht,wt)
---------------------------------------------------------------
#### 输入
Total time: 1.46e-05 s
File: <ipython-input-13-41e195af43a9>
Function: conversion at line 2
Line # Hits Time Per Hit % Time Line Contents
==============================================================
2 1 105.0 105.0 71.9 ht_cms = [ht*100 for ht in ht_mtrs]
3 1 41.0 41.0 28.1 wt_kgs = [wt*.4535 for wt in wt_lbs]
输入详细信息:
以 14.6 微秒为单位(参考第一行输入)
生成的表有 6 列:
- 第 1 列(行 #)—代码的行号(请留神,第#1 行是成心从输入中省略的,因为它只是函数定义语句)
- 第 2 列(命中)—调用该行的次数
- 第 3 列(工夫)—在代码行上破费的工夫单位数(每个工夫单位为 14.6 微秒)
- 第 4 列(每次命中均匀工夫)—第 3 列除以第 2 列
- 第 5 列(%Time)—在所破费的总工夫中,花在特定代码行上的工夫百分比是多少
- 第 6 列(内容)—代码行的内容
你能够分明地留神到,高度从米到厘米的转换简直占了总工夫的 72%。
结束语
利用每一行代码的执行工夫,咱们能够部署策略来进步代码的效率。在接下来的 3 个教程中,咱们将分享一些最佳实际来帮忙你进步代码的效率。
我心愿这篇教程能提供帮忙,你能学到一些新货色。
原文链接:https://towardsdatascience.co…
欢送关注磐创 AI 博客站:
http://panchuang.net/
sklearn 机器学习中文官网文档:
http://sklearn123.com/
欢送关注磐创博客资源汇总站:
http://docs.panchuang.net/