关于人工智能:Python性能分析技巧

1次阅读

共计 2505 个字符,预计需要花费 7 分钟才能阅读完成。

作者 |Ujjwal Dalmia
编译 |VK
起源 |Towards Data Science

当咱们开始精通编程语言时,咱们不仅心愿实现最终目标,而且心愿使咱们的程序高效。

在这个教程中,咱们将学习一些 Ipython 的命令,这些命令能够帮忙咱们对 Python 代码进行工夫剖析。

留神,在本教程中,我倡议应用 Anaconda。

1. 剖析一行代码

要查看一行 python 代码的执行工夫,请应用 %timeit。上面是一个简略的例子来理解它的工作原理:

#### magics 命令 %timeit 的简略用法
%timeit [num for num in range(20)]

#### 输入
1.08 µs ± 43 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

次要注意事项:

  • 在要剖析的代码行之前应用 %timeit
  • 它返回代码运行的平均值和标准偏差。在下面的示例中,执行了 7 次,每次执行对该代码循环 100 万次 (默认行为)。这须要均匀 1.08 微秒和 43 纳秒的标准偏差。
  • 在调用 magic 命令时,能够自定义运行和循环的数量。示例如下:
#### 在 %timeit magic 命令中自定义运行和循环数
%timeit -r5 -n100 [num for num in range(20)]

1.01 µs ± 5.75 ns per loop (mean ± std. dev. of 5 runs, 100 loops each)

应用命令选项 - r 和 -n,别离示意执行次数和循环次数,咱们将工夫配置文件操作定制为执行 5 次和循环 100 次。

2. 剖析多行代码

本节向前迈进了一步,并解释了如何剖析残缺的代码块。通过对 %timeit magic 命令进行一个小的批改,将单百分比(%)替换为双百分比(%%),就能够剖析一个残缺的代码块。以下为示例演示,供参考:

#### 应用 timeblock%% 代码剖析
%%timeit -r5 -n1000
for i in range(10):
    n = i**2
    m = i**3
    o = abs(i)
    
#### 输入
10.5 µs ± 226 ns per loop (mean ± std. dev. of 5 runs, 1000 loops each)

能够察看到 for 循环的均匀执行工夫为 10.5 微秒。请留神,命令选项 - r 和 - n 别离用于管制执行次数和循环次数。

3. 代码块中的每一行代码进行工夫剖析

到目前为止,咱们只在剖析一行代码或代码块时查看摘要统计信息。如果咱们想评估代码块中每一行代码的性能呢?应用 Line_profiler

Line_profiler 包可用于对任何函数执行逐行剖析。要应用 line_profiler 软件包,请执行以下步骤:

  • 装置—Line_profiler 包能够通过简略的调用 pip 或 conda Install 来装置。如果应用的是针对 Python 的 anaconda 发行版,倡议应用 conda 装置
#### 装置 line_profiler 软件包
conda install line_profiler

加载扩大 —一旦装置,你能够应用 IPython 来加载 line_profiler:

#### 加载 line_profiler 的 Ipython 扩大
%load_ext line_profiler

工夫剖析函数 —加载后,应用以下语法对任何预约义函数进行工夫剖析

%lprun -f function_name_only function_call_with_arguments

语法细节

  • 对 line_profiler 的调用以关键字 %lprun 开始,后跟命令选项 -f
  • 命令选项之后是函数名,而后是函数调用

在本练习中,咱们将定义一个承受高度(以米为单位)和分量(以磅为单位)列表的函数,并将其别离转换为厘米和千克。

#### 定义函数
def conversion(ht_mtrs, wt_lbs):
    ht_cms = [ht*100 for ht in ht_mtrs]
    wt_kgs = [wt*.4535 for wt in wt_lbs]
    
#### 定义高度和分量列表:
ht = [5,5,4,7,6]
wt = [108, 120, 110, 98]

#### 应用 line_profiler 剖析函数
%lprun -f conversion conversion(ht,wt)

---------------------------------------------------------------
#### 输入
Total time: 1.46e-05 s

File: <ipython-input-13-41e195af43a9>

Function: conversion at line 2

Line #      Hits         Time  Per Hit   % Time  Line Contents
==============================================================
     2       1        105.0    105.0     71.9      ht_cms = [ht*100 for ht in ht_mtrs]
     3       1         41.0     41.0     28.1      wt_kgs = [wt*.4535 for wt in wt_lbs]

输入详细信息:

以 14.6 微秒为单位(参考第一行输入)

生成的表有 6 列:

  • 第 1 列(行 #)—代码的行号(请留神,第#1 行是成心从输入中省略的,因为它只是函数定义语句)
  • 第 2 列(命中)—调用该行的次数
  • 第 3 列(工夫)—在代码行上破费的工夫单位数(每个工夫单位为 14.6 微秒)
  • 第 4 列(每次命中均匀工夫)—第 3 列除以第 2 列
  • 第 5 列(%Time)—在所破费的总工夫中,花在特定代码行上的工夫百分比是多少
  • 第 6 列(内容)—代码行的内容

你能够分明地留神到,高度从米到厘米的转换简直占了总工夫的 72%。

结束语

利用每一行代码的执行工夫,咱们能够部署策略来进步代码的效率。在接下来的 3 个教程中,咱们将分享一些最佳实际来帮忙你进步代码的效率。

我心愿这篇教程能提供帮忙,你能学到一些新货色。

原文链接:https://towardsdatascience.co…

欢送关注磐创 AI 博客站:
http://panchuang.net/

sklearn 机器学习中文官网文档:
http://sklearn123.com/

欢送关注磐创博客资源汇总站:
http://docs.panchuang.net/

正文完
 0