作者：韩信子@ShowMeAI
教程地址：http://www.showmeai.tech/tutorials/33
本文地址：http://www.showmeai.tech/article-detail/142
申明：版权所有，转载请分割平台与作者并注明出处

n维数组是NumPy的外围概念，大部分数据的操作都是基于n维数组实现的。本系列内容笼罩到1维数组操作、2维数组操作、3维数组操作方法，本篇解说Numpy与1维数组操作。

一、向量初始化

能够通过Python列表创立NumPy数组。

如图中（a），将列表元素转化为一维数组。留神，这里个别会确保列表元素类型雷同，否则默认dtype=’object'，会影响后续运算，甚至产生语法错误。

因为在数组开端没有预留空间以疾速增加新元素，NumPy数组无奈像Python列表那样增长。因而，通常的解决形式包含：

在变长Python列表中筹备好数据，而后将其转换为NumPy数组
应用 np.zeros 或 np.empty 事后调配必要的空间（图中b）

通过图中（c）办法，能够创立一个与某一变量形态统一的空数组。

不止是空数组，通过上述办法还能够将数组填充为特定值：

在NumPy中，还能够通过枯燥序列初始化数组：

如果咱们须要浮点数组，能够应用 arange(3).astype(float) 这样的操作更改arange输入的类型，也能够在参数端应用浮点数，比方 arange(4.) 来生产浮点数Numpy数组。
以下是arange浮点类型数据可能呈现的一些问题及解决方案：

图中，0.1对咱们来说是一个无限的十进制数，但对计算机而言，它是一个二进制无穷小数，必须四舍五入为一个近似值。因而，将小数作为arange的步长可能导致一些谬误。能够通过以下两种形式防止如上谬误：

使距离开端落入非整数步数，但这会升高可读性和可维护性；
应用linspace，这样能够防止四舍五入的谬误影响，并始终生成要求数量的元素。
- 应用linspace时尤其须要留神最初一个的数量参数设置，因为它计算点数量，而不是距离数量，因而上图中数量参数是11，而不是10。

随机数组的生成办法如下：

二、向量索引

NumPy能够应用十分间接的形式对数组数据进行拜访：

图中，除“fancy indexing”外，其余所有索引办法实质上都是views：它们并不存储数据，如果原数组在被索引后产生更改，则会反映出原始数组中的更改。

上述所有这些办法都能够扭转原始数组，即容许通过调配新值扭转原数组的内容。这导致无奈通过切片来复制数组。如下是python列表和NumPy数组的比照：

NumPy数组反对通过布尔索引获取数据，联合各种逻辑运算符能够有很高级的数据抉择形式，这在Python列表中是不具备的：

留神，不能够应用3 <= a <= 5这样的Python“三元”比拟。

如上所述，布尔索引是可写的。如下图 np.where 和 np.clip 两个专有函数。

三、向量操作

NumPy反对疾速计算，向量运算操作靠近C++速度级别，并不受Python循环自身计算慢的限度。NumPy容许像一般数字一样操作整个数组：

在python中，a//b示意a div b（除法的商），x**n示意 xⁿ

浮点数的计算也是如此，NumPy可能将标量播送到数组：

Numpy提供了许多数学函数来解决矢量：

向量点乘（内积）和叉乘（外积、向量积）如下：

NumPy也提供了如下三角函数运算：

数组整体进行四舍五入：

floor向上取整，ceil向下取整，round四舍五入

np.around 与 np.round 是等效的，这样做只是为了防止 from numpy import * 时与Python around的抵触（但个别的应用形式是import numpy as np）。当然，你也能够应用a.round()。

NumPy还能够实现以下性能：

以上性能都存在相应的nan-resistant变体：例如nansum，nanmax等

在NumPy中，排序函数性能有所阉割：

对于一维数组，能够通过反转后果来解决reversed函数缺失的有余，但在2维数组中该问题变得辣手。

四、查找向量中的元素

NumPy数组并没有Python列表中的索引办法，索引数据的比照如下：

index()中的方括号示意 j 或 i&j 能够省略

能够通过 np.where(a==x)[0] [0]查找元素，但这种办法很不pythonic，哪怕须要查找的项在数组结尾，该办法也须要遍历整个数组。
应用Numba实现减速查找，next((i[0] for i, v in np.ndenumerate(a) if v==x), -1)，在最坏的状况下，它的速度要比where慢。
如果数组是排好序的，应用v = np.searchsorted(a, x); return v if a[v]==x else -1工夫复杂度为O(log N)，但在这之前，排序的工夫复杂度为O(N log N)。

实际上，通过C实现减速搜寻并不是艰难，问题是浮点数据比拟。

五、浮点数比拟

np.allclose(a, b)用于容忍误差之内的浮点数比拟。

np.allclose假设所有比拟数字的尺度为1。如果在纳秒级别上，则须要将默认atol参数除以1e9：np.allclose(1e-9,2e-9, atol=1e-17)==False。
math.isclose不对要比拟的数字做任何假如，而是须要用户提供一个正当的abs\_tol值（np.allclose默认的atol值1e-8足以满足小数位数为1的浮点数比拟，即math.isclose(0.1+0.2–0.3, abs_tol=1e-8)==True。

此外，对于绝队偏差和相对偏差，np.allclose仍然存在一些问题。例如，对于某些值a、b， allclose(a,b)!=allclose(b,a)，而在math.isclose中则不存在这些问题。查看GitHub上的浮点数据指南和相应的NumPy问题理解更多信息。

材料与代码下载

本教程系列的代码能够在ShowMeAI对应的github中下载，可本地python环境运行，能迷信上网的宝宝也能够间接借助google colab一键运行与交互操作学习哦！

本系列教程波及的速查表能够在以下地址下载获取：

NumPy速查表
Pandas速查表
Matplotlib速查表
Seaborn速查表

拓展参考资料

NumPy教程
Python NumPy教程

ShowMeAI相干文章举荐

数据分析介绍
数据分析思维
数据分析的数学根底
业务认知与数据初探
数据荡涤与预处理
业务剖析与数据挖掘
数据分析工具地图
统计与数据科学计算工具库Numpy介绍
Numpy与1维数组操作
Numpy与2维数组操作
Numpy与高维数组操作
数据分析工具库Pandas介绍
图解Pandas外围操作函数大全
图解Pandas数据变换高级函数
Pandas数据分组与操作
数据可视化准则与办法
基于Pandas的数据可视化
seaborn工具与数据可视化

ShowMeAI系列教程举荐

图解Python编程：从入门到精通系列教程
图解数据分析：从入门到精通系列教程
图解AI数学根底：从入门到精通系列教程
图解大数据技术：从入门到精通系列教程

关于数据分析:Python数据分析-Numpy与1维数组操作

一、向量初始化

二、向量索引

三、向量操作

四、查找向量中的元素

五、浮点数比拟

材料与代码下载

本系列教程波及的速查表能够在以下地址下载获取：

拓展参考资料

ShowMeAI相干文章举荐

ShowMeAI系列教程举荐

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据分析:Python数据分析-Numpy与1维数组操作

一、向量初始化

二、向量索引

三、向量操作

四、查找向量中的元素

五、浮点数比拟

材料与代码下载

本系列教程波及的速查表能够在以下地址下载获取：

拓展参考资料

ShowMeAI相干文章举荐

ShowMeAI系列教程举荐

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复