关于python:彻底搞懂Python-中的-import-与-from-import

December 24, 2020 · 2 min · jiezi

Table of Contents

以下文章起源&作者:青南（谢乾坤）

摄影：产品经理；kingname 的第一套乐高

你好，我是谢乾坤，前网易高级数据挖掘工程师。现任微软最有价值专家（Python 方向），有6年 Python 开发教训，长于解决各种业务场景下的辣手问题，进一步晋升代码品质。

对不少 Python 初学者来说，Python 导入其余模块的形式让他们很难了解。什么时候用import xxx？什么时候用from xxx import yyy？什么时候用from xxx.yyy import zzz？什么时候用from xxx import *？

这篇文章，咱们来彻底搞懂这个问题。

零碎自带的模块

以正则表达式模块为例，咱们常常这样写代码：

import retarget = 'abc1234xyz're.search('(d+)', target)

但有时候，你可能会看到某些人这样写代码：

from re import searchtarget = 'abc1234xyz'search('(d+)', target)

那么这两种导入形式有什么区别呢？

咱们别离应用type函数来看看他们的类型：

>>> import re>>> type(re)<class 'module'>>>> from re import search>>> type(search)<class 'function'>

如下图所示：

能够看到，间接应用import re导入的re它是一个module类，也就是模块。咱们把它成为正则表达式模块。而当咱们from re import search时，这个search是一个function类，咱们称说它为search 函数。

一个模块外面能够蕴含多个函数。

如果在你的代码外面，你曾经确定只应用search函数，不会再应用正则表达式外面的其余函数了，那么你应用两种办法都能够，没什么区别。

然而，如果你要应用正则表达式上面的多个函数，或者是一些常量，那么用第一种计划会更加简洁清晰。

例如：

import rere.search('c(.*?)x', flags=re.S)re.sub('[a-zA-Z0-9]', '***', target, flags=re.I)

在这个例子中，你别离应用了re.search，re.sub，re.S和re.I。后两者是常量，用于疏忽换行符和大小写。

然而，如果你应用from re import search, sub, S, I来写代码，那么代码就会变成这样：

import research('c(.*?)x', flags=S)sub('[a-zA-Z0-9]', '***', target, flags=I)

看起来尽管简洁了，然而，一旦你的代码行数多了当前，你很容易遗记S和I这两个变量是什么货色。而且咱们本人定义的函数，也很有可能取名为sub或者search，从而笼罩正则表达式模块上面的这两个同名函数。这就会导致很多难以发觉的潜在 bug。

再举一个例子。Python 的 datetime模块，咱们能够间接import datetime，此时咱们导入的是一个datetime模块，如下图所示：

然而如果你写为from datetime import datetime，那么你导入的datetime是一个type类：

因为这种形式导入的datetime，它就是Python 中的一种类型，用于示意蕴含日期和工夫的数据。

这两种导入形式导入的datetime，尽管名字一样，然而他们的意义齐全不一样，请大家察看上面两种写法：

import datetimenow = datetime.datetime.now()one_hour_ago = now - datetime.timedelta(hours=1)

from datetime import datetime, timedeltanow = datetime.now()one_hour_ago = now - timedelta(hours=1)

第二种写法看似简略，但实则改变起来却更为麻烦。例如我还须要减少一个变量today用于记录今日的日期。

对于第一段代码，咱们只须要减少一行即可：

today = datetime.date.today()

但对于第二行来说，咱们须要首先批改导入局部的代码：

from datetime import datetime, timedelta, date

而后能力改代码：today = date.today()

这样一来你就要批改两个中央，反倒减少了累赘。

第三方库

在应用某些第三方库的代码外面，咱们会看到相似这样的写法：

 from lxml.html import fromstring  selector = fromstring(HTML)

然而咱们还能够写为：

from lxml import htmlselector = html.fromstring(HTML)

然而，上面这种写法会导致报错：

import lxmlselector = lxml.html.fromstring(HTML)

那么这里的lxml.html又是什么货色呢？

这种状况多常见于一些特地大型的第三方库中，这种库能解决多种类型的数据。例如lxml它既能解决xml的数据，又能解决html的数据，于是这种库会划分子模块，lxml.html模块专门负责html相干的数据。

本人来实现多种导入办法

咱们当初本人来写代码，实现这多种导入办法。

咱们创立一个文件夹DocParser，在外面别离创立两个文件main.py和util.py，他们的内容如下：

util.py文件:

def write():    print('write 函数被调用！')

main.py文件：

import utilutil.write()

运行成果如下图所示：

当初咱们把main.py的导入形式批改一下：

from util import writewrite()

仍然失常运行，如下图所示

 当两个文件在同一个文件夹上面，并且该文件夹外面没有__init__.py 文件时，两种导入形式等价。

当初，咱们来创立一个文件夹microsoft，外面再增加一个文件parse.py：

def read():    print('我是 microsoft 文件夹上面的 parse.py 中的 read函数')

如下图所示：

此时咱们在 main.py中对它进行调用：

parse.read()

运行成果如下图所示：

咱们也能够用另一种办法：

from microsoft.parse import readread()

运行成果如下图所示：

然而，你不能间接导入microsoft，如下图所示：


你只能导入一个模块或者导入一个函数或者类，你不能导入一个文件夹

无论你应用的是import xxx还是from xxx.yyy.zzz.www import qqq，你导入进来的货色，要不就是一个模块(对应到.py 文件的文件名)，或者是某个.py 文件中的函数名、类名、变量名。

无论是import xxx还是from xxx import yyy，你导入进来的都不能是一个文件夹的名字。

可能有这样一种状况，就是某个函数名与文件的名字雷同，例如：

在 microsoft文件夹外面有一个microsoft.py文件，这个文件外面有一个函数叫做microsoft，那么你的代码能够写为：

from microsoft import microsoft`microsoft.microsoft()

但请留神分辨，这里你导入的还是模块，只不过microsoft.py文件名与它所在的文件夹名恰好雷同而已。

总结

无论是应用import还是from import，第一个要求是代码可能失常运行，其次，依据代码维护性，团队编码格调来确定抉择哪一种计划。

如果咱们只会应用到某个模块上面的一个函数（或者常量、类）并且名字不会产生混同，可识别性高，那么from 模块名 import 函数名这没有什么问题。

如果咱们会用到一个模块上面的多个函数，或者是咱们将要应用的函数名、常量名、类名可能会让人产生混同（例如 re.S、re.I），那么这种状况下，import 模块名而后再 模块名.xxx来调用会让代码更加清晰，更好保护。

但无论什么状况下，都禁止应用from xxx import *这种写法，它会给你带来无穷无尽的噩梦。

更多内容

Python 开发中的坑不在少数。不仅会严重破坏代码的稳定性，还会影响我的项目代码开发效率，本身的职业倒退甚至是工作状态。

其实，咱们并不是不想解决问题、并不是甘于编写所谓“漏洞百出”的代码。只是不晓得问题出在哪里、为什么会呈现、应该怎么批改。

多年的业务开发，我详尽记录了多个实在产生的谬误、坑点，并提炼出 42 章节的《Python 业务开发常见谬误案例集》视频课程。

谬误坑点次要分为代码编写、开发思维两类。

点击链接，查看视频课详情：https://ke.sifou.com/course/1...

课程学习导图如下：https://ke.sifou.com/course/1...