共计 3588 个字符,预计需要花费 9 分钟才能阅读完成。
以下文章起源 & 作者: 青南(谢乾坤)
摄影:产品经理;kingname 的第一套乐高
你好,我是谢乾坤,前网易高级数据挖掘工程师。现任微软最有价值专家(Python 方向),有 6 年 Python 开发教训,长于解决各种业务场景下的辣手问题,进一步晋升代码品质。
对不少 Python 初学者来说,Python 导入其余模块的形式让他们很难了解。什么时候用import xxx
?什么时候用from xxx import yyy
?什么时候用from xxx.yyy import zzz
?什么时候用from xxx import *
?
这篇文章,咱们来彻底搞懂这个问题。
零碎自带的模块
以正则表达式模块为例,咱们常常这样写代码:
import re
target = 'abc1234xyz'
re.search('(d+)', target)
但有时候,你可能会看到某些人这样写代码:
from re import search
target = 'abc1234xyz'
search('(d+)', target)
那么这两种导入形式有什么区别呢?
咱们别离应用 type
函数来看看他们的类型:
>>> import re
>>> type(re)
<class 'module'>
>>> from re import search
>>> type(search)
<class 'function'>
如下图所示:
能够看到,间接应用 import re
导入的 re
它是一个 module
类,也就是模块。咱们把它成为 正则表达式模块
。而当咱们from re import search
时,这个 search
是一个 function
类,咱们称说它为search 函数
。
一个模块外面能够蕴含多个函数。
如果在你的代码外面,你曾经确定只应用 search
函数,不会再应用正则表达式外面的其余函数了,那么你应用两种办法都能够,没什么区别。
然而,如果你要应用正则表达式上面的多个函数,或者是一些常量,那么用第一种计划会更加简洁清晰。
例如:
import re
re.search('c(.*?)x', flags=re.S)
re.sub('[a-zA-Z0-9]', '***', target, flags=re.I)
在这个例子中,你别离应用了 re.search
,re.sub
,re.S
和re.I
。后两者是常量,用于疏忽换行符和大小写。
然而,如果你应用 from re import search, sub, S, I
来写代码,那么代码就会变成这样:
import re
search('c(.*?)x', flags=S)
sub('[a-zA-Z0-9]', '***', target, flags=I)
看起来尽管简洁了,然而,一旦你的代码行数多了当前,你很容易遗记 S
和I
这两个变量是什么货色。而且咱们本人定义的函数,也很有可能取名为 sub
或者search
,从而笼罩正则表达式模块上面的这两个同名函数。这就会导致很多难以发觉的潜在 bug。
再举一个例子。Python 的 datetime
模块,咱们能够间接 import datetime
,此时咱们导入的是一个datetime
模块,如下图所示:
然而如果你写为 from datetime import datetime
,那么你导入的datetime
是一个 type
类:
因为这种形式导入的datetime
,它就是 Python 中的一种类型,用于示意蕴含日期和工夫的数据。
这两种导入形式导入的datetime
,尽管名字一样,然而他们的意义齐全不一样,请大家察看上面两种写法:
import datetime
now = datetime.datetime.now()
one_hour_ago = now - datetime.timedelta(hours=1)
from datetime import datetime, timedelta
now = datetime.now()
one_hour_ago = now - timedelta(hours=1)
第二种写法看似简略,但实则改变起来却更为麻烦。例如我还须要减少一个变量 today
用于记录今日的日期。
对于第一段代码,咱们只须要减少一行即可:
today = datetime.date.today()
但对于第二行来说,咱们须要首先批改导入局部的代码:
from datetime import datetime, timedelta, date
而后能力改代码:today = date.today()
这样一来你就要批改两个中央,反倒减少了累赘。
第三方库
在应用某些第三方库的代码外面,咱们会看到相似这样的写法:
from lxml.html import fromstring
selector = fromstring(HTML)
然而咱们还能够写为:
from lxml import html
selector = html.fromstring(HTML)
然而,上面这种写法会导致报错:
import lxml
selector = lxml.html.fromstring(HTML)
那么这里的 lxml.html
又是什么货色呢?
这种状况多常见于一些特地大型的第三方库中,这种库能解决多种类型的数据。例如 lxml
它既能解决 xml
的数据,又能解决 html
的数据,于是这种库会划分子模块,lxml.html
模块专门负责 html
相干的数据。
本人来实现多种导入办法
咱们当初本人来写代码,实现这多种导入办法。
咱们创立一个文件夹 DocParser
,在外面别离创立两个文件main.py
和util.py
,他们的内容如下:
util.py
文件:
def write():
print('write 函数被调用!')
main.py
文件:
import util
util.write()
运行成果如下图所示:
当初咱们把 main.py
的导入形式批改一下:
from util import write
write()
仍然失常运行,如下图所示
当两个文件在同一个文件夹上面,并且该文件夹外面没有__init__.py 文件时,两种导入形式等价。
当初,咱们来创立一个文件夹microsoft
,外面再增加一个文件parse.py
:
def read():
print('我是 microsoft 文件夹上面的 parse.py 中的 read 函数')
如下图所示:
此时咱们在 main.py
中对它进行调用:
parse.read()
运行成果如下图所示:
咱们也能够用另一种办法:
from microsoft.parse import read
read()
运行成果如下图所示:
然而,你不能间接导入microsoft
,如下图所示:
你只能导入一个模块或者导入一个函数或者类,你不能导入一个文件夹
无论你应用的是 import xxx
还是from xxx.yyy.zzz.www import qqq
,你导入进来的货色,要不就是一个模块(对应到.py 文件的文件名),或者是某个.py 文件中的函数名、类名、变量名。
无论是 import xxx
还是from xxx import yyy
,你导入进来的都不能是一个文件夹的名字。
可能有这样一种状况,就是某个函数名与文件的名字雷同,例如:
在 microsoft
文件夹外面有一个 microsoft.py
文件,这个文件外面有一个函数叫做microsoft
,那么你的代码能够写为:
from microsoft import microsoft`
microsoft.microsoft()
但请留神分辨,这里你导入的还是模块,只不过 microsoft.py
文件名与它所在的文件夹名恰好雷同而已。
总结
无论是应用 import
还是from import
,第一个要求是代码可能失常运行,其次,依据代码维护性,团队编码格调来确定抉择哪一种计划。
如果咱们只会应用到某个模块上面的一个函数(或者常量、类)并且名字不会产生混同,可识别性高,那么 from 模块名 import 函数名
这没有什么问题。
如果咱们会用到一个模块上面的多个函数,或者是咱们将要应用的函数名、常量名、类名可能会让人产生混同(例如 re.S、re.I),那么这种状况下,import 模块名
而后再 模块名.xxx
来调用会让代码更加清晰,更好保护。
但无论什么状况下,都禁止应用 from xxx import *
这种写法,它会给你带来无穷无尽的噩梦。
更多内容
Python 开发中的坑不在少数。不仅会严重破坏代码的稳定性,还会影响我的项目代码开发效率,本身的职业倒退甚至是工作状态。
其实,咱们并不是不想解决问题、并不是甘于编写所谓“漏洞百出”的代码。只是不晓得问题出在哪里、为什么会呈现、应该怎么批改。
多年的业务开发,我详尽记录了多个实在产生的谬误、坑点,并提炼出 42 章节的 《Python 业务开发常见谬误案例集》 视频课程。
谬误坑点次要分为代码编写、开发思维两类。
点击链接,查看视频课详情:https://ke.sifou.com/course/1…
课程学习导图如下:https://ke.sifou.com/course/1…