关于python3.x:Python造假数据用扩展库Faker足够了附源码

31次阅读

共计 1856 个字符,预计需要花费 5 分钟才能阅读完成。

前言

明天用 Python 给大家造“假”数据,间接开整~

开发工具

Python 版本:3.6.4
相干模块:Faker

Faker 扩大库

这时,Python 扩大库 Faker 来了,带着它那各种各样的数据来了。

先装置 faker

pip install Faker

创立 faker 对象

from faker import Faker
fake = Faker()

随机生成一个名字

fake.name()  # 'Nancy Horton'

上边生成的名字是英文的,如果想要个中文名字,在创立 Faker 对象的时候,指定语言“中文”就能够。

fake = Faker("zh_CN")

一些罕用的语言包含以下等等:

  • 简体中文:zh_CN
  • 繁体中文:zh_TW
  • 美国英文:en_US
  • 英国英文:en_GB
  • 德文:de_DE
  • 日文:ja_JP
  • 韩文:ko_KR
  • 法文:fr_FR

都有什么样的数据

faker 提供了一些 Standard Providers,列出了一些较为较为罕用的数据。

  • address
  • company
  • date_time
  • job
  • person
  • phone_number
  • profile
  • python
  • user_agent

比方生成“地址”信息

In [1]: fake.address()
Out[1]: '北京市大冶市海陵赵路 x 座 941837'

这里给出的是一整条“地址”的信息,你也能够通过 building_number()、city()、street_address() 等获取单个信息

这些字段其实记不住也没什么,须要用哪个的时候查阅官网文档就行。

文档链接

https://faker.readthedocs.io/…

再比方生成“职位”信息

In [2]: fake.job()
Out[2]: '教育 /Python 工程师'

生成 python 的数据类型

# 生成一个字典
In [3]: fake.pydict()
Out[3]:
{'生产': 'OlmMWPfQMJYxeiJtZSFC',
 '有些': 'jUYzbWgDEqvzjiAsubSX',
 '资源': 7670,
 '利用': 804210265906561.0,
 '国内': 9113,
 '电影': 'https://yangtang.cn/homepage.jsp',
 '方面': 'RGfbqIgxqTbnjkGDpoVO',
 '为什': 1947,
 '地址': 7021,
 '时候': 'oxia@hotmail.com'}

生成 user_agent

In [4]: fake.chrome()
Out[4]: 'Mozilla/5.0 (iPad; CPU iPad OS 4_2_1 like Mac OS X) AppleWebKit/531.2 (KHTML, like Gecko) CriOS/55.0.807.0 Mobile/62B715 Safari/531.2'

生成个人信息

In [5]: fake.profile()
Out[5]:
{'job': '代码管理员',
 'company': '文亭传媒有限公司',
 'ssn': '370302198922223749',
 'residence': '广东省深圳市沈北新王路 k 座 203394',
 'current_location': (Decimal('32.942244'), Decimal('95.029663')),
 'blood_group': 'O-',
 'website': ['https://www.minyan.cn/'],
 'username': 'yangwen',
 'name': '蒋璐',
 'sex': 'M',
 'address': '宁夏回族自治区宁德县丰都长沙街 b 座 685258',
 'mail': 'oliao@yahoo.com',
 'birthdate': datetime.date(1971, 2, 13)}

如果想生成多条个人信息,能够利用 for 循环,把每个字典在增加到列表里,导出一个 DataFrame

文章到这里就完结了,感激你的观看,Python 数据分析系列,下篇文章分享 Python 爬取鲁迅学生《经典语录》

为了感激读者们,我想把我最近珍藏的一些编程干货分享给大家,回馈每一个读者,心愿能帮到你们。

干货次要有:

① 2000 多本 Python 电子书(支流和经典的书籍应该都有了)

② Python 规范库材料(最全中文版)

③ 我的项目源码(四五十个乏味且经典的练手我的项目及源码)

④ Python 根底入门、爬虫、web 开发、大数据分析方面的视频(适宜小白学习)

⑤ Python 学习路线图(辞别不入流的学习)

⑥ 两天的 Python 爬虫训练营直播权限

All done~详见个人简介或者私信获取残缺源代码。。

正文完
 0