上一篇文章：Python3网络爬虫实战—12、部署相关库的安装：Docker、Scrapyd
下一篇文章：Python3网络爬虫实战—14、部署相关库的安装：Scrapyrt、Gerapy

ScrapydClient的安装

在将 Scrapy 代码部署到远程 Scrapyd 的时候，其第一步就是要将代码打包为 Egg 文件，其次需要将 Egg 文件上传到远程主机，这个过程如果我们用程序来实现是完全可以的，但是我们并不需要做这些工作，因为 ScrapydClient 已经为我们实现了这些功能。
下面我们就来过一下 ScrapydClient 的安装过程。

1. 相关链接

GitHub：https://github.com/scrapy/scr…
PyPi：https://pypi.python.org/pypi/…
使用说明：https://github.com/scrapy/scr…

2. Pip安装

推荐使用 Pip 安装，命令如下：

pip3 install scrapyd-client

3. 验证安装

安装成功后会有一个可用命令，叫做 scrapyd-deploy，即部署命令。
我们可以输入如下测试命令测试 ScrapydClient 是否安装成功：

scrapyd-deploy -h

如果出现如图 1-87 类似输出则证明 ScrapydClient 已经成功安装:

图 1-87 运行结果
在后文我们会详细了解它的用法。

ScrapydAPI的安装

安装好了 Scrapyd 之后，我们可以直接请求它提供的 API 即可获取当前主机的 Scrapy 任务运行状况。

如某台主机的 IP 为 192.168.1.1，则可以直接运行如下命令获取当前主机的所有 Scrapy 项目：

curl http://localhost:6800/listprojects.json

运行结果：

{"status": "ok", "projects": ["myproject", "otherproject"]}

返回结果是 Json 字符串，通过解析这个字符串我们便可以得到当前主机所有项目。

但是用这种方式来获取任务状态还是有点繁琐，所以 ScrapydAPI 就为它做了一层封装，下面我们来看下它的安装方式。

1. 相关链接

GitHub：https://pypi.python.org/pypi/…
PyPi：https://pypi.python.org/pypi/…
官方文档：http://python-scrapyd-api.rea…

2. Pip安装

推荐使用 Pip 安装，命令如下：

pip install python-scrapyd-api

3. 验证安装

安装完成之后便可以使用 Python 来获取主机状态了，所以如上的操作便可以用 Python 代码实现：

from scrapyd_api import ScrapydAPI
scrapyd = ScrapydAPI('http://localhost:6800')
print(scrapyd.list_projects())

运行结果：

["myproject", "otherproject"]

这样我们便可以用 Python 直接来获取各个主机上 Scrapy 任务的运行状态了。

Python3网络爬虫实战13部署相关库ScrapydClientScrapydAPI

ScrapydClient的安装

1. 相关链接

2. Pip安装

3. 验证安装

ScrapydAPI的安装

1. 相关链接

2. Pip安装

3. 验证安装

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

Python3网络爬虫实战13部署相关库ScrapydClientScrapydAPI

ScrapydClient的安装

1. 相关链接

2. Pip安装

3. 验证安装

ScrapydAPI的安装

1. 相关链接

2. Pip安装

3. 验证安装

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复