前嗅ForeSpider脚本教程:标准对象(一)

今天,小编主要为大家介绍一下:前嗅ForeSpider脚本中的标准对象:爬虫链接类url,urltext采集的所有状态及属性类,html标签节点类domItem和(html)dom类dom。具体内容如下:
一.爬虫链接类url
url 类为ForeSpider采集链接地址类,描述了一个链接地址及如何采集的相关属性和操作。常用的属性是:urlname, title, entryid, tmplid这四个属性。
1.类成员:

2.成员方法:

二.urltext采集的所有状态及属性类
urltext 描述当前链接采集的所有状态及属性。1.类成员:

2.成员方法:无
三.html标签节点类domItem
domItem 类为html的dom文档树标签节点类,通过该类访问和操作dom的标签节点。
1.类成员:

2.成员方法:无
四.(html)dom类dom
dom 类为html的dom文档操作类,该类定义了html文档的所有操作方法和属性。
1.类成员:无
2.成员方法:

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理