今天,小编主要为大家介绍一下:前嗅 ForeSpider 脚本中的标准对象:爬虫链接类 url,urltext 采集的所有状态及属性类,html 标签节点类 domItem 和(html)dom 类 dom。具体内容如下:
一. 爬虫链接类 url
url 类为 ForeSpider 采集链接地址类,描述了一个链接地址及如何采集的相关属性和操作。常用的属性是:urlname, title, entryid, tmplid 这四个属性。
1. 类成员:
2. 成员方法:
二.urltext 采集的所有状态及属性类
urltext 描述当前链接采集的所有状态及属性。1. 类成员:
2. 成员方法:无
三.html 标签节点类 domItem
domItem 类为 html 的 dom 文档树标签节点类,通过该类访问和操作 dom 的标签节点。
1. 类成员:
2. 成员方法: 无
四.(html)dom 类 dom
dom 类为 html 的 dom 文档操作类,该类定义了 html 文档的所有操作方法和属性。
1. 类成员:无
2. 成员方法: