问题背景
浏览器的收藏夹性能不错,然而感觉相似 hao123 这样的导航网站也挺好,更直观。然而发现其并不能自定义,或者说不能很好的自定义。
所以想实现一个简略本地化页面,上面的例子如此,最开始思考能不能在线保护,思考到没有后盾服务,所以放弃,当初只能在电脑端保护 json 文件。有思考过谷歌浏览器插件,后放弃。
网页成果
局部代码特点
对于某些导航网站爬取合乎规定的数据
爬取的 url 是 https://www.lervor.com/nav/# 这个导航网站
(次要是用的 js 正则表达式匹配字符去获取想要的链接和文字)
上面的 js 复制到浏览器 console 控制台,能够返回后果。
var title=""; // 题目
var title_detail="";// 具体题目
var img_src="";// 图片地址
var src="";// 网页地址
var jsonX='';
for(i=0;i<=document.getElementsByClassName("col-sm-3").length;i++){//console.log(document.getElementsByClassName("col-sm-3")[i]); // 输入该页面的所有链接。if(document.getElementsByClassName("col-sm-3")[i]){var h=document.getElementsByClassName("col-sm-3")[i].getElementsByClassName("xe-widget xe-conversations box2 label-info")[0].outerHTML;
title=/(?<=strong>).*?(?=<)/.exec(h)[0];
title_detail=/(?<=overflowClip_2">).*?(?=<)/.exec(h)[0];
//img_src=document.getElementsByClassName("col-sm-3")[i].getElementsByTagName("img")[0].src;
//img_src=/(?<=files\/).*?(?=")/.exec(h)[0];
img_src=/(?<=src=").*?(?=")/.exec(h)[0];
src=/(?<=data-original-title=").*?(?=")/.exec(h)[0];
t='{sName:\''+title+'\',sUrl:\''+src+'\',sImg:\''+img_src+'\',sInfo:\''+title_detail+'\'},\n';
console.log(">"+t);
jsonX=jsonX+t;
}
}
console.log(">>>>>>>>>>.."+jsonX);
源码
https://gitee.com/skylfx/cust…