关于javascript:自定义导航收藏网站设计及js抓取页面的文字链接信息

问题背景

浏览器的收藏夹性能不错，然而感觉相似hao123这样的导航网站也挺好，更直观。然而发现其并不能自定义，或者说不能很好的自定义。
所以想实现一个简略本地化页面，上面的例子如此，最开始思考能不能在线保护，思考到没有后盾服务，所以放弃，当初只能在电脑端保护json文件。有思考过谷歌浏览器插件，后放弃。

网页成果

局部代码特点

对于某些导航网站爬取合乎规定的数据

爬取的url 是 https://www.lervor.com/nav/# 这个导航网站
（次要是用的js正则表达式匹配字符去获取想要的链接和文字）
上面的js复制到浏览器console控制台，能够返回后果。

var title=""; //题目
var title_detail="";//具体题目
var img_src="";//图片地址
var src="";//网页地址
var jsonX='';
for(i=0;i<=document.getElementsByClassName("col-sm-3").length;i++){
//console.log(document.getElementsByClassName("col-sm-3")[i]); //输入该页面的所有链接。 
if(document.getElementsByClassName("col-sm-3")[i]){ 
 var h=document.getElementsByClassName("col-sm-3")[i].getElementsByClassName("xe-widget xe-conversations box2 label-info")[0].outerHTML;
    title=/(?<=strong>).*?(?=<)/.exec(h)[0];
    title_detail=/(?<=overflowClip_2">).*?(?=<)/.exec(h)[0];
    //img_src=document.getElementsByClassName("col-sm-3")[i].getElementsByTagName("img")[0].src;
    //img_src=/(?<=files\/).*?(?=")/.exec(h)[0];
    img_src=/(?<=src=").*?(?=")/.exec(h)[0];
    src=/(?<=data-original-title=").*?(?=")/.exec(h)[0];
    t='{sName:\''+title+'\',sUrl:\''+src+'\',sImg:\''+img_src+'\',sInfo:\''+title_detail+'\'},\n';
    console.log(">"+t);
    jsonX=jsonX+t;
  }
}
console.log(">>>>>>>>>>.."+jsonX);

源码

https://gitee.com/skylfx/cust…

关于javascript:自定义导航收藏网站设计及js抓取页面的文字链接信息

问题背景

网页成果

局部代码特点

对于某些导航网站爬取合乎规定的数据

源码

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于javascript:自定义导航收藏网站设计及js抓取页面的文字链接信息

问题背景

网页成果

局部代码特点

对于某些导航网站爬取合乎规定的数据

源码

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复