基于nodejs的自然语言处理插件nlp.js

338次阅读

共计 744 个字符,预计需要花费 2 分钟才能阅读完成。

最近搭建了一个基于想搭建一个基于 node.js 的爬虫项目,主要用来对内容进行情感分析和内容标签归类。
大概的思路是这样的,一般的话获取资讯内容都好说。

那么什么是自然语言处理?

自然语言处理(NLP)是指机器理解并解释人类 paralyzes 写作、说话方式的能力。NLP 的目标是让计算机/机器在理解语言上像人类一样智能。最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。

获取到内容以后,接下来要做的事情就是对内容 进行分析:
1. 对内容进行情感分析
2. 对内容进行标签,关键词归类
这里就要推荐下基于 node.js 的插件

1. 来源基于 node.js 的插件 nlp.js,https://www.npmjs.com/package…

nlp.js 是一个基于 Node.js 的 NLP 自然语言处理库,具有情感分析、自动语言识别等功能。

2. 使用阿里云的 情感分析处理 ,万网首页可见。功能如下, 快速连接

NLP 自学习平台

支持文本实体抽取、文本分类等 NLP 定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台快速创建算法模型并使用。

商品评价解析

基于电商行业的大量语料研发,对消费者历史评价和新增评价的商品维度属性自动解析,将文本转化为结构化属性字段,高效甄别正负面评价,同时根据情感强烈程度进行 - 1 分~1 分的打分,可统计可分析,大幅度节省客服人工。

多语言分词

将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列,同时保持对数据、模型的不断迭代更新,目前支持简体中文、英文及泰文。

命名实体

命名实体服务可以帮助您快速识别文本中的实体,进而挖掘各实体间的关系,目前主要针对电商领域,识别品牌、产品、型号等,同时也包括一些通用领域实体如人名、地名、机构名、时间日期等。

正文完
 0