Palladian 扩大 中有什么节点值得应用呢?
<!–truncate–>
Palladian 是一个基于 Java 的工具包,它有一些 Internet 信息检索的节点。还有一些用于文本处理的节点。
他的付费形式比拟特地: 如果您应用的是 KNIME AP 版本, 那么这个扩大就是收费的,如果你应用的是 KNIME Server/Hub 那么就是须要付费许可的
装置
这个扩大原来是存在于 KNIME community extension 中, 起初因为蕴含了一些付费内容,所以放在 NodePit 上。 它的装置办法比较简单,和一般的 KNIME 官网扩大相比,须要一些额定的步骤。
- 在 KNIME 的选项中, File → Preferences → Install/Update → Available Software Sites ,单击 Add… 并粘贴更新站点。确保更新站点与您以后的 KNIME 版本匹配,例如 https://download.nodepit.com/4.7 对应于 KNIME 4.7 版本, 如果您 KNIME 是其余版本的,须要做相应的调整
- 依照失常的搜寻装置 KNIME 扩大流程就能够下载安装了
节点简略介绍
这个扩大的节点次要分为:
- Classification 分类
- Extraction 提取
- Geo 天文
- Images 图片
- Scoring 评分
- Testing 测试
- Web 网络
几个局部。基本上通过这些分类就晓得外面有些什么性能节点了。
其中我用的比拟多的是 Web 局部,尤其是 HTTP Retriever 相干节点。尽管 KNIME 也有 GET, POST 等节点,但在某些状况下,Palladian 的这些网络相干节点会更好用。比方,你获取了一篇页面,只想得到页面中的局部文字局部,那么你就能够应用 HTTP Retriever、HTML Node to Text、HTML Parser 等节点,最终以 XML 的模式进行解决。
另外有的敌人比拟喜爱 Extraction 提取类别中的 Regex Extractor 正则表达式提取器, 对于正则表达式的应用确实更直观一点。
再其余的,我就没有那么太日常应用了。
欢送关注公众号:数据分析指北
本文由mdnice多平台公布
发表回复