关于github:开源项目在线化-中文繁简体转换敏感词拼音分词汉字相似度markdown-目录

前言

以前在 github 上本人开源了一些我的项目。碍于技术与精力，大部分我的项目都是 java 实现的。

这对于非 java 开发者而言很不敌对，对于不会编程的用户更加不敌对。

为了让更多的人能够应用到这些简略的小工具，周末抽时间将几个开源我的项目增加了 web 服务实现。

开源我的项目

中文繁简体转换

简介：反对中文繁简体的在线转换。

在线地址：https://houbb.github.io/opensource/opencc4j/

开源地址：https://github.com/houbb/opencc4j

用法简介

此处仅抉择一个作为例子介绍，其余用法大同小异。

【解决】将右边的内容，依照下拉框的抉择，后果会主动填充在左边。

【调换】调换左右两边的内容。平时测试繁体=》简体，和简体=》繁体更加不便。

【复制】复制左边的内容到粘贴板。

敏感词

简介：基于 DFA 算法实现的高性能 java 敏感词工具框架。请勿公布波及政治、广告、营销、翻墙、违反国家法律法规等内容。

在线地址：https://houbb.github.io/opensource/sensitive-word/

开源地址：https://github.com/houbb/sensitive-word

拼音

简介：高性能中文转拼音工具。反对同音字。

在线地址：https://houbb.github.io/opensource/pinyin/

开源地址：https://github.com/houbb/pinyin

能够很不便的把一段文字转换为对应的拼音，比方前言的内容默认如下：

yǐ qián zài github shàng zì jǐ kāi yuán le yī xiē xiàng mù 。 ài yú jì shù yǔ jīng lì ， dà bù fèn xiàng mù dōu shì java shí xiàn de 。 zhè duì yú fēi java kāi fā zhě ér yán hěn bù yǒu hǎo ， duì yú bú huì biān chéng de yòng hù gèng jiā bù yǒu hǎo 。 wèi le ràng gèng duō de rén kě yǐ shǐ yòng dào zhè xiē jiǎn dān de xiǎo gōng jù ， zhōu mò chōu shí jiān jiāng jǐ gè kāi yuán xiàng mù tiān jiā le web fú wù shí xiàn 。

分词

简介：基于结巴分词词库实现的更加灵便优雅易用，高性能的 java 分词实现。

在线地址：https://houbb.github.io/opensource/segment/

开源地址：https://github.com/houbb/segment

分词，能够说是 NLP 的基石。

前言的内容分词成果如下：

[以前[0,2), 在[2,3),  [3,4), github[4,10),  [10,11), 上自[11,13), 己[13,14), 开源[14,16), 了[16,17), 一些[17,19), 我的项目[19,21), 。[21,22), 碍于[22,24), 技术[24,26), 与[26,27), 精力[27,29), ，[29,30), 大部分[30,33), 我的项目[33,35), 都[35,36), 是[36,37),  [37,38), java[38,42),  [42,43), 实现[43,45), 的[45,46), 。[46,47), [47,48), [48,49), 这[49,50), 对于[50,52), 非[52,53),  [53,54), java[54,58),  [58,59), 开发者[59,62), 而言[62,64), 很[64,65), 不[65,66), 敌对[66,68), ，[68,69), 对于[69,71), 不会[71,73), 编程[73,75), 的[75,76), 用户[76,78), 更加[78,80), 不[80,81), 敌对[81,83), 。[83,84), [84,85), [85,86), 为了[86,88), 让[88,89), 更多[89,91), 的[91,92), 人[92,93), 能够[93,95), 应用[95,97), 到[97,98), 这些[98,100), 简略[100,102), 的[102,103), 小工[103,105), 具[105,106), ，[106,107), 周末[107,109), 抽时间[109,112), 将[112,113), 几个[113,115), 开源[115,117), 我的项目[117,119), 增加[119,121), 了[121,122),  [122,123), web[123,126),  [126,127), 服务[127,129), 实现[129,131), 。[131,132)]

汉字类似度

简介：汉字类似度计算工具。中文形近字算法

在线地址：https://houbb.github.io/opensource/nlp-hanzi-similar/

开源地址：https://github.com/houbb/nlp-hanzi-similar

markdown 目录

简介：为 markdown 文件生成 toc 目录

在线地址：https://houbb.github.io/opensource/markdown-toc/

开源地址：https://github.com/houbb/markdown-toc

集体平时的博客都是应用 markdown 编写的，专一于写作。markdown-toc 能够为这样的文本生成对应的 toc。

比方本篇文章，间接放在 github 上，是反对跳转的。

* [前言](#前言)
* [开源我的项目](#开源我的项目)
  * [中文繁简体转换](#中文繁简体转换)
    * [用法简介](#用法简介)
  * [敏感词](#敏感词)
  * [拼音](#拼音)
  * [分词](#分词)
  * [汉字类似度](#汉字类似度)
  * [markdown 目录](#markdown-目录)

小结

这样的小工具，实现起来非常简单。

然而对于用户而言，意义还是比拟大的。

最近在学习一些 AI 相干的货色，本人平时不搞 python，很多开源我的项目，没有 web 体验版本看起来就会很吃力。

不同的语言产生了难以逾越的鸿沟，愿你我可能借助 WEB 的力量，跨过来。

原文地址

开源我的项目在线化

关于github:开源项目在线化-中文繁简体转换敏感词拼音分词汉字相似度markdown-目录

前言

开源我的项目

中文繁简体转换

用法简介

敏感词

拼音

分词

汉字类似度

markdown 目录

小结

原文地址

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于github:开源项目在线化-中文繁简体转换敏感词拼音分词汉字相似度markdown-目录

前言

开源我的项目

中文繁简体转换

用法简介

敏感词

拼音

分词

汉字类似度

markdown 目录

小结

原文地址

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复