乐趣区

关于github:开源项目在线化-中文繁简体转换敏感词拼音分词汉字相似度markdown-目录

前言

以前在 github 上本人开源了一些我的项目。碍于技术与精力,大部分我的项目都是 java 实现的。

这对于非 java 开发者而言很不敌对,对于不会编程的用户更加不敌对。

为了让更多的人能够应用到这些简略的小工具,周末抽时间将几个开源我的项目增加了 web 服务实现。

开源我的项目

中文繁简体转换

简介:反对中文繁简体的在线转换。

在线地址:https://houbb.github.io/opensource/opencc4j/

开源地址:https://github.com/houbb/opencc4j

用法简介

此处仅抉择一个作为例子介绍,其余用法大同小异。

【解决】将右边的内容,依照下拉框的抉择,后果会主动填充在左边。

【调换】调换左右两边的内容。平时测试繁体 =》简体,和简体 =》繁体更加不便。

【复制】复制左边的内容到粘贴板。

敏感词

简介:基于 DFA 算法实现的高性能 java 敏感词工具框架。请勿公布波及政治、广告、营销、翻墙、违反国家法律法规等内容。

在线地址:https://houbb.github.io/opensource/sensitive-word/

开源地址:https://github.com/houbb/sensitive-word

拼音

简介:高性能中文转拼音工具。反对同音字。

在线地址:https://houbb.github.io/opensource/pinyin/

开源地址:https://github.com/houbb/pinyin

能够很不便的把一段文字转换为对应的拼音,比方前言的内容默认如下:

yǐ qián zài github shàng zì jǐ kāi yuán le yī xiē xiàng mù。ài yú jì shù yǔ jīng lì,dà bù fèn xiàng mù dōu shì java shí xiàn de。zhè duì yú fēi java kāi fā zhě ér yán hěn bù yǒu hǎo,duì yú bú huì biān chéng de yòng hù gèng jiā bù yǒu hǎo。wèi le ràng gèng duō de rén kě yǐ shǐ yòng dào zhè xiē jiǎn dān de xiǎo gōng jù,zhōu mò chōu shí jiān jiāng jǐ gè kāi yuán xiàng mù tiān jiā le web fú wù shí xiàn。

分词

简介:基于结巴分词词库实现的更加灵便优雅易用,高性能的 java 分词实现。

在线地址:https://houbb.github.io/opensource/segment/

开源地址:https://github.com/houbb/segment

分词,能够说是 NLP 的基石。

前言的内容分词成果如下:

[以前 [0,2), 在 [2,3),  [3,4), github[4,10),  [10,11), 上自 [11,13), 己 [13,14), 开源 [14,16), 了 [16,17), 一些 [17,19), 我的项目 [19,21),。[21,22), 碍于 [22,24), 技术 [24,26), 与 [26,27), 精力 [27,29),,[29,30), 大部分 [30,33), 我的项目 [33,35), 都 [35,36), 是 [36,37),  [37,38), java[38,42),  [42,43), 实现 [43,45), 的 [45,46),。[46,47), [47,48), [48,49), 这 [49,50), 对于 [50,52), 非 [52,53),  [53,54), java[54,58),  [58,59), 开发者 [59,62), 而言 [62,64), 很 [64,65), 不 [65,66), 敌对 [66,68),,[68,69), 对于 [69,71), 不会 [71,73), 编程 [73,75), 的 [75,76), 用户 [76,78), 更加 [78,80), 不 [80,81), 敌对 [81,83),。[83,84), [84,85), [85,86), 为了 [86,88), 让 [88,89), 更多 [89,91), 的 [91,92), 人 [92,93), 能够 [93,95), 应用 [95,97), 到 [97,98), 这些 [98,100), 简略 [100,102), 的 [102,103), 小工 [103,105), 具 [105,106),,[106,107), 周末 [107,109), 抽时间 [109,112), 将 [112,113), 几个 [113,115), 开源 [115,117), 我的项目 [117,119), 增加 [119,121), 了 [121,122),  [122,123), web[123,126),  [126,127), 服务 [127,129), 实现 [129,131),。[131,132)]

汉字类似度

简介:汉字类似度计算工具。中文形近字算法

在线地址:https://houbb.github.io/opensource/nlp-hanzi-similar/

开源地址:https://github.com/houbb/nlp-hanzi-similar

markdown 目录

简介:为 markdown 文件生成 toc 目录

在线地址:https://houbb.github.io/opensource/markdown-toc/

开源地址:https://github.com/houbb/markdown-toc

集体平时的博客都是应用 markdown 编写的,专一于写作。markdown-toc 能够为这样的文本生成对应的 toc。

比方本篇文章,间接放在 github 上,是反对跳转的。

* [前言](# 前言)
* [开源我的项目](# 开源我的项目)
  * [中文繁简体转换](# 中文繁简体转换)
    * [用法简介](# 用法简介)
  * [敏感词](# 敏感词)
  * [拼音](# 拼音)
  * [分词](# 分词)
  * [汉字类似度](# 汉字类似度)
  * [markdown 目录](#markdown- 目录)

小结

这样的小工具,实现起来非常简单。

然而对于用户而言,意义还是比拟大的。

最近在学习一些 AI 相干的货色,本人平时不搞 python,很多开源我的项目,没有 web 体验版本看起来就会很吃力。

不同的语言产生了难以逾越的鸿沟,愿你我可能借助 WEB 的力量,跨过来

原文地址

开源我的项目在线化

退出移动版