关于node.js:Java实现汉字转拼音多音字处理

56次阅读

共计 1039 个字符,预计需要花费 3 分钟才能阅读完成。

背景:
之前始终是前端间接调用公司公共城市组件获取城市列表,当初因为公共组件不再反对,须要由后端接口提供城市查问,并且依照城市首字母分组展现。
后端实现:
最开始抉择 pinyin4j 来实现,但发现对多音字的解决不太敌对,比方须要转重庆的拼音(能够看到后果并不是咱们想要的):

解决办法就须要本人定义多音字字典来实现,解析这个文件优先从这个文件中获取拼音,相似如下文件(字典格局可自行定义):

以上本人定义字典的形式比拟麻烦,通过在网上的一顿搜寻,发现能够应用具备语义的依赖包(底层也是用的自定义字典实现):
<dependency>

<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.8.3</version>

</dependency>
复制代码
在我的项目中定义一个工具类:
public class PinyinUtil {

/**
 * 获取中文完整拼音
 *
 * @param chineseStr
 * @return
 */
public static String getPinyin(String chineseStr) {List<Pinyin> pinyins = PinyinDictionary.convertToPinyin(chineseStr);
    StringBuilder stringBuilder = new StringBuilder();
    for (Pinyin pinyin : pinyins) {stringBuilder.append(pinyin.getPinyinWithoutTone());
    }
    return stringBuilder.toString();}


/**
 * 获取中文拼音首字母
 *
 * @param chineseStr
 * @return
 */
public static String getInitial(String chineseStr) {List<Pinyin> pinyins = PinyinDictionary.convertToPinyin(chineseStr);
    if (CollectionUtils.isEmpty(pinyins)) {return StringUtils.EMPTY;}
    return String.valueOf(pinyins.get(0).getPinyinWithoutTone().charAt(0));
}

}
复制代码
后果演示:

更多办法应用:

好了,到此结束。简略间接,没有一个字是多余的。

正文完
 0