关于android:机器学习服务助应用内文本语种在线和离线检测

33次阅读

共计 3276 个字符,预计需要花费 9 分钟才能阅读完成。

当用户有跨语种交换或内容翻译的需要时,利用须要能自动检测文本的语种再进行翻译。

HMS Core 机器学习服务的语种检测服务提供在线语种检测和离线语种检测,既反对检测单语种文本,也反对检测混合语种文本,涵盖南非荷兰语、阿拉伯语等百种语言。接入语种检测服务,App 能够轻松实现翻译语种检测、网页语种检测,混合语种场景中语种检测等,帮忙 App 晋升用户体验。

语种检测流程

输出文本,机器学习服务语种对该文本主动进行语种进行检测,而后返回对应语种编码和相应的置信度,或者返回一个置信度最高的语种编码给开发者的利用。最终在开发 app 页面呈现出翻译出的文本。

成果演示

1. 开发筹备

在进行开发前须要配置 HMS Core SDK 的 Maven 仓地址

repositories {
    maven {url'https://cmc.centralrepo.rnd.huawei.com/artifactory/product_maven/'}
}

集成在线语种检测服务 SDK,示例代码如下

dependencies{implementation 'com.huawei.hms:ml-computer-language-detection:3.4.0.301'}

2. 编辑工程集成

2.1 设置利用的鉴权信息

 能够通过 api_key 或者 Access Token 来设置利用鉴权信息。通过 setAccessToken 办法设置 Access Token,在利用启动时初始化设置一次即可,无需屡次设置。MLApplication.getInstance().setAccessToken("your access token");

通过 setApiKey 办法设置 api_key,在利用启动时初始化设置一次即可,无需屡次设置。MLApplication.getInstance().setApiKey("your ApiKey");

2.2 创立语种检测器

// 形式一:应用默认的参数配置创立语种检测器。MLRemoteLangDetector mlRemoteLangDetector = MLLangDetectorFactory.getInstance()
    .getRemoteLangDetector();
// 形式二:应用自定义的参数配置创立语种检测器。MLRemoteLangDetectorSetting setting = new MLRemoteLangDetectorSetting.Factory()
    // 设置语种检测的最低置信度阈值。.setTrustedThreshold(0.01f)
    .create();
MLRemoteLangDetector mlRemoteLangDetector = MLLangDetectorFactory.getInstance()
    .getRemoteLangDetector(setting);

2.3 进行语种检测

异步办法示例代码

// 形式一:返回多个语种检测后果,包含语种编码以及置信度,sourceText 示意待检测的文本,长度需小于 5000 个字符。Task<List<MLDetectedLang>> probabilityDetectTask = mlRemoteLangDetector.probabilityDetect(sourceText);
probabilityDetectTask.addOnSuccessListener(new OnSuccessListener<List<MLDetectedLang>>() {
    @Override
    public void onSuccess(List<MLDetectedLang> result) {// 胜利的解决逻辑。}
}).addOnFailureListener(new OnFailureListener() {
    @Override
    public void onFailure(Exception e) {
        // 失败的解决逻辑。// Recognition failure.
        try {MLException mlException = (MLException)e;
            // 获取错误码,开发者能够对错误码进行解决,依据错误码进行差异化的页面提醒。int errorCode = mlException.getErrCode();
            // 获取报错信息,开发者能够联合错误码,疾速定位问题。String errorMessage = mlException.getMessage();} catch (Exception error) {// 转换错误处理。}
    }
});
// 形式二:返回置信度最高的语种编码,sourceText 示意待检测的文本,长度需小于 5000 个字符。Task<String> firstBestDetectTask = mlRemoteLangDetector.firstBestDetect(sourceText);
firstBestDetectTask.addOnSuccessListener(new OnSuccessListener<String>() {
    @Override
    public void onSuccess(String s) {// 胜利的解决逻辑。}
}).addOnFailureListener(new OnFailureListener() {
    @Override
    public void onFailure(Exception e) {
        // 失败的解决逻辑。// Recognition failure.
        try {MLException mlException = (MLException)e;
            // 获取错误码,开发者能够对错误码进行解决,依据错误码进行差异化的页面提醒。int errorCode = mlException.getErrCode();
            // 获取报错信息,开发者能够联合错误码,疾速定位问题。String errorMessage = mlException.getMessage();} catch (Exception error) {// 转换错误处理。}
    }
});

同步办法示例代码

// 形式一:返回多个语种检测后果,包含语种编码以及置信度,sourceText 示意待检测的文本,长度需小于 5000 个字符。try {List<MLDetectedLang> result= mlRemoteLangDetector.syncProbabilityDetect(sourceText);
} catch (MLException mlException) {
    // 失败的解决逻辑。// 获取错误码,开发者能够对错误码进行解决,依据错误码进行差异化的页面提醒。int errorCode = mlException.getErrCode();
    // 获取报错信息,开发者能够联合错误码,疾速定位问题。String errorMessage = mlException.getMessage();}
// 形式二:返回置信度最高的语种编码,sourceText 示意待检测的文本,长度需小于 5000 个字符。try {String language = mlRemoteLangDetector.syncFirstBestDetect(sourceText);
} catch (MLException mlException) {
    // 失败的解决逻辑。// 获取错误码,开发者能够对错误码进行解决,依据错误码进行差异化的页面提醒。int errorCode = mlException.getErrCode();
    // 获取报错信息,开发者能够联合错误码,疾速定位问题。String errorMessage = mlException.getMessage();}

2.4 检测实现后,开释资源。

if (mlRemoteLangDetector != null) {mlRemoteLangDetector.stop();
}

语种检测性能蕴含端侧和云侧,以上示例仅为云侧性能。

理解更多详情 >>

拜访华为开发者联盟官网
获取开发领导文档
华为挪动服务开源仓库地址:GitHub、Gitee

关注咱们,第一工夫理解 HMS Core 最新技术资讯~

正文完
 0