本文介绍如何通过工作流 ASW 编排语音辨认 AI 服务,将一段离线录音文件进行文字辨认后,将输入的识别字段进行关键字提取。

工作原理

  1. 异步调用语音辨认 (ASR) 能力进行离线语音文字辨认,并采纳轮询 check 形式期待语音辨认工作执行完结。
  2. 将语音辨认的后果传递给关键字提取工作,输入语音中的关键字。

前提条件

  1. 开明 腾讯云语音辨认(ASR)服务。
  2. 开明 腾讯云自然语言解决(NLP)服务。
  3. 操作账号领有【创立角色】和【绑定策略到角色】的权限,或在账号曾经有了某个角色能够调用 ASR 和 NLP 服务。更多参考 运行角色。

操作步骤

创立状态机

  1. 登录 利用与编排服务流控制台。
  2. 在状态机页面,单击【新建】,进入创立工作流页面中,进行状态机编排。
  3. 在【应用代码创立】>【可视化编辑】页面中,单击【私有云算法】,抉择【录音文件辨认-申请生成】、【录音文件辨认-后果查问】、【自然语言-关键词提取】拖拽至可视化窗口中。

  1. 在右侧的弹框中,别离给节点命名为“语音辨认申请”、“获取语音辨认后果”、“关键字提取”。单击【代码】区域的【刷新】,能够看到【代码】中生成代码如下:
   {     "Comment": "",     "StartAt": "语音辨认申请",     "States": {       "语音辨认申请": {         "Type": "Task",         "Comment": "https://cloud.tencent.com/document/api/271/35498",         "Resource": "qrn:qcs:asw:ap-guangzhou:123456789:sdk:json:qcloud:asr:generalASR",         "Next": "获取语音辨认后果"       },       "获取语音辨认后果": {         "Type": "Task",         "Comment": "https://cloud.tencent.com/document/api/271/35498",         "Resource": "qrn:qcs:asw:ap-guangzhou:1223456789:sdk:json:qcloud:asr:checkASR",         "Next": "关键字提取"       },       "关键字提取": {         "Type": "Task",         "Comment": "https://cloud.tencent.com/document/api/271/35498",         "Resource": "qrn:qcs:asw:ap-guangzhou:123456789:sdk:json:qcloud:nlp:KeywordsExtraction",         "End": true       }     }   }
阐明:Resource 字段格局为qrn:qcs:asw:{服务所在区域}:{Appid}:sdk:json:qcloud:{服务名称}:{组件名称}。更多详情参考 Task 节点。
  1. 因为工作流中的三个 Task 节点调用了不同云产品服务能力,这些能力都是相干 API 的封装,因而须要传递一些必要的参数,依据 API 文档参考:

    • 语音辨认申请
    • 获取语音辨认后果
    • 关键词提取
      最终批改后,残缺的代码如下:
   {     "Comment": "",     "StartAt": "语音辨认申请",     "States": {       "语音辨认申请": {         "Type": "Task",         "Comment": "发送语音辨认申请",         "Resource": "qrn:qcs:asw:ap-guangzhou:123456789:sdk:json:qcloud:asr:generalASR",         "Parameters":{             "EngineModelType":"16k_zh",             "ChannelNum":1,             "ResTextFormat":0,             "SourceType":0,             "Url.$":"$.Url"             },         "OutputPath":"$.Response.Data",         "Next": "获取语音辨认后果"       },       "获取语音辨认后果": {         "Type": "Task",         "Comment": "获取语音辨认后果",         "Resource": "qrn:qcs:asw:ap-guangzhou:123456789:sdk:json:qcloud:asr:checkASR",         "Parameters":{"TaskId.$":"$.TaskId"},         "Next": "关键字提取"       },       "关键字提取": {         "Type": "Task",         "Comment": "关键词提取工作",         "Parameters":{             "Text.$":"$.Response.Data.Result",             "Num":10         },         "End": true,         "Resource": "qrn:qcs:asw:ap-guangzhou:123456789:sdk:json:qcloud:nlp:KeywordsExtraction"       }     }   }
阐明:Task 中定义的 Resource 对应为云服务 API 接口的调用封装,Parameters 为调用时的传参。更多详情参考 状态机语言。
  1. 单击右上角【下一步】,进入保留界面,输出状态机名称,运行角色抉择【应用已有角色】或【新建角色】,类型抉择【疾速】,单击右上角【实现】,在状态机列表页能够看到创立好的状态机。

阐明:应用已有角色须要先创立角色,并给角色受权相干策略,操作详情参考 运行角色。

运行状态机

状态机创立实现后,您能够在登录后的主页面查看创立好的状态机。

  1. 单击须要运行的状态机的【名称】,进入状态机。

  2. 您能够在界面中看到状态机的根本信息。单击【工作流执行】下的【开始执行】

  3. 在弹出的“输出”窗口中,以 JSON 格局输出状态机须要的输出内容。例如:
   {     "Url":"https://chaoshi-123456789cos.ap-guangzhou.myqcloud.com/storage/asr/16k.wav"   }
阐明:Url 中的链接必须公网能够拜访
  1. 单击【确定】,实现状态执行后,能够在详情页查看执行后果:

  2. 滑动至页面最下方,在【执行历史记录】条目下,您能够查看子节点的运行状况。

申请试用 ASW

ASW 目前处于公测阶段,公测阶段收费提供服务。欢送提出产品改良倡议,反馈驳回后即可取得腾讯萌新短鹅公仔!

立刻申请公测,咱们将会在 3 个工作日内实现审批,并通过短信和站内信告诉您,感谢您的反对。

One More Thing

立刻体验腾讯云 Serverless Demo,支付 Serverless 新用户礼包 ???? serverless/start

欢送拜访:Serverless 中文网!