用 C# 开发自己的语音识别程序

36次阅读

共计 2596 个字符,预计需要花费 7 分钟才能阅读完成。

开发工具:vs 2017
AI 平台:http://ai.baidu.com/
准备工作
1、注册百度账号
2、登录百度 AI 开发平台,http://ai.baidu.com/
3、在控制台点击“百度语音”服务,点击“创建应用”,填写必填项,勾选额外接口,点击立即创建获取秘钥。在应用列表中查看自己的 id

用 360 软件管家安装 vs2017

创建自己的项目
1、新建项目
打开 vs2017,点击文件,新建项目,选择 visual C# –> windows 桌面 –> windows 窗体应用,选择自己的项目地址,点击确定

2、添加 baiduai 开发包
点击引用 –> 管理 nuGet 程序包,搜索 baiduai,点击下载

3、UI 设计
直接拖动即可,生成界面如下

4、后台功能实现
选择文件按钮
private void button1_Click(object sender, EventArgs e)
{
OpenFileDialog fdlg = new OpenFileDialog();
fdlg.Title = “C# Corner Open File Dialog”;
//fdlg.InitialDirectory = @”c:/”; //@是取消转义字符的意思
//fdlg.Filter = “All files(*.*)|*.*|All files(*.*)|*.* “;
///*
// * FilterIndex 属性用于选择了何种文件类型, 缺省设置为 0, 系统取 Filter 属性设置第一项
// * , 相当于 FilterIndex 属性设置为 1. 如果你编了 3 个文件类型,当 FilterIndex =2 时是指第 2 个.
// */
fdlg.FilterIndex = 2;
///*
// * 如果值为 false,那么下一次选择文件的初始目录是上一次你选择的那个目录,
// * 不固定;如果值为 true,每次打开这个对话框初始目录不随你的选择而改变,是固定的
// */
//fdlg.RestoreDirectory = true;
if (fdlg.ShowDialog() == DialogResult.OK)
{
//textBox1.Text = System.IO.Path.GetFileNameWithoutExtension(fdlg.FileName);
filePath.Text = System.IO.Path.GetFullPath(fdlg.FileName);

}
}

开始识别按钮
// 语音合成按钮
private void button2_Click(object sender, EventArgs e)
{
string value = this.videoType.Text;
String filePath = this.filePath.Text;
// 设置 APPID/AK/SK
String APP_ID = “14433392”;
String API_KEY = “C7WMYgLeWv3Wm2yogwv5gD08”;
String SECRET_KEY = “xcvwiwikALBDBaIcGisNQ6aQImtj3qua”;
var client = new Asr(APP_ID, API_KEY, SECRET_KEY);
client.Timeout = 60000; // 修改超时时间
client.Timeout = 120000; // 若语音较长,建议设置更大的超时时间. ms
FileStream fs = new FileStream(filePath, FileMode.Open, FileAccess.Read);
byte[] buffur = new byte[fs.Length];
try
{
fs.Read(buffur, 0, (int)fs.Length);

}
catch (Exception ex)
{
Console.Write(ex.StackTrace);
}
finally
{
if (fs != null)
{
// 关闭资源  
fs.Close();
}
}
var result = client.Recognize(buffur, value, 16000);
Convert.ToString(result);

JToken resultStr = null;
result.TryGetValue(“result”, out resultStr);
Console.WriteLine(“aToken===>”+ resultStr);
voiceResult.Text = Convert.ToString(resultStr);
Console.Write(result);
}

开始合成按钮
调用 api 中 C# SDK 的语音合成 api
https://ai.baidu.com/docs#/AS…
// 开始合成按钮(语音合成功能)
private void synthesisButton_Click(object sender, EventArgs e)
{
String APP_ID = “14433392”;
String API_KEY = “C7WMYgLeWv3Wm2yogwv5gD08”;
String SECRET_KEY = “xcvwiwikALBDBaIcGisNQ6aQImtj3qua”;
// 获取输入框的值
String value = this.Speech_Synthesis.Text;
// 将 value 转成语音文件存放到本地
var client = new Baidu.Aip.Speech.Tts(API_KEY, SECRET_KEY);
// 可选参数
var option = new Dictionary<string, object>()
{
{“spd”, 5}, // 语速
{“vol”, 7}, // 音量
{“per”, 3} // 发音人,4:情感度丫丫童声
};
var result = client.Synthesis(value, option);
try {
if (result.ErrorCode == 0) {// 或 result.Success
File.WriteAllBytes(“E:/prepared/ 北航 /07_工程实践 –AI 方向 / 作业 /WindowsFormsApplication1/WindowsFormsApplication1/tmp.mp3”, result.Data);
}

} catch (Exception ex) {Console.Write(ex.StackTrace); }
Play();
}

关注微信公众号 [prepared],后续会更新一系列有深度的 AI 文章。

正文完
 0