【百度语音识别】JavaAPI方式语音识别示例MP3转PCM


声明:本文转载自https://my.oschina.net/xshuai/blog/1585505,转载目的在于传递更多信息,仅供学习交流之用。如有侵权行为,请联系我,我会及时删除。

【百度语音识别】JavaAPI方式语音识别示例MP3转PCM

  • Java-API合成语音示例:http://ai.baidu.com/forum/topic/show/496727
  • REST-API文档地址:http://ai.baidu.com/docs#/TTS-API/top
  • 注意:需要下载MP3插件jar。才可以进行MP3CONVERTPCM 链接: https://pan.baidu.com/s/1i5pJxpb 密码: 8w4x
  • 遇到的坑:HTTPUtil工具类中。不需要拼接access_token参数。大家注意一下。ContentType也改一下。

----------------------------------开始代码示例----------------------------------

  • MP3转PCM的方法 需要下载注意的jar才可以正确转换哦

第一步就是语音合成的MP3文件转换PCM格式文件

package com.xs.audio.tns;  import java.io.File; import java.io.FileOutputStream; import java.io.OutputStream;  import javax.sound.sampled.AudioFormat; import javax.sound.sampled.AudioInputStream; import javax.sound.sampled.AudioSystem; /**  * MP3转PCM Java方式实现  * @author 小帅丶  * @date 2017年12月6日  */ public class MP3ConvertPCM { 	/** 	 * MP3转换PCM文件方法 	 * @param mp3filepath 原始文件路径 	 * @param pcmfilepath 转换文件的保存路径 	 * @throws Exception  	 */ 	public static void mp3Convertpcm(String mp3filepath,String pcmfilepath) throws Exception{ 		File mp3 = new File(mp3filepath); 		File pcm = new File(pcmfilepath); 		//原MP3文件转AudioInputStream 		AudioInputStream mp3audioStream = AudioSystem.getAudioInputStream(mp3); 		//将AudioInputStream MP3文件 转换为PCM AudioInputStream 		AudioInputStream pcmaudioStream = AudioSystem.getAudioInputStream(AudioFormat.Encoding.PCM_SIGNED, mp3audioStream); 		//准备转换的流输出到OutputStream 		OutputStream os = new FileOutputStream(pcm); 		int bytesRead = 0; 		byte[] buffer = new byte[8192]; 		while ((bytesRead=pcmaudioStream.read(buffer, 0, 8192))!=-1) { 			os.write(buffer, 0, bytesRead); 		} 		os.close(); 		pcmaudioStream.close(); 	} }
  • HttpUtil工具类新增加一个postASR的方法

/**      * 获取语音识别内容      * @param requestUrl      * @param params      * @return      * @throws Exception      */     public static String postASR(String requestUrl, String params) throws Exception {     	System.out.println(params);     	String generalUrl = requestUrl;//这里不需要对接口地址拼接access_token参数 切记!!!         System.out.println("发送的连接为:"+generalUrl);         URL url = new URL(generalUrl);         // 打开和URL之间的连接         HttpURLConnection connection = (HttpURLConnection) url.openConnection();     	System.out.println("打开链接,开始发送请求"+new Date().getTime()/1000);         connection.setRequestMethod("POST");         // 设置通用的请求属性         connection.setRequestProperty("Content-Type", "application/json");         connection.setRequestProperty("Connection", "Keep-Alive");         connection.setUseCaches(false);         connection.setDoOutput(true);         connection.setDoInput(true);         // 得到请求的输出流对象         DataOutputStream out = new DataOutputStream(connection.getOutputStream());         out.writeBytes(params);         out.flush();         out.close();         // 建立实际的连接         connection.connect();         // 获取所有响应头字段         Map<String, List<String>> headers = connection.getHeaderFields();         // 遍历所有的响应头字段         for (String key : headers.keySet()) {             System.out.println(key + "--->" + headers.get(key));         }         // 定义 BufferedReader输入流来读取URL的响应         BufferedReader in = null;         if (requestUrl.contains("nlp"))             in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "GBK"));         else             in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8"));         String result = "";         String getLine;         while ((getLine = in.readLine()) != null) {             result += getLine;         }         in.close();         System.out.println("请求结束"+new Date().getTime()/1000);         System.out.println("result:" + result);         return result;     }
  • 下面就是语音识别的示例代码哦

package com.xs.audio.tns;  import java.io.File; import java.util.HashMap;  import com.xs.util.baidu.Base64Util; import com.xs.util.baidu.FileUtil; import com.xs.util.baidu.HttpUtil; import com.xs.util.baidu.RandomStringGenerator; /**  * 语音识别Java-API JSON上传方式示例代码  * @author 小帅丶  *  */ public class Audio2Text { 	//接口地址 	private static final String AUDIO2TEXT_URL = "http://vop.baidu.com/server_api"; 	public static void main(String[] args) throws Exception { 		//合成的MP3语音文件 		String path = "C:/Users/Administrator/text2audio/VOICE1512521962.mp3"; 		//MP3转pcm要保存的路径和文件名 		String path2 = "C:/Users/Administrator/text2audio/VOICE1512521962.pcm"; 		MP3ConvertPCM.mp3Convertpcm(path, path2); 		// 对语音二进制数据进行识别    	    byte[] data = FileUtil.readFileByBytes(path2);    //readFileByBytes仅为获取二进制数据示例 	    String speech = Base64Util.encode(data); 	    File file = new File(path2); 	    long len = file.length(); 	    String result = Audio2text("pcm", 16000,RandomStringGenerator.getRandomStringByLength(60),"自己获取的AccessToken", speech, len); 	    System.out.println(result); 	} 	/** 	 * JSON方式上传 	 * @param format	必填	语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件 	 * @param rate	必填	采样率, 8000 或者 16000, 推荐 16000 采用率 	 * @param channel	必填	声道数,仅支持单声道,请填写固定值 1 	 * @param cuid	必填	用户唯一标识,用来区分用户,计算UV值。建议填写能区分用户的机器 MAC 地址或 IMEI 码,长度为60字符以内。 	 * @param token	必填	开放平台获取到的access_token, 见上面的“鉴权认证机制”段落 	 * @param lan	选填	语种选择,默认中文(zh)。 中文=zh、粤语=ct、英文=en,不区分大小写 	 * @param url	选填	可下载的语音下载地址,与callback连一起使用,确保百度服务器可以访问。 	 * @param callback	选填	用户服务器的识别结果回调地址,确保百度服务器可以访问 	 * @param speech	选填	本地语音文件的的二进制语音数据 ,需要进行base64 编码。与len参数连一起使用。 	 * @param len	选填	本地语音文件的的字节数,单位字节 	*/ 	public static String Audio2text(String format,Integer rate,String cuid,String token,String speech,long len) throws Exception{ 		HashMap<String, Object> paramMap = new HashMap<String, Object>(); 		paramMap.put("speech",speech); 		paramMap.put("format", format); 		paramMap.put("rate", rate); 		paramMap.put("channel",1); 		paramMap.put("cuid",cuid); 		paramMap.put("token", token); 		paramMap.put("len", len); 		net.sf.json.JSONObject params = net.sf.json.JSONObject.fromObject(paramMap); 		String data = HttpUtil.postASR(AUDIO2TEXT_URL,params.toString()); 		System.out.println("语音文件识别的内容:"+data); 		return data; 	} }

看看返回的内容

{     "corpus_no": "6496262443167631439",      "err_msg": "success.",      "err_no": 0,      "result": [         "开发者小帅你好,"     ],      "sn": "74778487111512528965" }

以上就是语音识别Java-API调用示例代码哦。难点是MP3转PCM会卡壳开发者们。

本文发表于2017年12月06日 12:33
(c)注:本文转载自https://my.oschina.net/xshuai/blog/1585505,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权行为,请联系我们,我们会及时删除.

阅读 2385 讨论 0 喜欢 0

抢先体验

扫码体验
趣味小程序
文字表情生成器

闪念胶囊

你要过得好哇,这样我才能恨你啊,你要是过得不好,我都不知道该恨你还是拥抱你啊。

直抵黄龙府,与诸君痛饮尔。

那时陪伴我的人啊,你们如今在何方。

不出意外的话,我们再也不会见了,祝你前程似锦。

这世界真好,吃野东西也要留出这条命来看看

快捷链接
网站地图
提交友链
Copyright © 2016 - 2021 Cion.
All Rights Reserved.
京ICP备2021004668号-1