android语音识别之科大讯飞语音API的使用

wuhongyao

2013-10-11

Android系统本身其实提供有语音识别模块，在它的APIDemo里也有关于语音识别的sample，不过经过大多开发者的真机测试，发现很多真机并不能使用哪个sample，在网上查找了一下原因，大部分是因为开发者在刷机的时候，大部分的ROM都阉割掉了语音识别和语音合成TTS(Text To Speech)部分，所以运行sample的时候会有异常抛出。

如果不用google提供的语音识别，要怎么实现语音识别喃？科大讯飞的语音API就可以到，这里是关于它的官网介绍：http://dev.voicecloud.cn/developer.php?vt=1 下面我就用一个简单的实例来介绍一下它基本的使用

首先做一个简单的界面

android语音识别之科大讯飞语音API的使用

上面的TextView显示识别的内容，三个Button分别为语音识别，语音合成并朗读和语音后台朗读三个功能

布局文件：

<?xml version="1.0" encoding="utf-8"?>  
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"  
    android:layout_width="fill_parent"  
    android:layout_height="fill_parent"  
    android:orientation="vertical" >  
  
    <EditText  
        android:id="@+id/et"  
        android:layout_width="fill_parent"  
        android:layout_height="wrap_content" />  
  
    <Button  
        android:id="@+id/bt_recognize"  
        android:layout_width="fill_parent"  
        android:layout_height="wrap_content"  
        android:gravity="center"  
        android:text="Recognize" />  
  
    <Button  
        android:id="@+id/bt_speek"  
        android:layout_width="fill_parent"  
        android:layout_height="wrap_content"  
        android:gravity="center"  
        android:text="Speek" />  
  
    <Button  
        android:id="@+id/bt_speek_bg"  
        android:layout_width="fill_parent"  
        android:layout_height="wrap_content"  
        android:gravity="center"  
        android:text="Speek-Background" />  
  
</LinearLayout>

Activity代码如下：

package sina.CreAmazing.voice;  
  
import java.util.ArrayList;  
  
import com.iflytek.speech.RecognizerResult;  
import com.iflytek.speech.SpeechError;  
import com.iflytek.speech.SynthesizerPlayer;  
import com.iflytek.ui.RecognizerDialog;  
import com.iflytek.ui.RecognizerDialogListener;  
import com.iflytek.ui.SynthesizerDialog;  
import com.iflytek.ui.SynthesizerDialogListener;  
  
import android.app.Activity;  
import android.os.Bundle;  
import android.view.View;  
import android.view.View.OnClickListener;  
import android.widget.Button;  
import android.widget.EditText;  
  
public class Voice1Activity extends Activity {  
    /** Called when the activity is first created. */  
    // 声明控件  
    private EditText et;  
    private Button bt1;  
    private Button bt2;  
    private Button bt3;  
    //全局只设一个String，因为String为final类型，这样做节省内存  
    String text = "";  
    private static final String APPID = "appid=4f2d3a06";  
  
    @Override  
    public void onCreate(Bundle savedInstanceState) {  
        super.onCreate(savedInstanceState);  
        setContentView(R.layout.main);  
        bt1 = (Button) findViewById(R.id.bt_recognize);  
        bt2 = (Button) findViewById(R.id.bt_speek);  
        bt3 = (Button) findViewById(R.id.bt_speek_bg);  
        et = (EditText) findViewById(R.id.et);  
        // 初始化监听器  
        initListener();  
  
    }  
  
    private void initListener() {  
        bt1.setOnClickListener(myListener);  
        bt2.setOnClickListener(myListener);  
        bt3.setOnClickListener(myListener);  
  
    }  
  
    OnClickListener myListener = new OnClickListener() {  
  
        @Override  
        public void onClick(View v) {  
            // 根据不同View的id调用不同方法  
            switch (v.getId()) {  
            case R.id.bt_recognize:  
                // 这是语言识别部分，最重要的实例化一个  
                // RecognizerDialog并把你在官方网站申请的appid填入进去，非法id不能进行识别  
                RecognizerDialog isrDialog = new RecognizerDialog(  
                        Voice1Activity.this, APPID);  
  
                /* 
                 * 设置引擎目前支持五种 ”sms”：普通文本转写 “poi”：地名搜索 ”vsearch”：热词搜索 
                 * ”video”：视频音乐搜索 ”asr”：命令词识别 
                 */  
                isrDialog.setEngine("sms", null, null);  
                isrDialog.setListener(recoListener);  
                isrDialog.show();  
                break;  
            case R.id.bt_speek:  
                // 这是语言合成部分 同样需要实例化一个SynthesizerDialog ，并输入appid  
                SynthesizerDialog syn = new SynthesizerDialog(  
                        Voice1Activity.this, APPID);  
                syn.setListener(new SynthesizerDialogListener() {  
  
                    @Override  
                    public void onEnd(SpeechError arg0) {  
  
                    }  
                });  
                // 根据EditText里的内容实现语音合成  
                syn.setText(et.getText().toString(), null);  
                syn.show();  
                break;  
            case R.id.bt_speek_bg:  
                // 这是后台朗读，实例化一个SynthesizerPlayer  
                SynthesizerPlayer player = SynthesizerPlayer  
                        .createSynthesizerPlayer(Voice1Activity.this, APPID);  
                // 设置语音朗读者，可以根据需要设置男女朗读，具体请看api文档和官方论坛  
                player.setVoiceName("vivixiaomei");  
                player.playText(et.getText().toString(), "ent=vivi21,bft=5",  
                        null);  
                break;  
            default:  
                break;  
            }  
  
        }  
    };  
    // 语言识别监听器，有两个方法  
    RecognizerDialogListener recoListener = new RecognizerDialogListener() {  
  
        @Override  
        public void onResults(ArrayList<RecognizerResult> results,  
                boolean isLast) {  
            // 服务器识别完成后会返回集合，我们这里就只得到最匹配的那一项  
            text += results.get(0).text;  
            System.out.println(text);  
        }  
  
        @Override  
        public void onEnd(SpeechError error) {  
            if (error == null) {  
                // 完成后就把结果显示在EditText上  
                et.setText(text);  
            }  
  
        }  
  
    };  
  
}

最后别忘了把科大讯飞的jar包引入工程的buildPath里面。

运行画面：

语音识别： android语音识别之科大讯飞语音API的使用

语音合成： android语音识别之科大讯飞语音API的使用

其实功能还不止这些，还有数据上传，关键字识别，获取上行下行流量，设置采样频率设置发音人，语速，音量等等等，如果感兴趣可以自己深入研究。

http://blog.csdn.net/zhwycan/article/details/7274863

http://open.voicecloud.cn/developer.php

语音识别科大讯飞 api

安科网

android语音识别之科大讯飞语音API的使用

wuhongyao

wuhongyao

相关推荐

科大讯飞董事长刘庆峰：AI在各领域应用落地需对应三大标准

原 Python用ctypes调用动态库的方式使用科大讯飞语音识别

科大讯飞618勇夺5大品类销量冠军，翻译机销售额登顶

AI技术红利开始兑现？科大讯飞发力消费者业务，发布多款AI新品

达摩院公布语音AI新进展：移动端也能实现逼近真人的语音交互体验

腾讯云小微等语音助手持续发力，AI语音技术应用和生态融合

基于OpenSeq2Seq的NLP与语音识别混合精度训练

人工智能的三大领域及其工业应用

Kaldi 语音识别基础教程

使用Python和Keras创建简单语音识别引擎

Python使用Speech_Recognition实现普通话识别

百度语音识别新算法准确率提升超30%，鸿鹄芯片彰显AI落地新打法

使用Python进行语音识别---将音频转为文字

教你怎样用Python进行语音识别

AI 大牛 Daniel Povey 加入小米，将在小爱同学 3.0 发布首次亮相

云从的长征路

英文语音、方言语音识别样样拿手，百度输入法率先实现“语音自由说”

Nodejs 微信开发之语音识别

云知声 Open Day 北京站：全栈 AI 硬核技术曝光

重磅！MaxCompute助力阿里开源自研语音识别模型DFSMN，准确率高达96.04%

wuhongyao