讯飞在线语音合成java api文档讯飞生成语音

转载

mob64ca140dc73b 2024-02-18 11:12:22

文章标签 讯飞在线语音合成java api文档 android 科大讯飞语音听写语音合成 文章分类 Java 后端开发

一、准备工作

1、首先你需要去科大讯飞的官网去注册一个账号，怎么注册我就不说了，然后去控制台，创建新应用。

讯飞在线语音合成java api文档讯飞生成语音_科大讯飞

2、下载对应的sdk，点击sdk下载，记住这里的APPID码，sdk初始化要用。

讯飞在线语音合成java api文档讯飞生成语音_语音合成_02

3、下载语音听写和在线语音合成对应的sdk（离线的语音听写需要手机安装语+这个软件才能用，离线语音合成收费，我就没考虑）

讯飞在线语音合成java api文档讯飞生成语音_讯飞在线语音合成java api文档_03

4、将压缩文件中的assets和lib放到项目中，需要注意的是如果是Android studio项目，lib文件夹中的.so相关文件夹都应该放在jniLibs文件夹里，直接放到libs下无法识别。

二、SDK初始化

与大部分的sdk一样越早初始化越好，免得用的时候忘了，初始化失败导致调用不成功，所以我选择在自定义的application中初始化，代码如下：

public class MyApplication extends Application {

    @Override
    public void onCreate() {

        /* 应用程序入口处调用,避免手机内存过小,杀死后台进程后通过历史intent
           进入Activity造成SpeechUtility对象为null*/
        
        /* 注意：此接口在非主进程调用会返回null对象，如需在非主进程使用语音功能，
           请增加参数：SpeechConstant.FORCE_LOGIN+"=true"
           参数间使用“,”分隔。
           设置你申请的应用appid*/

        // 注意： appid 必须和下载的SDK保持一致，否则会出现10407错误

        StringBuffer param = new StringBuffer();
        param.append("appid="+getString(R.string.app_id));
        param.append(",");
        // 设置使用v5+
        param.append(SpeechConstant.ENGINE_MODE+"="+SpeechConstant.MODE_MSC);
        SpeechUtility.createUtility(MyApplication.this, param.toString());

        super.onCreate();
    }
}

三、语音听写功能

1、使用讯飞提供的UI

讯飞在线语音合成java api文档讯飞生成语音_讯飞在线语音合成java api文档_04

讯飞在线语音合成java api文档讯飞生成语音_科大讯飞_05

讯飞在线语音合成java api文档讯飞生成语音_讯飞在线语音合成java api文档_06

i.定义语音听写UI控件

//语音听写UI
private RecognizerDialog reDialog;

ii.定义语音听写初始化监听，监听初始化是否成功

/**
 * 语音听写初始化监听器。
 */
private InitListener mInitListener = new InitListener() {

    @Override
    public void onInit(int code) {
        Log.d("zhangdi", "SpeechRecognizer init() code = " + code);
        if (code != ErrorCode.SUCCESS) {
            showTip("初始化失败，错误码：" + code);
        }
    }
};

iii.初始化语音听写UI

// 初始化听写Dialog，如果只使用有UI听写功能，无需创建SpeechRecognizer
// 使用UI听写功能，请根据sdk文件目录下的notice.txt,放置布局文件和图片资源
reDialog = new RecognizerDialog(this,mInitListener);

iv.定义听写UI的听写回调监听

/**
 * 听写UI监听器
 */
private RecognizerDialogListener mRecognizerDialogListener = new RecognizerDialogListener() {

    @Override
    public void onResult(RecognizerResult results, boolean b) {

        //正确回调
        Log.d("zhangdi", "recognizer result：" + results.getResultString());

        //解析返回的json字符
        String text = JsonParser.parseIatResult(results.getResultString());
        //将返回的结果显示在edittext中
        resultText.append(text);
        resultText.setSelection(resultText.length());
    }

    /**
     * 识别回调错误.
     */
    public void onError(SpeechError error) {
        if(mTranslateEnable && error.getErrorCode() == 14002) {
            showTip( error.getPlainDescription(true)+"\n请确认是否已开通翻译功能" );
        } else {
            showTip(error.getPlainDescription(true));
        }
    }

};

v.在语音听写对应的按钮点击事件中显示UI

// 显示听写对话框
reDialog.setListener(mRecognizerDialogListener);
reDialog.show();
showTip(getString(R.string.text_begin));

2.使用自己的UI界面

i.定义语音听写对象

//语音听写对象
private SpeechRecognizer recognizer;

ii.定义语音听写初始化监听，监听初始化是否成功

/**
 * 语音听写初始化监听器。
 */
private InitListener mInitListener = new InitListener() {

    @Override
    public void onInit(int code) {
        Log.d("zhangdi", "SpeechRecognizer init() code = " + code);
        if (code != ErrorCode.SUCCESS) {
            showTip("初始化失败，错误码：" + code);
        }
    }
};

iii.初始化听写对象

// 初始化识别无UI识别对象
// 使用SpeechRecognizer对象，可根据回调消息自定义界面；
recognizer = SpeechRecognizer.createRecognizer(this, mInitListener);

iv.对听写对象进行参数设置

/**
     * 参数设置
     * @return
     */
    public void setParamRecognizer(){

        // 清空参数
        recognizer.setParameter(SpeechConstant.PARAMS, null);

        // 设置引擎,目前只支持云端模式，本地模式需要手机安装语+软件才能用
        recognizer.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);
        // 设置返回结果格式
        recognizer.setParameter(SpeechConstant.RESULT_TYPE, "json");

        // 设置语言
        recognizer.setParameter(SpeechConstant.LANGUAGE, "zh_cn");
        // 设置语言地区,普通话
        recognizer.setParameter(SpeechConstant.ACCENT, "mandarin");

        // 设置语音前端点:静音超时时间，即用户多长时间不说话则当做超时处理
        recognizer.setParameter(SpeechConstant.VAD_BOS, "4000");

        // 设置语音后端点:后端点静音检测时间，即用户停止说话多长时间内即认为不再输入， 自动停止录音
        recognizer.setParameter(SpeechConstant.VAD_EOS, "1000");

        // 设置标点符号,设置为"0"返回结果无标点,设置为"1"返回结果有标点
        recognizer.setParameter(SpeechConstant.ASR_PTT, "1");

        // 设置音频保存路径，保存音频格式支持pcm、wav，设置路径为sd卡请注意WRITE_EXTERNAL_STORAGE权限
        // 注：AUDIO_FORMAT参数语记需要更新版本才能生效
//        recognizer.setParameter(SpeechConstant.AUDIO_FORMAT,"wav");
//        recognizer.setParameter(SpeechConstant.ASR_AUDIO_PATH, Environment.getExternalStorageDirectory()+"/msc/iat.wav");
    }

v.在语音听写对应的按钮事件中为听写对象设置回调监听

recognizer.startListening(new RecognizerListener() {
    @Override
    public void onVolumeChanged(int i, byte[] bytes) {
        Log.i("zhangdi","i = "+i+"bytes = "+bytes.toString());
    }

    @Override
    public void onBeginOfSpeech() {
        showTip("开始说话");
    }

    @Override
    public void onEndOfSpeech() {
        showTip("结束说话");
    }

    @Override
    public void onResult(RecognizerResult recognizerResult, boolean b) {
        resultText.append(recognizerResult.getResultString());
    }

    @Override
    public void onError(SpeechError speechError) {
        showTip(speechError.getErrorDescription());
    }

    @Override
    public void onEvent(int i, int i1, int i2, Bundle bundle) {
        Log.i("zhangdi","i = "+i+" i1 = "+i1+" i2 = "+i2);
    }
});

四、语音合成功能

1.定义语音合成对象

// 语音合成对象
private SpeechSynthesizer mTts;

2.语音合成初始化监听

/**
 * 语音合成初始化监听。
 */
private InitListener mTtsInitListener = new InitListener() {
    @Override
    public void onInit(int code) {
        Log.d("zhangdi", "InitListener init() code = " + code);
        if (code != ErrorCode.SUCCESS) {
            showTip("初始化失败,错误码："+code);
        } 
        //else {
            // 初始化成功，之后可以调用startSpeaking方法
            // 注：有的开发者在onCreate方法中创建完合成对象之后马上就调用startSpeaking进行合成，
            // 正确的做法是将onCreate中的startSpeaking调用移至这里
        //}
    }
};

3.初始化语音合成对象

// 初始化合成对象
mTts = SpeechSynthesizer.createSynthesizer(this, mTtsInitListener);

4.为语音合成对象设置参数

private void setParamTTS() {

    // 清空参数
    mTts.setParameter(SpeechConstant.PARAMS, null);
    //设置使用云端引擎,本地语音合成是收费的，所以忽略了
    mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);
    //设置发音人
    mTts.setParameter(SpeechConstant.VOICE_NAME,voicerCloud);
    //设置合成语速
    mTts.setParameter(SpeechConstant.SPEED, "50");
    //设置合成音调
    mTts.setParameter(SpeechConstant.PITCH, "50");
    //设置合成音量
    mTts.setParameter(SpeechConstant.VOLUME, "50");
    //设置播放器音频流类型
    mTts.setParameter(SpeechConstant.STREAM_TYPE, "3");

    // 设置播放合成音频打断音乐播放，默认为true
    mTts.setParameter(SpeechConstant.KEY_REQUEST_FOCUS, "true");

}

5.定义语音合成监听回调

/**
 * 合成回调监听。
 */
private SynthesizerListener mTtsListener = new SynthesizerListener() {

    @Override
    public void onSpeakBegin() {
        showTip("开始播放");
    }

    @Override
    public void onSpeakPaused() {
        showTip("暂停播放");
    }

    @Override
    public void onSpeakResumed() {
        showTip("继续播放");
    }

    @Override
    public void onBufferProgress(int percent, int beginPos, int endPos,
                                 String info) {
        // 合成进度
        mPercentForBuffering = percent;
        showTip(String.format(getString(R.string.tts_toast_format),
                mPercentForBuffering, mPercentForPlaying));
    }

    @Override
    public void onSpeakProgress(int percent, int beginPos, int endPos) {
        // 播放进度
        mPercentForPlaying = percent;
        showTip(String.format(getString(R.string.tts_toast_format),
                mPercentForBuffering, mPercentForPlaying));
    }

    @Override
    public void onCompleted(SpeechError error) {
        if (error == null) {
            showTip("播放完成");
        } else if (error != null) {
            showTip(error.getPlainDescription(true));
        }
    }

    @Override
    public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {
        // 以下代码用于获取与云端的会话id，当业务出错时将会话id提供给技术支持人员，可用于查询会话日志，定位出错原因
        // 若使用本地能力，会话id为null
        // if (SpeechEvent.EVENT_SESSION_ID == eventType) {
        //    String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);
        //    Log.d(TAG, "session id =" + sid);
        // }
    }
};

6.在语音合成对应按钮的点击事件中为语音合成对象设置监听

int code = mTts.startSpeaking(text, mTtsListener);
if (code != ErrorCode.SUCCESS) {
    showTip("语音合成失败,错误码: " + code);
}

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：ospf路由汇总 ospf路由汇总abr汇总

下一篇：Spring RestTemplate 封装java工具类 spring resttemplate 配置

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

讯飞在线语音合成java api文档 讯飞生成语音

讯飞在线语音合成java api文档 讯飞生成语音

51CTO博客

讯飞在线语音合成java api文档讯飞生成语音

讯飞在线语音合成java api文档讯飞生成语音