Android中如何将语音转为文字

原创

mob64ca12f6e9a0 2023-08-30 16:50:00 ©著作权

文章标签 语音识别 ide Android 文章分类 Android 移动开发

©著作权归作者所有：来自51CTO博客作者mob64ca12f6e9a0的原创作品，请联系作者获取转载授权，否则将追究法律责任

项目方案：Android语音识别

1. 简介

在Android应用中，将语音转为文字是一个常见的需求。本项目方案将介绍如何在Android应用中实现语音识别功能，并将识别结果转为文字。

2. 技术选型

为了实现语音识别功能，我们可以使用Android系统提供的SpeechRecognizer类。SpeechRecognizer是Android提供的语音识别API，可以将语音转为文字。另外，为了提高语音识别的准确性和稳定性，我们可以选择使用云端的语音识别服务，如Google Cloud Speech-to-Text。

3. 实施步骤

步骤1：添加权限

在AndroidManifest.xml文件中，添加以下权限：

<uses-permission android:name="android.permission.RECORD_AUDIO" />
<uses-permission android:name="android.permission.INTERNET" />

其中，RECORD_AUDIO权限用于录制音频，INTERNET权限用于连接云端的语音识别服务。

步骤2：创建界面

在布局文件中创建一个按钮和一个TextView用于显示识别结果：

<Button
    android:id="@+id/btn_start"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content"
    android:text="开始识别" />

<TextView
    android:id="@+id/tv_result"
    android:layout_width="match_parent"
    android:layout_height="wrap_content"
    android:layout_marginTop="16dp"
    android:textSize="16sp" />

步骤3：实现语音识别逻辑

在Activity中实现语音识别逻辑：

import android.content.Intent;
import android.speech.RecognizerIntent;
import android.speech.SpeechRecognizer;
import android.speech.RecognitionListener;

public class MainActivity extends AppCompatActivity {

    private Button btnStart;
    private TextView tvResult;
    private SpeechRecognizer speechRecognizer;

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);

        btnStart = findViewById(R.id.btn_start);
        tvResult = findViewById(R.id.tv_result);

        // 初始化SpeechRecognizer
        speechRecognizer = SpeechRecognizer.createSpeechRecognizer(this);

        // 创建RecognitionListener并设置监听器
        RecognitionListener recognitionListener = new RecognitionListener() {
            @Override
            public void onReadyForSpeech(Bundle params) {
                // 准备开始识别
            }

            @Override
            public void onBeginningOfSpeech() {
                // 开始说话
            }

            @Override
            public void onRmsChanged(float rmsdB) {
                // 音量变化
            }

            @Override
            public void onEndOfSpeech() {
                // 结束说话
            }

            @Override
            public void onError(int error) {
                // 识别出错
            }

            @Override
            public void onResults(Bundle results) {
                // 识别结果
                ArrayList<String> list = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION);
                if (list != null && !list.isEmpty()) {
                    String result = list.get(0);
                    tvResult.setText(result);
                }
            }

            // 省略其他方法
        };

        // 设置RecognitionListener
        speechRecognizer.setRecognitionListener(recognitionListener);

        // 设置按钮点击事件
        btnStart.setOnClickListener(new View.OnClickListener() {
            @Override
            public void onClick(View v) {
                startRecognition();
            }
        });
    }

    private void startRecognition() {
        // 创建语音识别意图
        Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
        intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
        intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, Locale.getDefault());

        // 开始识别
        speechRecognizer.startListening(intent);
    }

    @Override
    protected void onDestroy() {
        super.onDestroy();
        // 释放SpeechRecognizer资源
        speechRecognizer.destroy();
    }
}