如何用python调用百度语音识别

如题所述

1、首先需要打开百度AI语音系统,开始编写代码,如图所示,编写好回车。

2、然后接下来再试一下16k.pcm的音频,开始编写成功回车,如图所示的编写。

3、最后,查看音频c的属性,可以看到音频持续28秒,这样就是用python调用百度语音识别成功解决问题。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-07-22

1、首先准备可供测试的音频,百度搜索“百度语音识别-开发文档”。

2、从上图网页把音频下载到本地的桌面的文件夹a里面。

3、python调用百度AI语音识别功能的代码,可以按照下面的步骤查看:百度AI开放平台——文档中心——语音识别——SDK文档——PythonSDk里面查看。

4、具体的python代码如下图所示。

5、再试试16k.pcm,也成功了。

6、再截短音频b,得到c;查看音频c的属性,可以看到音频持续28秒,符合要求;然而还是测试失败。

本回答被网友采纳
第2个回答  2017-09-13

    用你的百度账号登录百度AI开放平台,进控制台,点击人工智能中任意一项

    创建一个应用,获得APP_ID,API_KEY、SECRET_KEY

    安装百度sdk

    pip install baidu_aip

    具体的开发文档,参见http://ai.baidu.com/docs#/ASR-Online-Python-SDK/top

    代码如下:

    给出一个可以解析的音频文件,http://bos.nj.bpc.baidu.com/v1/audio/8k.amr

    目前支持的音频格式不多。。


    #encoding:utf-8
    from aip import  AipSpeech

    # 定义常量,此处替换为你自己的应用信息
    APP_ID = 'your_app_id'
    API_KEY = 'your_api_key'
    SECRET_KEY = 'your_secret_key'

    # 初始化AipSpeech对象
    aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

    # 读取文件
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()

    # 识别本地文件
    #目前支持的格式较少,原始 PCM 的录音参数必须符合 8k/16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。
    result = aipSpeech.asr(get_file_content('C:\Users\wangjichong\Desktop\8k.amr'), 'amr', 8000, {
        'lan': 'zh',
    })
    print result['result'][0]


本回答被提问者采纳
相似回答