最近使用Python调用百度的RESTAPI实现语音识别,但是百度要求音频文件的压缩方式只能是pcm
最近使用Python调用百度的REST API实现语音识别,但是百度要求音频文件的压缩方式只能是pcm(不压缩)、wav、opus、speex、amr,这里面也就wav还常见一点,但是一般设备录音得到的文件都是mp3,这就要把mp3转换为wav,由于python的效率并不高,很多实现都是使用C++或者Java,不过GitHub上有一个项目pydub(https://github.com/jiaaro/pydub/tree/master/pydub)可以暂时解决问题。
安装pydub
直接执行以下命令即可
pip install pydub
环境依赖
sudo apt-get install ffmpeg
mp3转换为wav
from pydub import AudioSegment
sound = AudioSegment.from_mp3("/path/to/file.mp3")
sound.export("/output/path", format="wav")
以上这篇Python 利用pydub库操作音频文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
Python pydub 音频文件