Python的依赖库中有一些现成的语音识别软件包。其中包括:
apiai
google-cloud-speech
pocketsphinx
SpeechRcognition
watson-developer-cloud
wit
其中SpeechRecognition,是google出的,专注于语音向文本的转换。本文专门介绍。
二、speech-recognition的安装配置 从下列地址,下载speechRecognition的wheel文件,并安装三、 语音转文字实验https://pypi.org/project/speechRecognition
pip install speechrecognition(wheel)
以下生成识别对象r,麦克风对象mic,并使用mic做输入采集,用r进行语音识别。
import speech_recognition as sr r = sr.Recognizer() 生成语音识别模块 mic = sr.Microphone() 生成麦克风模块 with mic as source: audio = r.listen(source) 扫描麦克风输入 output = r.recognize_google( audio,language='zh-cn' ) 对麦克输入当作中文识别 print( output ) 打印结果四、文件读入Wav的文字识别
以下用AudioFile模块打开Wav文件作为数据源
import speech_recognition as sr print(sr.__version__) r = sr.Recognizer() with sr.AudioFile("./output.wav") as source: audio = r.record( source ) print( type(audio) ) output = r.recognize_google( audio,language='zh-cn' ) print( output )
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)