最近在使用科大讯飞的SDK 做音频文字互转的效果。
文字转语音很简单,但在处理音频转文字时候碰到一些问题,因此做一些简单记录。
在讯飞SDK 所支持的音频文件为.pcm和.wav 格式的,因为项目中本地文件是压缩过的amr文件,所以需要对音频文件做格式转换。
使用起来相对也比较简单,设置输入本地文件路径及转换后的文件储存路径即可,之后通过转换后的wav格式音频文件处理音频转文字即可。下面是部分代码:
下载后将文件导入项目中:
#import "EMVoiceConverter.h" 在需要用到的地方导入头文件
之后可以去对应路径下验证音频文件类型。PS: