软件主要实现批量上传音频文件(当前版本仅支持mp3,后续版本可能添加多种格式,可用格式工厂进行mp3格式转换)进行语音转文字的功能,依托于百度AI,语音识别正确率还是相当不错的。这款独立版的软件去除了原先的黑框,修复了很多bug,KEY的申请教程也写详细了,希望各位能舒心使用,当然肯定还有一些bug,各位及时反馈即可。
批量万能音频转文字软件使用方法
我们严格按照如下步骤来进行操作:
1、KEY的申请
软件上方的APIKEY和SECRETKEY需要去百度AI网页的语音识别板块上申请,完全免费的申请。
如下,打开短语音识别网页:https://ai.baidu.com/tech/speech/asr,点击立即使用。
百度账号登录,进入如下界面,按照箭头先都领取了。
然后创建应用,按照箭头指示随便写即可:
然后查看应用详情里,就能看到APIKEY和SECRETKEY了,复制到软件中即可。
2、选择识别语种
软件一共可选:极速版普通话、免费版普通话、免费版英文、免费版粤语、免费版四川话这几种,其中第一个极速版普通话正确率最高。
3、选择音频转换
点击按钮可批量选择多个mp3音频,然后自动进行转换,识别完成后自动保存识别结果到软件目录的音频转换结果文件夹中
如下测试转换20多分钟的岳云鹏相声,正确率确实不错了。
批量万能音频转文字软件更新日志
修复部分mp3文件闪退bug。
支持更多音频格式转换,目前支持音频格式:*.mp3;*.wav;*.m4a;*.aac;*.wma;*.flac
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验