弁言:
语音音频转笔墨是一项弘大的工程,尤其当涉及数小时的(会议)课程录音时,更需高效且精准的转换工具。对付追求性价比的用户来说,如何在不产生额外用度的情形下实现本地化的笔墨转化,成为了一个主要课题。本次我们采取了BUZZ这一基于开源技能的办理方案,它充分利用了GPU和CPU的运算能力,实现了音频到笔墨确当地高效转化。无需支配额外设备或购买做事,即可轻松完成大批量录音的转笔墨事情,为用户节省了大量韶光和本钱。BUZZ以其出色的性能和稳定性,成为了实现本地化语音转笔墨的空想选择。
Buzz功能先容Buzz是一款基于OpenAI Whisper的开源、可离线的实时语音转笔墨工具,它适用于Mac、Windows和Linux系统,为用户供应了高效且灵巧的语音转笔墨办理方案。以下是Buzz的紧张功能特点:
Buzz支持从打算机麦克风实时转录和翻译成文本,这一功能对付须要即时反馈的场景尤为实用。不过请把稳,由于这一功能较为资源密集型,可能无法实现完备实时的转录效果。

录音如下(第一开启会提示***模型):
二、音***文件导入与导出
Buzz支持导入多种格式的音频和***文件,包括mp3、wav、m4a、ogg等音频格式以及mp4、webm、ogm等***格式。用户可以将这些文件导入后,轻松将其转换为***、SRT和VTT格式的文本或字幕文件,知足不同的输出需求。
三、多模型支持Buzz兼容多种语音转笔墨模型,包括Whisper、Whisper.cpp、Faster Whisper以及与Whisper兼容的Hugging Face模型和OpenAI Whisper API。这使得Buzz在转换精度和效率上更具上风,能够根据不同的需求选择得当的模型进行转换。详细模型如下:
四、离线利用
Buzz支持离线利用,无需连接互联网即可进行语音转笔墨操作。这一特点使得Buzz在保密性哀求较高或网络环境不稳定的场景下具有独特的上风。
实用办法如下:1、***安装本次版本0.8.4
Github项目地址:https://github.com/chidiwilliams/buzz
如下,打开链接,点击这里
展开Assets资源,点击windows(当然,有苹果系统和linux系统的)
***后点开安装
2、打开Buzz如下
点击加号,添加文件
记得选择中文,本次测试录音转笔墨,拿杰伦哥的歌来测试~(发如雪,灾害级音频转笔墨)
由于第一次转换,须要***大数据模型到本地。
对付模板可以自己选(openai须要账号)
渲染(转换)速率:取决于你机器的性能,第一次会***措辞模型本次测试环境:轻量云做事器(2C+4G+6M)性能一样平常,
把稳:转换过程中,会弹出一个黑框(Dos命令框,实际上运行的ffmpeg彷佛)
结果:
3、转换结果如下
Tiny质量不敢阿谀,但说实在的,杰伦歌的转笔墨,对付弁言模型来说,是史诗灾害级的。
base模型如下:
Base模型已经很好了,便是速率有点慢4分钟旁边(包含***Base模型)。
但是仍有概率反应成繁体
4、模型库大小比拟
5、卸载记得清理***的模型Whisper 模型存储在电脑中 以下目录(默认安装地址):
C:Users/AppDataLocalBuzzBuzzCache (Windows)~/.cache/whisper~/Library/Caches/Buzz (macOS)~/.cache/Buzz (Linux)五、总结Buzz适用于多种场景,包括但不限于:
会议现场录音同步转文本:在会议现场,通过Buzz的实时语音转笔墨功能,可以将讲话内容实时转换为文本,方便与会者查看和记录。***语音转字幕:对付须要添加字幕的***文件,Buzz可以将个中的语音内容转换为***、SRT或VTT格式的字幕文件,轻松实现***字幕的添加。音频文件转文本:对付已有的音频文件,Buzz同样可以将其转换为文本格式,方便用户进行编辑、搜索或分享。总之,由于Buzz免费,尤其强大的功能和广泛的运用处景(支持Openai),为用户供应了高效、便捷的语音转笔墨办理方案。无论是实时转录还是离线转换,Buzz都能知足用户的多样化需求。