来自Brethof Voice Pro团队的产品发布消息、Champions计划动态、新功能介绍以及幕后技术细节。
Brethof Voice Pro已不再仅仅是语音转文本工具,其v2.0.0版本现已发布。 离线翻译 由腾讯提供技术支持 Hunyuan MT2 — 在FLORES-200(XCOMET-XXL)中,7B级别已达到 97.9%的Google Gemini 3.1 Pro它在真实场景测试及小语种翻译测试中的表现优于Gemini。翻译过程完全在您的设备上完成。提供两种型号供按需下载:快速版(约1GB,使用CPU或GPU时可在几分之一秒内完成翻译)和高质量版(约4.3GB,使用GPU时同样可在几分之一秒内完成翻译)。此外还包含几项期待已久的新增功能。
v2.0.0版本有哪些新功能:
EN: … || PL: …),或者仅选择第一个目标。translate_text, translate_srt, list_compute_devices, set_compute_device目前工具总数为19个。Linux版本的二进制文件大小为161 MB,Windows安装程序的大小为118 MB。定价相同:个人版49美元,企业版149美元。现有许可证可继续使用——只需 下载v2.0.0版本 这些翻译模型会显示在“设置”→“模型”中。
下载 v2.0.0 →训练流程现已发布。现在,基于您自身声音的LoRA微调可在您的设备上端到端完成——该应用会自动选择合适的参数。 NVIDIA CUDA or CPU完成后会自动将训练好的模型导出为GGUF格式。在GUI中进行的每一次修改都会自动保存到您的本地训练数据集中;主窗口的训练卡片可让您一目了然地查看总样本数和训练时间。
额外好处:由于llama.cpp升级(版本b9222)解决了长音频片段中的数据块边界问题,所有语言下的语音键盘识别准确率均有所提升。每份付费许可证均附赠此功能。
两款新的MCP工具已推出: start_transcription 会立即返回任务编号,以便代理可以处理其他工作。 get_transcription_status 进行完成度检测。一次处理一个任务,完成后立即显示结果。大型文件不会再阻塞代理循环。
此外还针对字级SRT/VTT输出进行了一系列优化:不再出现标点符号前的多余空格,不再有单独的句号标记,也不会有热词或上下文字符串渗入字幕内容。如此一来字幕更加整洁,无需再手动清理。
对整个引擎进行了重写。Brethof Voice Pro现在可全程使用Qwen3-ASR进行处理。 llama.cpp 通过GGUF量化权重实现 libmtmdONNX Runtime 已被移除。其带来的好处包括:安装包更小(二进制文件大小约为 83 MB,而之前为 400 MB 以上)、冷启动速度更快,同时也不再需要处理针对不同平台的 CUDA/DirectML 版本问题。
Vulkan会自动识别您的GPU——无论是NVIDIA、AMD还是Intel Arc系列——在没有GPU时则会回退到CPU使用。同一引擎如今为所有后续功能提供支持:ASR、语音键盘、MCP服务器,以及(在2.0.0版本中)翻译功能。
Model Context Protocol服务器已启动。任何兼容MCP的AI智能体—— Claude桌面版, Claude Code, 光标, 克莱因 — 可通过标准输入输出进行转录处理(无需端口,也无需防火墙)。同一版本还提供了 多GPU设备选择器 这样你就可以选择哪款Vulkan GPU用于运行ASR,还有可选功能。 强制对齐工具 为每段转录内容添加单词级别的时间戳插件。
仅限付费版本——没有个人版或企业版许可证,MCP服务器将无法启动。 brethof-voice --mcp 这就是单行调用方式。
发布前最常被问及的问题是“macOS何时推出?”。答案是:仍在积极开发中。首先推出的是采用Metal加速技术的Apple Silicon原生版本,随后才是Intel版本。目标发布时间为2026年第三季度,我们将在第二季度开启封闭测试。以下是正在开发的内容以及注册方式。
阅读文章 →Brethof Voice Pro支持实时个人语音训练功能。每次您纠正被错误识别的单词时,相关的音频片段及修正内容都会自动保存到您的本地训练数据集中。在“训练”选项卡中只需点击一下,即可针对您的口音对LoRA模型进行微调——该应用会自动选择NVIDIA CUDA或CPU作为计算引擎,随后将训练好的模型导出为GGUF格式。所有付费许可证均附赠此功能。
阅读文章 →经过数月的研发,Brethof Voice Pro 1.0版本今日正式发布,支持Windows和Linux系统。该软件提供30种语音转写语言以及22种中文方言支持,具备完全离线转写功能、任意位置的热键听写功能,且为一次性定价,无需订阅。以下是此次发布版本所包含的功能,以及我们接下来的研发计划。
阅读文章 →Champions计划今日启动,将持续至5月16日。每种支持的语言可免费获得50个个人许可证,总计1,800个;此外,未进入前50名的参赛者还可享受70%的折扣。以下是该计划的运作方式以及我们选择这种方式的原因。
阅读文章 →我们听取了撰稿人、顾问及译员们的初步反馈,他们认为原有的“仅限个人使用”说明容易引起混淆。现在售价49美元的个人许可证已明确允许个人及自由职业者进行商业用途使用。而售价149美元/位的企业许可证则是为团队设计的。以下是具体变更内容及其原因。
阅读文章 →Brethof Voice Pro现在能够以30种语言以及22种中文方言进行文字转录与展示,这些语言包括:阿拉伯语、粤语、汉语、捷克语、丹麦语、荷兰语、英语、菲律宾语、芬兰语、法语、德语、希腊语、印地语、匈牙利语、印度尼西亚语、意大利语、日语、韩语、马其顿语、马来语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、泰语、土耳其语和越南语。以下是该应用如何选择合适的语言版本,以及“完全翻译”究竟意味着什么。
阅读文章 →Brethof Voice Pro的ASR后端基于llama.cpp以及经过GGUF格式量化的Qwen模型运行,而非ONNX Runtime。这样一来,安装文件体积更小(83 MB的exe文件,而传统版本超过400 MB),冷启动速度更快,而且无需再在各个平台上处理CUDA/DirectML相关的兼容问题。以下便是此次技术选型背后的故事。
阅读文章 →所有主流的听写产品都会将用户的音频通过他人的服务器进行处理。我们认为这种设置是错误的默认选项。用户的音频属于最私人的数据——无论是医疗记录、法律文件、私人日记还是工作机密。正因如此,Brethof Voice Pro才没有云模式、没有“可选的遥测功能”,也无需账户即可进行转录。
阅读文章 →本地语音转文字功能,可学习您的语音。永久许可。我们的旗舰产品。
付费版·旗舰版
Claude Code的本地长期记忆——全文+向量+图,基于SurrealDB。MIT协议。
免费 · 开源
可直接打印的数字模型,包含STL/3MF/OBJ格式。终身可用。
已支付·数字目录
我们的印刷设计已销往整个欧洲。请购买实物,而非文件。
付费 · 实体物品
Cyber-tiger AI主机。摒弃企业层面的过滤,为您解读以隐私为首要原则的AI技术。
频道 · 直播
精选GitHub列表,涵盖AI、MCP、本地AI、AI用Linux等。注重实际成果,而非氛围感。
免费 · 精选内容
针对Linux、Windows和macOS系统的本地AI详细操作指南。提供真实配置,而非营销内容。
免费 · 即将推出
经过实际生产环境验证的ComfyUI工作流——LTX分块循环、Nova管线等。
免费 · 工作流落地页
负面筛选:浪费你时间的各种方法与工具,已按重要性排序。需提供相关凭证。
免费 · 即将推出
我们是谁,为何要打造以本地化为核心的AI技术,以及我们不会做什么。