产品 更新

来自Brethof Voice Pro团队的产品发布消息、Champions计划动态、新功能介绍以及幕后技术细节。

发布 2026年5月21日

v2.0.0 — 支持38种语言的离线翻译

Brethof Voice Pro已不再仅仅是语音转文本工具,其v2.0.0版本现已发布。 离线翻译 由腾讯提供技术支持 Hunyuan MT2 — 在FLORES-200(XCOMET-XXL)中,7B级别已达到 97.9%的Google Gemini 3.1 Pro它在真实场景测试及小语种翻译测试中的表现优于Gemini。翻译过程完全在您的设备上完成。提供两种型号供按需下载:快速版(约1GB,使用CPU或GPU时可在几分之一秒内完成翻译)和高质量版(约4.3GB,使用GPU时同样可在几分之一秒内完成翻译)。此外还包含几项期待已久的新增功能。

v2.0.0版本有哪些新功能:

  • 转录 + 翻译 — “转录”弹出窗口中有一个“翻译为:”下拉菜单。ASR负责语音转录,MT负责文本翻译,两者结果会并排显示。该功能可处理文件、麦克风输入以及系统音频(如会议通话的回放、浏览器标签页中的音频、扬声器播放的任何声音)。
  • 多语言语音键盘 — 主行上的新翻译芯片可生成三列式语言网格。选择一个或多个目标语言,键盘便会输入对应译文。布局模式:每行一个、内联式EN: … || PL: …),或者仅选择第一个目标。
  • SRT / VTT字幕翻译工具 — 保留时间戳与提示索引,支持双语模式(每个提示包含原文与译文)。可通过MCP接口实现AI智能体的自动化操作。
  • 每个引擎支持多块GPU — 在“设置”→“模型”中,每种引擎都有独立的设备选择器。可在Vulkan 0上运行ASR功能,在Vulkan 1上运行翻译功能;对于显存有限的笔记本电脑,则可将Hunyuan MT2 7B固定在使用CPU上。
  • 个性化语音训练为实时模式 — 可针对您的个人声音进行LoRA微调,全程在您的设备上完成。主界面的训练卡片可让您一目了然地查看总样本数及录制时长;“开始训练”按钮会在训练选项卡中自动选择NVIDIA CUDA或CPU,随后将训练好的模型自动导出为GGUF格式。所有付费许可证均附赠此功能。
  • 4款新的MCP工具translate_text, translate_srt, list_compute_devices, set_compute_device目前工具总数为19个。
  • 真实的语言能够分化事物。 — ASR:30种可选语言+自动检测功能+22种中文方言(共计52种)。翻译功能:38种语言(33种主要语言+5种中国地区少数民族语言),其中23种语言支持双向翻译。

Linux版本的二进制文件大小为161 MB,Windows安装程序的大小为118 MB。定价相同:个人版49美元,企业版149美元。现有许可证可继续使用——只需 下载v2.0.0版本 这些翻译模型会显示在“设置”→“模型”中。

下载 v2.0.0 →
发布 2026年5月20日

v1.6.16 — 个人语音训练功能现已上线

训练流程现已发布。现在,基于您自身声音的LoRA微调可在您的设备上端到端完成——该应用会自动选择合适的参数。 NVIDIA CUDA or CPU完成后会自动将训练好的模型导出为GGUF格式。在GUI中进行的每一次修改都会自动保存到您的本地训练数据集中;主窗口的训练卡片可让您一目了然地查看总样本数和训练时间。

额外好处:由于llama.cpp升级(版本b9222)解决了长音频片段中的数据块边界问题,所有语言下的语音键盘识别准确率均有所提升。每份付费许可证均附赠此功能。

工程学 2026年5月15日

v1.6.0 — 异步转录任务 + 单词级SRT优化

两款新的MCP工具已推出: start_transcription 会立即返回任务编号,以便代理可以处理其他工作。 get_transcription_status 进行完成度检测。一次处理一个任务,完成后立即显示结果。大型文件不会再阻塞代理循环。

此外还针对字级SRT/VTT输出进行了一系列优化:不再出现标点符号前的多余空格,不再有单独的句号标记,也不会有热词或上下文字符串渗入字幕内容。如此一来字幕更加整洁,无需再手动清理。

工程学 2026年5月15日

v1.5.0 — 已移除ONNX支持,运行时现在仅使用llama.cpp与libmtmd

对整个引擎进行了重写。Brethof Voice Pro现在可全程使用Qwen3-ASR进行处理。 llama.cpp 通过GGUF量化权重实现 libmtmdONNX Runtime 已被移除。其带来的好处包括:安装包更小(二进制文件大小约为 83 MB,而之前为 400 MB 以上)、冷启动速度更快,同时也不再需要处理针对不同平台的 CUDA/DirectML 版本问题。

Vulkan会自动识别您的GPU——无论是NVIDIA、AMD还是Intel Arc系列——在没有GPU时则会回退到CPU使用。同一引擎如今为所有后续功能提供支持:ASR、语音键盘、MCP服务器,以及(在2.0.0版本中)翻译功能。

工程学 2026年5月14日

v1.4.0 — MCP服务器首次亮相 + 多GPU设备选择器

Model Context Protocol服务器已启动。任何兼容MCP的AI智能体—— Claude桌面版, Claude Code, 光标, 克莱因 — 可通过标准输入输出进行转录处理(无需端口,也无需防火墙)。同一版本还提供了 多GPU设备选择器 这样你就可以选择哪款Vulkan GPU用于运行ASR,还有可选功能。 强制对齐工具 为每段转录内容添加单词级别的时间戳插件。

仅限付费版本——没有个人版或企业版许可证,MCP服务器将无法启动。 brethof-voice --mcp 这就是单行调用方式。

发展路线图 2026年4月16日

macOS版本正在开发中——首先支持Apple Silicon芯片。

发布前最常被问及的问题是“macOS何时推出?”。答案是:仍在积极开发中。首先推出的是采用Metal加速技术的Apple Silicon原生版本,随后才是Intel版本。目标发布时间为2026年第三季度,我们将在第二季度开启封闭测试。以下是正在开发的内容以及注册方式。

阅读文章 →
产品 2026年4月16日

个性化模型训练——根据个人声音对Brethof Voice Pro进行微调

Brethof Voice Pro支持实时个人语音训练功能。每次您纠正被错误识别的单词时,相关的音频片段及修正内容都会自动保存到您的本地训练数据集中。在“训练”选项卡中只需点击一下,即可针对您的口音对LoRA模型进行微调——该应用会自动选择NVIDIA CUDA或CPU作为计算引擎,随后将训练好的模型导出为GGUF格式。所有付费许可证均附赠此功能。

阅读文章 →
公告 2026年4月16日

Brethof Voice Pro现已上线——这款语音转文本工具会保存在您的设备上。

经过数月的研发,Brethof Voice Pro 1.0版本今日正式发布,支持Windows和Linux系统。该软件提供30种语音转写语言以及22种中文方言支持,具备完全离线转写功能、任意位置的热键听写功能,且为一次性定价,无需订阅。以下是此次发布版本所包含的功能,以及我们接下来的研发计划。

阅读文章 →
冠军们 2026年4月16日

共有1,800个免费许可证可供获取:冠军计划现已开放申请。

Champions计划今日启动,将持续至5月16日。每种支持的语言可免费获得50个个人许可证,总计1,800个;此外,未进入前50名的参赛者还可享受70%的折扣。以下是该计划的运作方式以及我们选择这种方式的原因。

阅读文章 →
许可授权 2026年4月16日

个人许可证现已涵盖个体经营及自由职业工作。

我们听取了撰稿人、顾问及译员们的初步反馈,他们认为原有的“仅限个人使用”说明容易引起混淆。现在售价49美元的个人许可证已明确允许个人及自由职业者进行商业用途使用。而售价149美元/位的企业许可证则是为团队设计的。以下是具体变更内容及其原因。

阅读文章 →
产品 2026年4月12日

30种转写语言,完全本地化的用户界面——而非机器翻译产生的冗长文本墙

Brethof Voice Pro现在能够以30种语言以及22种中文方言进行文字转录与展示,这些语言包括:阿拉伯语、粤语、汉语、捷克语、丹麦语、荷兰语、英语、菲律宾语、芬兰语、法语、德语、希腊语、印地语、匈牙利语、印度尼西亚语、意大利语、日语、韩语、马其顿语、马来语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、泰语、土耳其语和越南语。以下是该应用如何选择合适的语言版本,以及“完全翻译”究竟意味着什么。

阅读文章 →
工程学 2026年4月8日

我们为何从ONNX转向GGUF——速度更快、体积更小、更易于部署

Brethof Voice Pro的ASR后端基于llama.cpp以及经过GGUF格式量化的Qwen模型运行,而非ONNX Runtime。这样一来,安装文件体积更小(83 MB的exe文件,而传统版本超过400 MB),冷启动速度更快,而且无需再在各个平台上处理CUDA/DirectML相关的兼容问题。以下便是此次技术选型背后的故事。

阅读文章 →
原则 2026年4月4日

为何Brethof Voice Pro能够实现100%离线运行——以及这为何不仅仅是一项功能

所有主流的听写产品都会将用户的音频通过他人的服务器进行处理。我们认为这种设置是错误的默认选项。用户的音频属于最私人的数据——无论是医疗记录、法律文件、私人日记还是工作机密。正因如此,Brethof Voice Pro才没有云模式、没有“可选的遥测功能”,也无需账户即可进行转录。

阅读文章 →

在您的收件箱中获取更新。

创建账户,以便在我们发布新文章及推出新版本时收到通知。

创建账户

我们打造的一切

外部:   YouTube · GitHub