更新——Brethof Voice Pro

发布 2026年5月21日

v2.0.0 — 支持38种语言的离线翻译

Brethof Voice Pro已不再仅仅是语音转文本工具，其v2.0.0版本现已发布。 离线翻译 由腾讯提供技术支持 Hunyuan MT2 — 在FLORES-200（XCOMET-XXL）中，7B级别已达到 97.9%的Google Gemini 3.1 Pro它在真实场景测试及小语种翻译测试中的表现优于Gemini。翻译过程完全在您的设备上完成。提供两种型号供按需下载：快速版（约1GB，使用CPU或GPU时可在几分之一秒内完成翻译）和高质量版（约4.3GB，使用GPU时同样可在几分之一秒内完成翻译）。此外还包含几项期待已久的新增功能。

v2.0.0版本有哪些新功能：

转录 + 翻译 — “转录”弹出窗口中有一个“翻译为：”下拉菜单。ASR负责语音转录，MT负责文本翻译，两者结果会并排显示。该功能可处理文件、麦克风输入以及系统音频（如会议通话的回放、浏览器标签页中的音频、扬声器播放的任何声音）。
多语言语音键盘 — 主行上的新翻译芯片可生成三列式语言网格。选择一个或多个目标语言，键盘便会输入对应译文。布局模式：每行一个、内联式EN: … || PL: …），或者仅选择第一个目标。
SRT / VTT字幕翻译工具 — 保留时间戳与提示索引，支持双语模式（每个提示包含原文与译文）。可通过MCP接口实现AI智能体的自动化操作。
每个引擎支持多块GPU — 在“设置”→“模型”中，每种引擎都有独立的设备选择器。可在Vulkan 0上运行ASR功能，在Vulkan 1上运行翻译功能；对于显存有限的笔记本电脑，则可将Hunyuan MT2 7B固定在使用CPU上。
个性化语音训练为实时模式 — 可针对您的个人声音进行LoRA微调，全程在您的设备上完成。主界面的训练卡片可让您一目了然地查看总样本数及录制时长；“开始训练”按钮会在训练选项卡中自动选择NVIDIA CUDA或CPU，随后将训练好的模型自动导出为GGUF格式。所有付费许可证均附赠此功能。
4款新的MCP工具 — translate_text, translate_srt, list_compute_devices, set_compute_device目前工具总数为19个。
真实的语言能够分化事物。 — ASR：30种可选语言+自动检测功能+22种中文方言（共计52种）。翻译功能：38种语言（33种主要语言+5种中国地区少数民族语言），其中23种语言支持双向翻译。

Linux版本的二进制文件大小为161 MB，Windows安装程序的大小为118 MB。定价相同：个人版49美元，企业版149美元。现有许可证可继续使用——只需下载v2.0.0版本这些翻译模型会显示在“设置”→“模型”中。

下载 v2.0.0 →

发布 2026年5月20日

v1.6.16 — 个人语音训练功能现已上线

训练流程现已发布。现在，基于您自身声音的LoRA微调可在您的设备上端到端完成——该应用会自动选择合适的参数。 NVIDIA CUDA or CPU完成后会自动将训练好的模型导出为GGUF格式。在GUI中进行的每一次修改都会自动保存到您的本地训练数据集中；主窗口的训练卡片可让您一目了然地查看总样本数和训练时间。

额外好处：由于llama.cpp升级（版本b9222）解决了长音频片段中的数据块边界问题，所有语言下的语音键盘识别准确率均有所提升。每份付费许可证均附赠此功能。

工程学 2026年5月15日

v1.6.0 — 异步转录任务 + 单词级SRT优化

两款新的MCP工具已推出： start_transcription 会立即返回任务编号，以便代理可以处理其他工作。 get_transcription_status 进行完成度检测。一次处理一个任务，完成后立即显示结果。大型文件不会再阻塞代理循环。

此外还针对字级SRT/VTT输出进行了一系列优化：不再出现标点符号前的多余空格，不再有单独的句号标记，也不会有热词或上下文字符串渗入字幕内容。如此一来字幕更加整洁，无需再手动清理。

工程学 2026年5月15日

v1.5.0 — 已移除ONNX支持，运行时现在仅使用llama.cpp与libmtmd

对整个引擎进行了重写。Brethof Voice Pro现在可全程使用Qwen3-ASR进行处理。 llama.cpp 通过GGUF量化权重实现 libmtmdONNX Runtime 已被移除。其带来的好处包括：安装包更小（二进制文件大小约为 83 MB，而之前为 400 MB 以上）、冷启动速度更快，同时也不再需要处理针对不同平台的 CUDA/DirectML 版本问题。

Vulkan会自动识别您的GPU——无论是NVIDIA、AMD还是Intel Arc系列——在没有GPU时则会回退到CPU使用。同一引擎如今为所有后续功能提供支持：ASR、语音键盘、MCP服务器，以及（在2.0.0版本中）翻译功能。

工程学 2026年5月14日

v1.4.0 — MCP服务器首次亮相 + 多GPU设备选择器

Model Context Protocol服务器已启动。任何兼容MCP的AI智能体—— Claude桌面版, Claude Code, 光标, 克莱因 — 可通过标准输入输出进行转录处理（无需端口，也无需防火墙）。同一版本还提供了 多GPU设备选择器 这样你就可以选择哪款Vulkan GPU用于运行ASR，还有可选功能。 强制对齐工具 为每段转录内容添加单词级别的时间戳插件。

仅限付费版本——没有个人版或企业版许可证，MCP服务器将无法启动。 brethof-voice --mcp 这就是单行调用方式。

发展路线图 2026年4月16日

macOS版本正在开发中——首先支持Apple Silicon芯片。

发布前最常被问及的问题是“macOS何时推出？”。答案是：仍在积极开发中。首先推出的是采用Metal加速技术的Apple Silicon原生版本，随后才是Intel版本。目标发布时间为2026年第三季度，我们将在第二季度开启封闭测试。以下是正在开发的内容以及注册方式。

阅读文章 →

产品 2026年4月16日

个性化模型训练——根据个人声音对Brethof Voice Pro进行微调

Brethof Voice Pro支持实时个人语音训练功能。每次您纠正被错误识别的单词时，相关的音频片段及修正内容都会自动保存到您的本地训练数据集中。在“训练”选项卡中只需点击一下，即可针对您的口音对LoRA模型进行微调——该应用会自动选择NVIDIA CUDA或CPU作为计算引擎，随后将训练好的模型导出为GGUF格式。所有付费许可证均附赠此功能。

阅读文章 →

公告 2026年4月16日

Brethof Voice Pro现已上线——这款语音转文本工具会保存在您的设备上。

经过数月的研发，Brethof Voice Pro 1.0版本今日正式发布，支持Windows和Linux系统。该软件提供30种语音转写语言以及22种中文方言支持，具备完全离线转写功能、任意位置的热键听写功能，且为一次性定价，无需订阅。以下是此次发布版本所包含的功能，以及我们接下来的研发计划。

阅读文章 →

冠军们 2026年4月16日

共有1,800个免费许可证可供获取：冠军计划现已开放申请。

Champions计划今日启动，将持续至5月16日。每种支持的语言可免费获得50个个人许可证，总计1,800个；此外，未进入前50名的参赛者还可享受70%的折扣。以下是该计划的运作方式以及我们选择这种方式的原因。

阅读文章 →

许可授权 2026年4月16日

个人许可证现已涵盖个体经营及自由职业工作。

我们听取了撰稿人、顾问及译员们的初步反馈，他们认为原有的“仅限个人使用”说明容易引起混淆。现在售价49美元的个人许可证已明确允许个人及自由职业者进行商业用途使用。而售价149美元/位的企业许可证则是为团队设计的。以下是具体变更内容及其原因。

阅读文章 →

产品 2026年4月12日

30种转写语言，完全本地化的用户界面——而非机器翻译产生的冗长文本墙

Brethof Voice Pro现在能够以30种语言以及22种中文方言进行文字转录与展示，这些语言包括：阿拉伯语、粤语、汉语、捷克语、丹麦语、荷兰语、英语、菲律宾语、芬兰语、法语、德语、希腊语、印地语、匈牙利语、印度尼西亚语、意大利语、日语、韩语、马其顿语、马来语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、泰语、土耳其语和越南语。以下是该应用如何选择合适的语言版本，以及“完全翻译”究竟意味着什么。

阅读文章 →

工程学 2026年4月8日

我们为何从ONNX转向GGUF——速度更快、体积更小、更易于部署

Brethof Voice Pro的ASR后端基于llama.cpp以及经过GGUF格式量化的Qwen模型运行，而非ONNX Runtime。这样一来，安装文件体积更小（83 MB的exe文件，而传统版本超过400 MB），冷启动速度更快，而且无需再在各个平台上处理CUDA/DirectML相关的兼容问题。以下便是此次技术选型背后的故事。

阅读文章 →

原则 2026年4月4日

为何Brethof Voice Pro能够实现100%离线运行——以及这为何不仅仅是一项功能

所有主流的听写产品都会将用户的音频通过他人的服务器进行处理。我们认为这种设置是错误的默认选项。用户的音频属于最私人的数据——无论是医疗记录、法律文件、私人日记还是工作机密。正因如此，Brethof Voice Pro才没有云模式、没有“可选的遥测功能”，也无需账户即可进行转录。

阅读文章 →

在您的收件箱中获取更新。

创建账户，以便在我们发布新文章及推出新版本时收到通知。

创建账户

产品更新

v2.0.0 — 支持38种语言的离线翻译

v1.6.16 — 个人语音训练功能现已上线

v1.6.0 — 异步转录任务 + 单词级SRT优化

v1.5.0 — 已移除ONNX支持，运行时现在仅使用llama.cpp与libmtmd

v1.4.0 — MCP服务器首次亮相 + 多GPU设备选择器

macOS版本正在开发中——首先支持Apple Silicon芯片。

个性化模型训练——根据个人声音对Brethof Voice Pro进行微调

Brethof Voice Pro现已上线——这款语音转文本工具会保存在您的设备上。

共有1,800个免费许可证可供获取：冠军计划现已开放申请。

个人许可证现已涵盖个体经营及自由职业工作。

30种转写语言，完全本地化的用户界面——而非机器翻译产生的冗长文本墙

我们为何从ONNX转向GGUF——速度更快、体积更小、更易于部署

为何Brethof Voice Pro能够实现100%离线运行——以及这为何不仅仅是一项功能

在您的收件箱中获取更新。

我们打造的一切

Brethof Voice Pro

Brethof Mind

3D模型

3D打印

Nova

精选列表

指南

ComfyUI工作流

反作弊等级列表

关于Brethof AI

产品 更新

v2.0.0 — 支持38种语言的离线翻译

v1.6.16 — 个人语音训练功能现已上线

v1.6.0 — 异步转录任务 + 单词级SRT优化

v1.5.0 — 已移除ONNX支持，运行时现在仅使用llama.cpp与libmtmd

v1.4.0 — MCP服务器首次亮相 + 多GPU设备选择器

macOS版本正在开发中——首先支持Apple Silicon芯片。

个性化模型训练——根据个人声音对Brethof Voice Pro进行微调

Brethof Voice Pro现已上线——这款语音转文本工具会保存在您的设备上。

共有1,800个免费许可证可供获取：冠军计划现已开放申请。

个人许可证现已涵盖个体经营及自由职业工作。

30种转写语言，完全本地化的用户界面——而非机器翻译产生的冗长文本墙

我们为何从ONNX转向GGUF——速度更快、体积更小、更易于部署

为何Brethof Voice Pro能够实现100%离线运行——以及这为何不仅仅是一项功能

在您的收件箱中获取更新。

我们打造的一切

Brethof Voice Pro

Brethof Mind

3D模型

3D打印

Nova

精选列表

指南

ComfyUI工作流

反作弊等级列表

关于Brethof AI

产品更新