产品 更新

Brethof Voice Pro团队带来的产品发布消息、Champions Program相关动态、新功能介绍以及幕后技术细节。

发布 2026年5月21日

v2.0.0 — 38种语言的离线翻译功能

Brethof Voice Pro已不再仅仅是语音转文本功能,其v2.0.0版本现已发布。 离线翻译 由腾讯提供技术支持 Hunyuan MT2 — 在FLORES-200(XCOMET-XXL)中,7B层级已达到 Google Gemini 3.1 Pro的97.9%它还在真实场景测试及小语种测试中优于Gemini。翻译完全在您的设备上完成。提供两种型号,按需下载:快速版(约1GB,CPU或GPU环境下可在几分之一秒内完成)和高质量版(约4.3GB,GPU环境下可在几分之一秒内完成)。此外还包含几项期待已久的新增功能。

v2.0.0版本有哪些新功能?

  • 转录 + 翻译 — Transcribe 弹出窗口中有一个“翻译为:”的下拉菜单。ASR 负责语音转录,MT 负责文本翻译,两者结果会并排显示。该功能可处理文件、麦克风输入以及系统音频(如会议通话的循环捕获、浏览器标签页中的音频、扬声器播放的任何声音)。
  • 多语言语音键盘 — 主行上的新翻译芯片可生成3列的语言网格。选择一个或多个目标语言,键盘便会输入对应翻译。布局模式:每行一个、内联式EN: … || PL: …),或仅选择第一个目标。
  • SRT / VTT字幕翻译工具 — 保留时间戳与提示索引,支持双语模式(每个提示包含原文行及译文)。可通过MCP实现AI智能体的自动化操作。
  • 每个引擎支持多GPU — “设置”→“模型”中为每种引擎提供了独立的设备选择器。可在Vulkan 0上运行ASR,在Vulkan 1上运行翻译功能;对于显存有限的笔记本电脑,则可将Hunyuan MT2 7B固定到CPU上使用。
  • 个人语音训练为完全实时模式 — 可在您的设备上对您自己的声音进行端到端的LoRA微调。主窗口的训练卡片可让您一目了然地查看总样本数及录制时长;“开始训练”选项会在训练标签页中自动选择NVIDIA CUDA或CPU,随后将训练好的模型自动导出为GGUF格式。所有付费许可证均附赠此项功能。
  • 4款新的MCP工具translate_text, translate_srt, list_compute_devices, set_compute_device目前工具总数为19个。
  • 真诚的语言能化解分歧 — ASR:30种可选语言+自动检测+22种中文方言(共计52种)。翻译功能:38种语言(33种主要语言+5种中国地区少数民族语言),其中23种支持双向翻译。

Linux二进制文件大小为161 MB,Windows安装程序大小为118 MB。定价相同:个人版49美元,企业版149美元。现有许可证可继续使用——只需 下载v2.0.0版本 这些翻译模型会显示在“设置”→“模型”中。

下载 v2.0.0 →
发布 2026年5月20日

v1.6.16 — 个人语音训练功能现已上线

训练流程已发布。现在可在您的设备上端到端运行针对您自身声音的LoRA微调功能——该应用会自动选择 NVIDIA CUDA or CPU完成训练后会自动将训练好的模型导出为GGUF格式。在图形界面中进行的每一次修改都会自动保存到您的本地训练数据集中;主窗口的训练卡片可让您一目了然地查看总样本数和训练时长。

额外福利:由于llama.cpp升级(版本b9222)解决了长音频片段中的数据块边界问题,所有语言下的语音键盘识别准确率均有所提升。每份付费许可证均附赠此项功能。

工程学 2026年5月15日

v1.6.0 — 异步转录任务 + 单词级SRT优化

两款新的MCP工具已推出: start_transcription 会立即返回任务编号,以便客服人员能够处理其他工作。 get_transcription_status 完成度检测。一次处理一个任务,完成后立即显示结果。大型文件不会再阻塞代理循环。

此外还有一系列针对单词级SRT/VTT输出的修复:标点符号前不再出现多余的空格,不会再有单独的句号标记,热词/上下文字符串也不会泄露到字幕中。这样得到的字幕更加整洁,无需手动清理。

工程学 2026年5月15日

v1.5.0 — 已移除ONNX支持,运行时现在仅使用llama.cpp与libmtmd

整个引擎的全面重写。Brethof Voice Pro现在可全程使用Qwen3-ASR进行处理。 llama.cpp 通过GGUF量化权重实现 libmtmdONNX Runtime已经不再存在。其优势在于:安装包更小(二进制文件约83 MB,而之前超过400 MB),冷启动速度更快,且无需再处理针对不同平台的CUDA/DirectML版本问题。

Vulkan会自动识别您的GPU——无论是NVIDIA、AMD还是Intel Arc——在没有GPU时则会回退到CPU。同一引擎如今为所有后续功能提供支持:ASR、语音键盘、MCP服务器,以及(在2.0.0版本中)翻译功能。

工程学 2026年5月14日

v1.4.0 — MCP服务器首次亮相 + 多GPU设备选择器

Model Context Protocol服务器已启动。任何兼容MCP的AI智能体—— Claude Desktop, Claude Code, 光标, Cline — 可通过stdio实现转录功能(无需端口,无需防火墙)。同一版本还提供了 多GPU设备选择器 这样你就可以选择用于运行ASR的Vulkan GPU,还有可选功能。 强制对齐工具 为每段转录内容添加单词级的时间戳插件。

仅限付费版本——没有个人版或企业版许可证,MCP服务器将无法启动。 brethof-voice --mcp 这就是单行调用方式。

发展路线图 2026年4月16日

macOS版本正在开发中——首先支持Apple Silicon芯片。

发布前最常被问及的问题是“macOS何时推出?”。答案是:正在积极开发中。首先推出支持Metal加速的Apple Silicon原生版本,随后才是Intel版本。目标时间为2026年第三季度——我们将在第二季度开启封闭测试版。以下是当前的开发进展以及注册方式。

阅读文章 →
产品 2026年4月16日

个人模型训练——根据您自己的声音对Brethof Voice Pro进行微调

Brethof Voice Pro中提供了个性化语音训练功能。每次您纠正被错误识别的单词时,相应的音频片段及修正内容都会自动保存到您的本地训练数据集中。在“训练”选项卡中只需点击一下,即可针对您的口音微调LoRA模型——该应用会自动选择NVIDIA CUDA或CPU进行处理,随后将训练好的模型自动导出为GGUF格式。所有付费许可证均附赠此功能。

阅读文章 →
公告 2026年4月16日

Brethof Voice Pro现已上线——可保存在设备上的语音转文本功能

经过数月的研发,Brethof Voice Pro v1.0今日正式发布,支持Windows和Linux系统。该软件提供30种转录语言以及22种中文方言支持,具备完全离线转录功能、任意位置的热键听写功能,且只需一次性付费无需订阅。以下是此次发布版本所包含的功能,以及我们接下来的研发计划。

阅读文章 →
冠军们 2026年4月16日

有1,800个免费许可证可供获取:冠军计划现已开放申请

Champions Program已于今日启动,将持续至5月16日。每种支持的语言可免费获得50个个人许可证,总计1,800个;同时,未进入前50名的参赛者可享受70%的折扣。以下是该计划的运作方式以及我们选择这种方式的原因。

阅读文章 →
Licencelés 2026年4月16日

个人许可证现已涵盖个体经营及自由职业工作。

我们听取了撰稿人、顾问及译员们的早期反馈,他们认为原有的“仅限个人使用”说明令人困惑。现价49美元的Personal许可证已明确涵盖个人及自由职业者的商业用途。而售价149美元/位的Business许可证则是为团队设计的。以下是具体变更内容及其原因。

阅读文章 →
产品 2026年4月12日

30种转录语言,完全本地化的用户界面——而非机器翻译生成的冗长文本墙

Brethof Voice Pro目前能够以30种语言以及22种中文方言进行文字转录与展示,这些语言包括:阿拉伯语、粤语、汉语、捷克语、丹麦语、荷兰语、英语、菲律宾语、芬兰语、法语、德语、希腊语、印地语、匈牙利语、印度尼西亚语、意大利语、日语、韩语、马其顿语、马来语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、泰语、土耳其语和越南语。以下是该应用如何选择合适的语言版本,以及“完全翻译”究竟意味着什么。

阅读文章 →
工程学 2026年4月8日

为何我们从ONNX转向GGUF——速度更快、体积更小、部署更便捷

Brethof Voice Pro的ASR后端基于llama.cpp以及经过GGUF量化处理的Qwen模型运行,而非ONNX Runtime。这样一来,安装文件体积更小(83 MB的exe文件,而传统版本超过400 MB),冷启动速度更快,而且无需再在各个平台上处理CUDA/DirectML相关的依赖问题。以下是此次技术转换背后的故事。

阅读文章 →
原则 2026年4月4日

为何Brethof Voice Pro能够实现100%离线运行——以及这为何不仅仅是一项功能

所有主流的听写产品都会将您的声音传输到其他人的服务器上。我们认为这是错误的默认设置。您的声音是您产生的最私密的数据——无论是医疗记录、法律文件、私人日记还是工作机密。正因如此,Brethof Voice Pro才没有云模式、没有“可选的遥测功能”,也无需账户即可进行转录。

阅读文章 →

在您的收件箱中获取更新。

创建一个账户,以便在我们发布新文章和推出新版本时收到通知。

创建账户

Minden, amit építünk

Külső:   YouTube · GitHub