Brethof Voice Pro团队带来的产品发布消息、Champions Program相关动态、新功能介绍以及幕后技术细节。
Brethof Voice Pro已不再仅仅是语音转文本功能,其v2.0.0版本现已发布。 离线翻译 由腾讯提供技术支持 Hunyuan MT2 — 在FLORES-200(XCOMET-XXL)中,7B层级已达到 Google Gemini 3.1 Pro的97.9%它还在真实场景测试及小语种测试中优于Gemini。翻译完全在您的设备上完成。提供两种型号,按需下载:快速版(约1GB,CPU或GPU环境下可在几分之一秒内完成)和高质量版(约4.3GB,GPU环境下可在几分之一秒内完成)。此外还包含几项期待已久的新增功能。
v2.0.0版本有哪些新功能?
EN: … || PL: …),或仅选择第一个目标。translate_text, translate_srt, list_compute_devices, set_compute_device目前工具总数为19个。Linux二进制文件大小为161 MB,Windows安装程序大小为118 MB。定价相同:个人版49美元,企业版149美元。现有许可证可继续使用——只需 下载v2.0.0版本 这些翻译模型会显示在“设置”→“模型”中。
下载 v2.0.0 →训练流程已发布。现在可在您的设备上端到端运行针对您自身声音的LoRA微调功能——该应用会自动选择 NVIDIA CUDA or CPU完成训练后会自动将训练好的模型导出为GGUF格式。在图形界面中进行的每一次修改都会自动保存到您的本地训练数据集中;主窗口的训练卡片可让您一目了然地查看总样本数和训练时长。
额外福利:由于llama.cpp升级(版本b9222)解决了长音频片段中的数据块边界问题,所有语言下的语音键盘识别准确率均有所提升。每份付费许可证均附赠此项功能。
两款新的MCP工具已推出: start_transcription 会立即返回任务编号,以便客服人员能够处理其他工作。 get_transcription_status 完成度检测。一次处理一个任务,完成后立即显示结果。大型文件不会再阻塞代理循环。
此外还有一系列针对单词级SRT/VTT输出的修复:标点符号前不再出现多余的空格,不会再有单独的句号标记,热词/上下文字符串也不会泄露到字幕中。这样得到的字幕更加整洁,无需手动清理。
整个引擎的全面重写。Brethof Voice Pro现在可全程使用Qwen3-ASR进行处理。 llama.cpp 通过GGUF量化权重实现 libmtmdONNX Runtime已经不再存在。其优势在于:安装包更小(二进制文件约83 MB,而之前超过400 MB),冷启动速度更快,且无需再处理针对不同平台的CUDA/DirectML版本问题。
Vulkan会自动识别您的GPU——无论是NVIDIA、AMD还是Intel Arc——在没有GPU时则会回退到CPU。同一引擎如今为所有后续功能提供支持:ASR、语音键盘、MCP服务器,以及(在2.0.0版本中)翻译功能。
Model Context Protocol服务器已启动。任何兼容MCP的AI智能体—— Claude Desktop, Claude Code, 光标, Cline — 可通过stdio实现转录功能(无需端口,无需防火墙)。同一版本还提供了 多GPU设备选择器 这样你就可以选择用于运行ASR的Vulkan GPU,还有可选功能。 强制对齐工具 为每段转录内容添加单词级的时间戳插件。
仅限付费版本——没有个人版或企业版许可证,MCP服务器将无法启动。 brethof-voice --mcp 这就是单行调用方式。
发布前最常被问及的问题是“macOS何时推出?”。答案是:正在积极开发中。首先推出支持Metal加速的Apple Silicon原生版本,随后才是Intel版本。目标时间为2026年第三季度——我们将在第二季度开启封闭测试版。以下是当前的开发进展以及注册方式。
阅读文章 →Brethof Voice Pro中提供了个性化语音训练功能。每次您纠正被错误识别的单词时,相应的音频片段及修正内容都会自动保存到您的本地训练数据集中。在“训练”选项卡中只需点击一下,即可针对您的口音微调LoRA模型——该应用会自动选择NVIDIA CUDA或CPU进行处理,随后将训练好的模型自动导出为GGUF格式。所有付费许可证均附赠此功能。
阅读文章 →经过数月的研发,Brethof Voice Pro v1.0今日正式发布,支持Windows和Linux系统。该软件提供30种转录语言以及22种中文方言支持,具备完全离线转录功能、任意位置的热键听写功能,且只需一次性付费无需订阅。以下是此次发布版本所包含的功能,以及我们接下来的研发计划。
阅读文章 →Champions Program已于今日启动,将持续至5月16日。每种支持的语言可免费获得50个个人许可证,总计1,800个;同时,未进入前50名的参赛者可享受70%的折扣。以下是该计划的运作方式以及我们选择这种方式的原因。
阅读文章 →我们听取了撰稿人、顾问及译员们的早期反馈,他们认为原有的“仅限个人使用”说明令人困惑。现价49美元的Personal许可证已明确涵盖个人及自由职业者的商业用途。而售价149美元/位的Business许可证则是为团队设计的。以下是具体变更内容及其原因。
阅读文章 →Brethof Voice Pro目前能够以30种语言以及22种中文方言进行文字转录与展示,这些语言包括:阿拉伯语、粤语、汉语、捷克语、丹麦语、荷兰语、英语、菲律宾语、芬兰语、法语、德语、希腊语、印地语、匈牙利语、印度尼西亚语、意大利语、日语、韩语、马其顿语、马来语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、泰语、土耳其语和越南语。以下是该应用如何选择合适的语言版本,以及“完全翻译”究竟意味着什么。
阅读文章 →Brethof Voice Pro的ASR后端基于llama.cpp以及经过GGUF量化处理的Qwen模型运行,而非ONNX Runtime。这样一来,安装文件体积更小(83 MB的exe文件,而传统版本超过400 MB),冷启动速度更快,而且无需再在各个平台上处理CUDA/DirectML相关的依赖问题。以下是此次技术转换背后的故事。
阅读文章 →所有主流的听写产品都会将您的声音传输到其他人的服务器上。我们认为这是错误的默认设置。您的声音是您产生的最私密的数据——无论是医疗记录、法律文件、私人日记还是工作机密。正因如此,Brethof Voice Pro才没有云模式、没有“可选的遥测功能”,也无需账户即可进行转录。
阅读文章 →A hangját megtanuló helyi beszédfelismerés. Életre szóló licenc. A zászlóshajónk.
Fizetős · zászlóshajó
Claude Code helyi hosszú távú memóriája – teljes szöveges, vektoros és gráf alapú, a SurrealDB-n. MIT.
INGYENES · nyílt forráskódú
Nyomtatásra kész digitális modellek. STL/3MF/OBJ formátumok benne. Életre szóló hozzáférés.
Fizetett · digitális katalógus
A nyomtatott terveink az egész Európában elérhetők. A tárgyat, ne a fájlt vegye meg.
Fizetett · fizikai tárgyak
Cyber-tiger AI host. A privacy-first AI magyarázva, vállalati szűrők nélkül.
Csatorna · élő
AI, MCP, helyi AI, Linux az AI számára és egyebek gondosan válogatott GitHub listái. Bizonyítékok, nem hangulat.
INGYENES · válogatott
Linux, Windows, macOS rendszereken futó helyi AI alkalmazásokhoz szóló részletes útmutatók. Valós konfigurációk, nem marketing.
INGYENES · hamarosan
Gyártásban bizonyított ComfyUI grafikonok – LTX darabolásos kör, a Nova pipeline és még sok más.
Ingyenes · munkafolyamatok landing
Negatív kurátorkodás: időpazarló gyakorlatok és eszközök rangsorolva. Nyugta kötelező.
INGYENES · hamarosan
Ki vagyunk, miért építünk helyi-first AI-t, és mit nem fogunk csinálni.