更新內容 — Brethof Voice Pro

發行 2026年5月21日

v2.0.0 — 38種語言的離線翻譯功能

Brethof Voice Pro 已不再僅是語音轉文字功能，其 v2.0.0 版本已正式發布。 離線翻譯 由 Tencent 提供技術支援 Hunyuan MT2 — 在 FLORES-200（XCOMET-XXL）中，7B 級別可達到 Google Gemini 3.1 Pro 的 97.9%它在不僅在真實環境測試中，也在少數語言測試中表現優於 Gemini。翻譯過程完全在您的電腦上進行。提供兩種級別的模型，可依需求下載：快速版（約1 GB，使用 CPU 或 GPU 時可在幾分之一秒內完成）以及高品質版（約4.3 GB，使用 GPU 時也在幾分之一秒內完成）。此外還有幾項長期以來眾所期待的新增功能。

v2.0.0 的新功能有什麼？

轉錄 + 翻譯 — Transcribe 弹出視窗中有一個「翻譯為：」的下拉選單。ASR 用於文字轉錄，MT 用於翻譯，兩者會並排顯示結果。可處理檔案、麥克風輸入以及系統音訊（如會議通話的環回錄音、瀏覽器分頁中的內容，或是從揚聲器播放的任何音訊）。
多語言語音鍵盤 — 主行上的新翻譯芯片可顯示三欄式語言矩陣。選擇一個或多個目標語言，鍵盤便會輸出翻譯結果。佈局模式：每行一個、內聯式。EN: … || PL: …)，或僅選擇第一個目標。
SRT / VTT 字幕翻譯工具 — 保留時間軸與提示索引，支援雙語模式（每個提示顯示原文與譯文）。可透過 MCP 提供給 AI 智能體使用以實現自動化。
每個引擎多個 GPU — 在「設定」→「模型」中，每種引擎都有獨立的裝置選擇器。可在 Vulkan 0 上執行 ASR 處理，於 Vulkan 1 上執行翻譯處理；對於顯存有限的筆電，則可將 Hunyuan MT2 7B 固定在 CPU 上運作。
個人語音訓練為全即時模式 — 可在您的電腦上對自己的聲音進行端到端的 LoRA 微調。主視窗中的訓練狀態欄可讓您一目了然地查看總樣本數及錄製時間；訓練選單中的「開始訓練」功能會自動選擇 NVIDIA CUDA 或 CPU，並將訓練完成的模型自動導出為 GGUF 格式。所有付費授權均附贈此功能。
4款新的MCP工具 — translate_text, translate_srt, list_compute_devices, set_compute_device目前工具總數為 19 個。
誠實的語言能夠化解矛盾。 — ASR：30種可選語言 + 自動偵測 + 22種中文方言（共52種）。翻譯功能：38種語言（33種主要語言 + 5種華語地區少數語言）。其中23種語言支持雙向翻譯。

Linux二進位檔案的大小為161 MB，Windows安裝程式的大小則為118 MB。定價相同：個人版49美元，企業版149美元。現有的授權可繼續使用——僅需下載 v2.0.0 版本而這些翻譯模型將出現在「設定」→「模型」中。

下載 v2.0.0 →

發行 2026年5月20日

v1.6.16 — 個人語音訓練功能已上線

訓練流程已上線。現在可在您的電腦上端到端執行針對您自身聲音的 LoRA 微調——應用程式會自動選擇合適的設定。 NVIDIA CUDA or 中央處理器完成後會自動將訓練好的模型匯出為 GGUF 格式。您在 GUI 中所做的每一項修正都會自動儲存到您的本地訓練資料集中；主視窗中的訓練狀態欄可讓您一目了然地查看總樣本數與訓練時間。

額外好處：由於 llama.cpp 的升級（版本 b9222）修復了長片段中的區塊邊界問題，所有語言的語音鍵盤準確度皆有所提升。每個付費授權均附贈此功能。

工程學 2026年5月15日

v1.6.0 — 非同步轉錄任務 + 逐字級的 SRT 調整

兩款新的 MCP 工具已推出： start_transcription 能立即返回工作識別碼，讓工作人員能從事其他工作。 get_transcription_status 進行完成度測試。一次處理一個任務，完成後即顯示結果。大型檔案不再會阻礙代理循環。

此外還有一系列針對字級 SRT/VTT 輸出的修正：不再出現標點符號前的多餘空格，也不再有單獨的句點標記，更無熱詞或上下文字串滲入文字檔中。如此一來字幕更加整潔，且無需人工清理。

工程學 2026年5月15日

v1.5.0 — 已移除 ONNX 支持，現在的運行時環境僅由 llama.cpp 與 libmtmd 構成

完整引擎重寫。Brethof Voice Pro 現在可透過 Qwen3-ASR 進行端到端的處理。 llama.cpp 透過 GGUF 量化權重實現 libmtmdONNX Runtime 已經被移除。其優點在於：安裝體積更小（二進位檔約 83 MB，原本為 400 MB 以上）、冷啟動速度更快，且不再需要處理不同平台上的 CUDA/DirectML 版本問題。

Vulkan會自動偵測您的GPU——無論是NVIDIA、AMD還是Intel Arc——若沒有GPU則會回退至CPU。同一個引擎現在也用於驅動所有後端功能：ASR、語音鍵盤、MCP伺服器，以及（在2.0.0版本中）翻譯功能。

工程學 2026年5月14日

v1.4.0 — MCP 伺服器首次亮相 + 多 GPU 裝置選擇功能

Model Context Protocol 伺服器已啟動。任何符合 MCP 標準的 AI 智能體—— Claude Desktop, Claude Code, 游標, Cline — 可透過 stdio 進行轉錄（無端口、無防火牆）。同一個版本也同時提供了 多 GPU 裝置選擇器 如此一來，您就能選擇哪個 Vulkan GPU 用於執行 ASR，還有可選的方案。 強制對齊工具 為每段轉錄內容添加詞級時間戳的附加元件。

僅限付費版本——若沒有個人版或企業版授權，MCP 伺服器將無法啟動。 brethof-voice --mcp 這就是一行式的呼叫方式。

發展藍圖 2026年4月16日

macOS 版本正在開發中——首先支援 Apple Silicon 處理器

發布前最常被問到的問題是「macOS何時推出？」答案是：仍在積極開發中。首先會推出採用 Metal 加速的 Apple Silicon 原生版本，之後才是 Intel 版本。預計時間為 2026 年第三季，而我們將在第二季度開放封閉測試。以下是目前的開發進度以及參與測試的註冊方式。

閱讀文章 →

產品 2026年4月16日

個人模型訓練——以您自己的聲音對 Brethof Voice Pro 進行微調

Voice Pro 支持即時的個人語音訓練功能。每當您修正被錯誤辨識的單字時，相關的音訊片段與修正內容都會自動儲存到您的本地訓練資料集中。在「訓練」選項卡中只需點擊一次，即可針對您的口音微調 LoRA 模型——應用程式會自動選擇 NVIDIA CUDA 或 CPU，然後將訓練完成的模型自動匯出為 GGUF 格式。所有付費授權版本皆附贈此功能。

閱讀文章 →

公告 2026年4月16日

Brethof Voice Pro 已正式上線——這款能將語音轉換為文字且資料會儲存在您電腦上的軟體。

經過數月的開發，Voice Pro v1.0今日正式發布，適用於 Windows 與 Linux 系統。它支援30種轉錄語言以及22種中文方言，具備完全離線轉錄功能、隨處使用的快捷鍵輸入方式，且為一次性購買，無需訂閱。以下是納入此初版的功能，以及我們接下來要努力的方向。

閱讀文章 →

冠軍們 2026年4月16日

有1,800個免費授權可供申請：Champions計劃現已開放。

Champions Program今日開放，持續至5月16日。每種受支援的語言可免費獲得50個個人許可證，總計1,800個；此外，未進入前50名的參賽者可享受70%的折扣。以下為其運作方式以及我們採取此方式的理由。

閱讀文章 →

授權事宜 2026年4月16日

個人許可證現已涵蓋個體經營及自由職業工作。

我們參考了撰稿人、顧問及翻譯人員的早期反饋，他們認為舊版的「僅限個人使用」說明令人困惑。現在價格為49美元的個人許可證已明確涵蓋個人及自由職業者的商業用途；而企業許可證（每個席位149美元）則適用於團隊。以下是所做的改動及其原因。

閱讀文章 →

產品 2026年4月12日

30種轉錄語言，完整翻譯的用戶介面——而非機器翻譯出的冗長文字串

Brethof Voice Pro 現在能以 30 種語言以及 22 種中文方言進行文字轉錄與呈現，這些語言包括：阿拉伯語、廣東語、漢語、捷克語、丹麥語、荷蘭語、英語、菲律賓語、芬蘭語、法語、德語、希臘語、印地語、匈牙利語、印尼語、義大利語、日語、韓語、馬其頓語、馬來語、波斯語、波蘭語、葡萄牙語、羅馬尼亞語、俄語、西班牙語、瑞典語、泰語、土耳其語、越南語。以下說明該應用如何選擇適當的翻譯方式，以及「完整翻譯」的真正含義。

閱讀文章 →

工程學 2026年4月8日

我們為何從 ONNX 轉向 GGUF——更快、體積更小，且更易部署

Brethof Voice Pro 的 ASR 後端是運行在 llama.cpp 上，並使用經 GGUF 數值量化處理的 Qwen 模型，而非 ONNX Runtime。其優點在於安裝檔體更小（83 MB 的 exe 檔，相比之下其他版本超過 400 MB）、冷啟動速度更快，且不必再在每個平台上處理 CUDA/DirectML 相關的問題。以下就是這次轉換背後的工程故事。

閱讀文章 →

原則 2026年4月4日

為何 Brethof Voice Pro 能夠 100% 離線運作——以及這為何不僅僅是一項功能

所有主流的聽寫產品都會將您的語音傳送到他人的伺服器上。我們認為這是錯誤的預設做法。您的語音是您所產生的最個人化的資料——無論是醫療記錄、法律文件、私人日記還是工作機密。正因如此，Voice Pro 才沒有雲端模式、沒有「可選的遠端監控功能」，也無需帳戶即可進行轉錄。

閱讀文章 →

將更新直接寄送至您的信箱。

建立帳戶，以便在我們發布新文章及推出新版本時收到通知。

建立帳戶

產品更新

v2.0.0 — 38種語言的離線翻譯功能

v1.6.16 — 個人語音訓練功能已上線

v1.6.0 — 非同步轉錄任務 + 逐字級的 SRT 調整

v1.5.0 — 已移除 ONNX 支持，現在的運行時環境僅由 llama.cpp 與 libmtmd 構成

v1.4.0 — MCP 伺服器首次亮相 + 多 GPU 裝置選擇功能

macOS 版本正在開發中——首先支援 Apple Silicon 處理器

個人模型訓練——以您自己的聲音對 Brethof Voice Pro 進行微調

Brethof Voice Pro 已正式上線——這款能將語音轉換為文字且資料會儲存在您電腦上的軟體。

有1,800個免費授權可供申請：Champions計劃現已開放。

個人許可證現已涵蓋個體經營及自由職業工作。

30種轉錄語言，完整翻譯的用戶介面——而非機器翻譯出的冗長文字串

我們為何從 ONNX 轉向 GGUF——更快、體積更小，且更易部署

為何 Brethof Voice Pro 能夠 100% 離線運作——以及這為何不僅僅是一項功能

將更新直接寄送至您的信箱。

我們所打造的一切

Brethof Voice Pro

Brethof Mind

3D 模型

3D列印

Nova

精彩清單

指南

ComfyUI 工作流程

反作弊等級榜

關於 Brethof AI

產品 更新

v2.0.0 — 38種語言的離線翻譯功能

v1.6.16 — 個人語音訓練功能已上線

v1.6.0 — 非同步轉錄任務 + 逐字級的 SRT 調整

v1.5.0 — 已移除 ONNX 支持，現在的運行時環境僅由 llama.cpp 與 libmtmd 構成

v1.4.0 — MCP 伺服器首次亮相 + 多 GPU 裝置選擇功能

macOS 版本正在開發中——首先支援 Apple Silicon 處理器

個人模型訓練——以您自己的聲音對 Brethof Voice Pro 進行微調

Brethof Voice Pro 已正式上線——這款能將語音轉換為文字且資料會儲存在您電腦上的軟體。

有1,800個免費授權可供申請：Champions計劃現已開放。

個人許可證現已涵蓋個體經營及自由職業工作。

30種轉錄語言，完整翻譯的用戶介面——而非機器翻譯出的冗長文字串

我們為何從 ONNX 轉向 GGUF——更快、體積更小，且更易部署

為何 Brethof Voice Pro 能夠 100% 離線運作——以及這為何不僅僅是一項功能

將更新直接寄送至您的信箱。

我們所打造的一切

Brethof Voice Pro

Brethof Mind

3D 模型

3D列印

Nova

精彩清單

指南

ComfyUI 工作流程

反作弊等級榜

關於 Brethof AI

產品更新