產品 更新

來自 Brethof Voice Pro 團隊的發布消息、Champions Program 相關新聞、新功能介紹,以及技術開發背後的故事。

發行 2026年5月21日

v2.0.0 — 38種語言的離線翻譯功能

Brethof Voice Pro 已不再僅是語音轉文字功能,其 v2.0.0 版本已正式發布。 離線翻譯 由 Tencent 提供技術支援 Hunyuan MT2 — 在 FLORES-200(XCOMET-XXL)中,7B 級別可達到 Google Gemini 3.1 Pro 的 97.9%它在不僅在真實環境測試中,也在少數語言測試中表現優於 Gemini。翻譯過程完全在您的電腦上進行。提供兩種級別的模型,可依需求下載:快速版(約1 GB,使用 CPU 或 GPU 時可在幾分之一秒內完成)以及高品質版(約4.3 GB,使用 GPU 時也在幾分之一秒內完成)。此外還有幾項長期以來眾所期待的新增功能。

v2.0.0 的新功能有什麼?

  • 轉錄 + 翻譯 — Transcribe 弹出視窗中有一個「翻譯為:」的下拉選單。ASR 用於文字轉錄,MT 用於翻譯,兩者會並排顯示結果。可處理檔案、麥克風輸入以及系統音訊(如會議通話的環回錄音、瀏覽器分頁中的內容,或是從揚聲器播放的任何音訊)。
  • 多語言語音鍵盤 — 主行上的新翻譯芯片可顯示三欄式語言矩陣。選擇一個或多個目標語言,鍵盤便會輸出翻譯結果。佈局模式:每行一個、內聯式。EN: … || PL: …),或僅選擇第一個目標。
  • SRT / VTT 字幕翻譯工具 — 保留時間軸與提示索引,支援雙語模式(每個提示顯示原文與譯文)。可透過 MCP 提供給 AI 智能體使用以實現自動化。
  • 每個引擎多個 GPU — 在「設定」→「模型」中,每種引擎都有獨立的裝置選擇器。可在 Vulkan 0 上執行 ASR 處理,於 Vulkan 1 上執行翻譯處理;對於顯存有限的筆電,則可將 Hunyuan MT2 7B 固定在 CPU 上運作。
  • 個人語音訓練為全即時模式 — 可在您的電腦上對自己的聲音進行端到端的 LoRA 微調。主視窗中的訓練狀態欄可讓您一目了然地查看總樣本數及錄製時間;訓練選單中的「開始訓練」功能會自動選擇 NVIDIA CUDA 或 CPU,並將訓練完成的模型自動導出為 GGUF 格式。所有付費授權均附贈此功能。
  • 4款新的MCP工具translate_text, translate_srt, list_compute_devices, set_compute_device目前工具總數為 19 個。
  • 誠實的語言能夠化解矛盾。 — ASR:30種可選語言 + 自動偵測 + 22種中文方言(共52種)。翻譯功能:38種語言(33種主要語言 + 5種華語地區少數語言)。其中23種語言支持雙向翻譯。

Linux二進位檔案的大小為161 MB,Windows安裝程式的大小則為118 MB。定價相同:個人版49美元,企業版149美元。現有的授權可繼續使用——僅需 下載 v2.0.0 版本 而這些翻譯模型將出現在「設定」→「模型」中。

下載 v2.0.0 →
發行 2026年5月20日

v1.6.16 — 個人語音訓練功能已上線

訓練流程已上線。現在可在您的電腦上端到端執行針對您自身聲音的 LoRA 微調——應用程式會自動選擇合適的設定。 NVIDIA CUDA or 中央處理器完成後會自動將訓練好的模型匯出為 GGUF 格式。您在 GUI 中所做的每一項修正都會自動儲存到您的本地訓練資料集中;主視窗中的訓練狀態欄可讓您一目了然地查看總樣本數與訓練時間。

額外好處:由於 llama.cpp 的升級(版本 b9222)修復了長片段中的區塊邊界問題,所有語言的語音鍵盤準確度皆有所提升。每個付費授權均附贈此功能。

工程學 2026年5月15日

v1.6.0 — 非同步轉錄任務 + 逐字級的 SRT 調整

兩款新的 MCP 工具已推出: start_transcription 能立即返回工作識別碼,讓工作人員能從事其他工作。 get_transcription_status 進行完成度測試。一次處理一個任務,完成後即顯示結果。大型檔案不再會阻礙代理循環。

此外還有一系列針對字級 SRT/VTT 輸出的修正:不再出現標點符號前的多餘空格,也不再有單獨的句點標記,更無熱詞或上下文字串滲入文字檔中。如此一來字幕更加整潔,且無需人工清理。

工程學 2026年5月15日

v1.5.0 — 已移除 ONNX 支持,現在的運行時環境僅由 llama.cpp 與 libmtmd 構成

完整引擎重寫。Brethof Voice Pro 現在可透過 Qwen3-ASR 進行端到端的處理。 llama.cpp 透過 GGUF 量化權重實現 libmtmdONNX Runtime 已經被移除。其優點在於:安裝體積更小(二進位檔約 83 MB,原本為 400 MB 以上)、冷啟動速度更快,且不再需要處理不同平台上的 CUDA/DirectML 版本問題。

Vulkan會自動偵測您的GPU——無論是NVIDIA、AMD還是Intel Arc——若沒有GPU則會回退至CPU。同一個引擎現在也用於驅動所有後端功能:ASR、語音鍵盤、MCP伺服器,以及(在2.0.0版本中)翻譯功能。

工程學 2026年5月14日

v1.4.0 — MCP 伺服器首次亮相 + 多 GPU 裝置選擇功能

Model Context Protocol 伺服器已啟動。任何符合 MCP 標準的 AI 智能體—— Claude Desktop, Claude Code, 游標, Cline — 可透過 stdio 進行轉錄(無端口、無防火牆)。同一個版本也同時提供了 多 GPU 裝置選擇器 如此一來,您就能選擇哪個 Vulkan GPU 用於執行 ASR,還有可選的方案。 強制對齊工具 為每段轉錄內容添加詞級時間戳的附加元件。

僅限付費版本——若沒有個人版或企業版授權,MCP 伺服器將無法啟動。 brethof-voice --mcp 這就是一行式的呼叫方式。

發展藍圖 2026年4月16日

macOS 版本正在開發中——首先支援 Apple Silicon 處理器

發布前最常被問到的問題是「macOS何時推出?」答案是:仍在積極開發中。首先會推出採用 Metal 加速的 Apple Silicon 原生版本,之後才是 Intel 版本。預計時間為 2026 年第三季,而我們將在第二季度開放封閉測試。以下是目前的開發進度以及參與測試的註冊方式。

閱讀文章 →
產品 2026年4月16日

個人模型訓練——以您自己的聲音對 Brethof Voice Pro 進行微調

Voice Pro 支持即時的個人語音訓練功能。每當您修正被錯誤辨識的單字時,相關的音訊片段與修正內容都會自動儲存到您的本地訓練資料集中。在「訓練」選項卡中只需點擊一次,即可針對您的口音微調 LoRA 模型——應用程式會自動選擇 NVIDIA CUDA 或 CPU,然後將訓練完成的模型自動匯出為 GGUF 格式。所有付費授權版本皆附贈此功能。

閱讀文章 →
公告 2026年4月16日

Brethof Voice Pro 已正式上線——這款能將語音轉換為文字且資料會儲存在您電腦上的軟體。

經過數月的開發,Voice Pro v1.0今日正式發布,適用於 Windows 與 Linux 系統。它支援30種轉錄語言以及22種中文方言,具備完全離線轉錄功能、隨處使用的快捷鍵輸入方式,且為一次性購買,無需訂閱。以下是納入此初版的功能,以及我們接下來要努力的方向。

閱讀文章 →
冠軍們 2026年4月16日

有1,800個免費授權可供申請:Champions計劃現已開放。

Champions Program今日開放,持續至5月16日。每種受支援的語言可免費獲得50個個人許可證,總計1,800個;此外,未進入前50名的參賽者可享受70%的折扣。以下為其運作方式以及我們採取此方式的理由。

閱讀文章 →
授權事宜 2026年4月16日

個人許可證現已涵蓋個體經營及自由職業工作。

我們參考了撰稿人、顧問及翻譯人員的早期反饋,他們認為舊版的「僅限個人使用」說明令人困惑。現在價格為49美元的個人許可證已明確涵蓋個人及自由職業者的商業用途;而企業許可證(每個席位149美元)則適用於團隊。以下是所做的改動及其原因。

閱讀文章 →
產品 2026年4月12日

30種轉錄語言,完整翻譯的用戶介面——而非機器翻譯出的冗長文字串

Brethof Voice Pro 現在能以 30 種語言以及 22 種中文方言進行文字轉錄與呈現,這些語言包括:阿拉伯語、廣東語、漢語、捷克語、丹麥語、荷蘭語、英語、菲律賓語、芬蘭語、法語、德語、希臘語、印地語、匈牙利語、印尼語、義大利語、日語、韓語、馬其頓語、馬來語、波斯語、波蘭語、葡萄牙語、羅馬尼亞語、俄語、西班牙語、瑞典語、泰語、土耳其語、越南語。以下說明該應用如何選擇適當的翻譯方式,以及「完整翻譯」的真正含義。

閱讀文章 →
工程學 2026年4月8日

我們為何從 ONNX 轉向 GGUF——更快、體積更小,且更易部署

Brethof Voice Pro 的 ASR 後端是運行在 llama.cpp 上,並使用經 GGUF 數值量化處理的 Qwen 模型,而非 ONNX Runtime。其優點在於安裝檔體更小(83 MB 的 exe 檔,相比之下其他版本超過 400 MB)、冷啟動速度更快,且不必再在每個平台上處理 CUDA/DirectML 相關的問題。以下就是這次轉換背後的工程故事。

閱讀文章 →
原則 2026年4月4日

為何 Brethof Voice Pro 能夠 100% 離線運作——以及這為何不僅僅是一項功能

所有主流的聽寫產品都會將您的語音傳送到他人的伺服器上。我們認為這是錯誤的預設做法。您的語音是您所產生的最個人化的資料——無論是醫療記錄、法律文件、私人日記還是工作機密。正因如此,Voice Pro 才沒有雲端模式、沒有「可選的遠端監控功能」,也無需帳戶即可進行轉錄。

閱讀文章 →

將更新直接寄送至您的信箱。

建立帳戶,以便在我們發布新文章及推出新版本時收到通知。

建立帳戶

我們所打造的一切

外部:   YouTube · GitHub