產品 更新

由 Brethof Voice Pro 團隊帶來的產品發布消息、Champions Program 相關新聞、新功能介紹,以及技術開發背後的故事。

發行 2026年5月21日

v2.0.0 — 38種語言嘅離線翻譯功能

Brethof Voice Pro 已不再僅限語音轉文字功能,v2.0.0 版本已正式推出。 離線翻譯 由腾讯提供技術支援 Hunyuan MT2 — 在 FLORES-200 (XCOMET-XXL) 中,7B 級別可達到 Google Gemini 3.1 Pro有97.9%嘅用戶滿意度,而且它在真實環境測試同少數語言測試中的表現都優於Gemini。翻譯全部在您的電腦上進行。提供兩種模型等級,按需下載:快速版(約1 GB,CPU或GPU上可在幾分之一秒內完成)以及高品質版(約4.3 GB,GPU上可在幾分之一秒內完成)。此外還有幾項期待已久的新增功能。

v2.0.0有咩新功能?

  • 轉錄 + 翻譯 — 個轉錄彈出視窗有個「翻譯為:」的下拉選單。ASR用於轉錄,MT用於翻譯,兩者會並排顯示結果。可用於檔案、麥克風以及系統音訊(會議通話的循環回放、瀏覽器分頁,以及從揚聲器播放的任何音訊)。
  • 多語言語音鍵盤 — 主行上嘅新翻譯晶片可顯示三欄式語言網格。選擇一個或多個目標語言,鍵盤就會輸出翻譯結果。佈局模式:每行一個,內聯式。EN: … || PL: …),或者只選第一個目標。
  • SRT / VTT字幕翻譯工具 — 保留時間軸同提示編號,支援雙語模式(每個提示顯示原文同翻譯文)。透過MCP供AI代理程式自動化使用。
  • 每個引擎多個 GPU — Settings → Models入面每個引擎都有獨立嘅裝置選擇器。可以在Vulkan 0上運行ASR,喺Vulkan 1上進行翻譯;或者喺VRAM資源有限的筆電上,將Hunyuan MT2 7B固定使用CPU。
  • 個人聲音訓練完全為即時模式 — 可以用自己的聲音進行 LoRA 微調,全程在自家電腦上完成。主界面的訓練資訊卡能一目了然地顯示總樣本數及錄製時間;訓練選項卡中的「開始訓練」會自動選擇 NVIDIA CUDA 或 CPU,然後將訓練完成的模型自動導出為 GGUF 格式。每購買一個付費許可證即可免費使用此功能。
  • 4款新嘅MCP工具translate_text, translate_srt, list_compute_devices, set_compute_device而家工具總數已經有19個。
  • 誠實的語言能夠分化對立。 — ASR:30種可選語言 + 自動辨識 + 22種粵語方言(合共52種)。翻譯功能:38種語言(33種主要語言 + 5種華語地區少數語言)。其中23種語言支持雙向翻譯。

Linux二進制檔大小為161 MB,Windows安裝程式則為118 MB。定價相同:個人版49美元,商業版149美元。現有許可證可繼續使用——只需 下載 v2.0.0 版本 而呢些翻譯模型會出現在「設定」→「模型」裡。

下載 v2.0.0 →
發行 2026年5月20日

v1.6.16 — 可進行個人語音訓練,已正式上線

訓練流程已上線。現在可在您的電腦上直接對您自己的聲音進行LoRA微調——應用程式會自動選擇 NVIDIA CUDA or CPU完成後會自動將訓練好的模型導出為 GGUF 格式。你在 GUI 中所做的每一項修正都會自動儲存到你的本地訓練數據集中;主窗口的訓練狀態欄可讓你一目了然地查看總樣本數及訓練時間。

額外好處:由於 llama.cpp 的升級(版本 b9222)修復了長片段中的區塊邊界問題,所有語言的語音鍵盤準確度皆有所提升。每個付費許可證均附贈此功能。

工程學 2026年5月15日

v1.6.0 — 串行轉錄任務 + 単字級別的 SRT 徹底優化

兩款新嘅MCP工具已經推出: start_transcription 即時返回工作編號,令代理人可以從事其他工作。 get_transcription_status 進行完成度測試。一次處理一個任務,完成後即顯示結果。大型檔案不再會阻礙代理循環。

另外還有一系列針對字級 SRT/VTT 輸出的修復:不再出現標點符號前的多餘空格,也不再有單獨的句點標記,更無熱詞或上下文字串洩漏到文字紀錄中。字幕更加乾淨整齊,無需人工清理。

工程學 2026年5月15日

v1.5.0 — 已移除 ONNX,運行時現在僅使用 llama.cpp + libmtmd

整個引擎重新編寫。Brethof Voice Pro 現在可透過 Qwen3-ASR 進行端到端處理。 llama.cpp 透過 GGUF 數量化權重實現 libmtmdONNX Runtime 已經被移除。其好處包括:安裝體積更小(二進制檔約 83 MB,原先為 400 MB 以上)、冷啟動速度更快,而且無需再應對不同平台上的 CUDA/DirectML 版本問題。

Vulkan會自動識別你的GPU——無論是NVIDIA、AMD還是Intel Arc——若沒有GPU則會轉而使用CPU。同一個引擎現在為所有相關功能提供支持:ASR、語音鍵盤、MCP伺服器,以及(在v2.0.0版本中)翻譯功能。

工程學 2026年5月14日

v1.4.0 — MCP伺服器首次亮相 + 多GPU裝置選擇器

Model Context Protocol伺服器已啟動。任何支援MCP嘅AI智能體—— Claude Desktop, Claude Code, 游標, Cline — 可以透過 stdio 進行轉錄(無端口、無防火牆)。同一個版本同時附帶 多 GPU 裝置選擇器 咁你就可以選擇用邊個 Vulkan GPU 來運行 ASR,再加上可選功能。 強制對齊工具 為每段轉錄內容添加字級時間戳的附加元件。

僅限付費版本——若沒有個人版或商業版授權,MCP伺服器將無法啟動。 brethof-voice --mcp 呢個就係一行式嘅調用方式。

發展藍圖 2026年4月16日

macOS版本正在開發中——率先採用Apple Silicon平台

發布前最常被問及的問題係「macOS何時推出?」答覆:正在積極開發中。會先推出採用 Apple Silicon 芯片並搭配 Metal 加速功能的版本,Intel 版則緊隨其後。目標時間為 2026 年第三季,而我哋將在第二季開放封閉測試。以下介紹正在開發的內容以及如何報名參與。

閱讀文章 →
產品 2026年4月16日

個人模型訓練 — 用自己嘅聲音對 Brethof Voice Pro 進行微調

Voice Pro 提供個人語音訓練功能。每次你修正被錯誤辨識的詞語時,相關的音頻片段同埋修正內容都會自動儲存到你的本地訓練數據集中。在「訓練」選項卡上只需點擊一次,就能根據你的口音微調 LoRA 模型——應用程式會自動選擇 NVIDIA CUDA 或 CPU,然後將訓練完成的模型自動導出為 GGUF 格式。每購買一個付費許可證即可免費使用此功能。

閱讀文章 →
公告 2026年4月16日

Brethof Voice Pro 已上線——一款可留在你電腦上的語音轉文字工具

經過數個月的開發,Voice Pro v1.0今日正式推出,支援Windows同Linux系統。它提供30種語言的轉錄功能以及22種粵語方言嘅轉錄,支援完全離線轉錄、任意位置嘅熱鍵聽寫,而且只需一次性付款,無需訂閱。以下係納入初版的功能,以及我哋接下來要開發嘅內容。

閱讀文章 →
冠軍們 2026年4月16日

有1,800個免費許可證可供申請:Champions計劃現已開放

Champions Program今日開放,持續到5月16日。每種支援嘅語言可獲得50個免費嘅Personal許可證——合共1,800個——而所有未能進入前50名嘅參賽者可享70%折扣。以下係其運作方式,以及我哋為何採取呢種做法。

閱讀文章 →
授權 2026年4月16日

個人許可證現在已涵蓋個體經營同自由職業工作。

我哋參考了撰稿人、顧問同翻譯人員嘅早期反饋,佢哋認為舊版嘅「僅限個人使用」說明令人困惑。現在價格為49美元嘅個人許可證已明確涵蓋個人及自由職業者嘅商業用途。而團隊用戶則需要購買每個席位149美元的企業許可證。以下係改動之處同原因。

閱讀文章 →
產品 2026年4月12日

30種轉錄語言,完整翻譯嘅用戶介面——而非機器翻譯出來嘅一大段文字

Brethof Voice Pro而家可以將語音轉錄並以30種外文語言同22種中文方言呈現:阿拉伯文、廣東話、中文、捷克文、丹麥文、荷蘭文、英語、菲律賓文、芬蘭文、法文、德文、希臘文、印地語、匈牙利語、印尼文、意大利文、日文、韓文、馬其頓文、馬來文、波斯文、波蘭文、葡萄牙文、羅馬尼亞文、俄文、西班牙文、瑞典文、泰文、土耳其文、越南文。以下介紹呢個應用如何選擇合適嘅翻譯方式,以及「完整翻譯」究竟係點樣嘅含義。

閱讀文章 →
工程學 2026年4月8日

點解我哋由 ONNX 改用 GGUF — 速度更快、體積更小,部署更簡單

Brethof Voice Pro嘅ASR後端係用llama.cpp同GGUF量化過嘅Qwen模型運作,而非ONNX Runtime。其結果係安裝檔體更小(83 MB嘅exe對比400MB以上),冷啟動速度更快,而且唔需要再喺每個平台上處理CUDA/DirectML相關嘅問題。以下就係進行呢次轉換嘅技術背後故事。

閱讀文章 →
原則 2026年4月4日

點解 Brethof Voice Pro 可以 100% 無線上運作——以及為何這不僅僅是一項功能

所有主流嘅聽寫產品都會將用戶嘅聲音傳送到其他人嘅伺服器上。我哋認為呢種設定係錯誤嘅。用戶嘅聲音係最私人化嘅資料——包括醫療記錄、法律文件、私人日記、工作機密等。正因如此,Brethof Voice Pro 才沒有雲端模式、沒有「可選的遠程監測功能」,亦不需要帳戶就能進行轉錄。

閱讀文章 →

即時收到更新郵件至您的收件匣。

建立帳戶,即可在我們發布新文章及推出新版本時獲得通知。

建立帳戶

我哋所打造的一切

外部:   YouTube · GitHub