由 Brethof Voice Pro 團隊帶來的產品發布消息、Champions Program 相關新聞、新功能介紹,以及技術開發背後的故事。
Brethof Voice Pro 已不再僅限語音轉文字功能,v2.0.0 版本已正式推出。 離線翻譯 由腾讯提供技術支援 Hunyuan MT2 — 在 FLORES-200 (XCOMET-XXL) 中,7B 級別可達到 Google Gemini 3.1 Pro有97.9%嘅用戶滿意度,而且它在真實環境測試同少數語言測試中的表現都優於Gemini。翻譯全部在您的電腦上進行。提供兩種模型等級,按需下載:快速版(約1 GB,CPU或GPU上可在幾分之一秒內完成)以及高品質版(約4.3 GB,GPU上可在幾分之一秒內完成)。此外還有幾項期待已久的新增功能。
v2.0.0有咩新功能?
EN: … || PL: …),或者只選第一個目標。translate_text, translate_srt, list_compute_devices, set_compute_device而家工具總數已經有19個。Linux二進制檔大小為161 MB,Windows安裝程式則為118 MB。定價相同:個人版49美元,商業版149美元。現有許可證可繼續使用——只需 下載 v2.0.0 版本 而呢些翻譯模型會出現在「設定」→「模型」裡。
下載 v2.0.0 →訓練流程已上線。現在可在您的電腦上直接對您自己的聲音進行LoRA微調——應用程式會自動選擇 NVIDIA CUDA or CPU完成後會自動將訓練好的模型導出為 GGUF 格式。你在 GUI 中所做的每一項修正都會自動儲存到你的本地訓練數據集中;主窗口的訓練狀態欄可讓你一目了然地查看總樣本數及訓練時間。
額外好處:由於 llama.cpp 的升級(版本 b9222)修復了長片段中的區塊邊界問題,所有語言的語音鍵盤準確度皆有所提升。每個付費許可證均附贈此功能。
兩款新嘅MCP工具已經推出: start_transcription 即時返回工作編號,令代理人可以從事其他工作。 get_transcription_status 進行完成度測試。一次處理一個任務,完成後即顯示結果。大型檔案不再會阻礙代理循環。
另外還有一系列針對字級 SRT/VTT 輸出的修復:不再出現標點符號前的多餘空格,也不再有單獨的句點標記,更無熱詞或上下文字串洩漏到文字紀錄中。字幕更加乾淨整齊,無需人工清理。
整個引擎重新編寫。Brethof Voice Pro 現在可透過 Qwen3-ASR 進行端到端處理。 llama.cpp 透過 GGUF 數量化權重實現 libmtmdONNX Runtime 已經被移除。其好處包括:安裝體積更小(二進制檔約 83 MB,原先為 400 MB 以上)、冷啟動速度更快,而且無需再應對不同平台上的 CUDA/DirectML 版本問題。
Vulkan會自動識別你的GPU——無論是NVIDIA、AMD還是Intel Arc——若沒有GPU則會轉而使用CPU。同一個引擎現在為所有相關功能提供支持:ASR、語音鍵盤、MCP伺服器,以及(在v2.0.0版本中)翻譯功能。
Model Context Protocol伺服器已啟動。任何支援MCP嘅AI智能體—— Claude Desktop, Claude Code, 游標, Cline — 可以透過 stdio 進行轉錄(無端口、無防火牆)。同一個版本同時附帶 多 GPU 裝置選擇器 咁你就可以選擇用邊個 Vulkan GPU 來運行 ASR,再加上可選功能。 強制對齊工具 為每段轉錄內容添加字級時間戳的附加元件。
僅限付費版本——若沒有個人版或商業版授權,MCP伺服器將無法啟動。 brethof-voice --mcp 呢個就係一行式嘅調用方式。
發布前最常被問及的問題係「macOS何時推出?」答覆:正在積極開發中。會先推出採用 Apple Silicon 芯片並搭配 Metal 加速功能的版本,Intel 版則緊隨其後。目標時間為 2026 年第三季,而我哋將在第二季開放封閉測試。以下介紹正在開發的內容以及如何報名參與。
閱讀文章 →Voice Pro 提供個人語音訓練功能。每次你修正被錯誤辨識的詞語時,相關的音頻片段同埋修正內容都會自動儲存到你的本地訓練數據集中。在「訓練」選項卡上只需點擊一次,就能根據你的口音微調 LoRA 模型——應用程式會自動選擇 NVIDIA CUDA 或 CPU,然後將訓練完成的模型自動導出為 GGUF 格式。每購買一個付費許可證即可免費使用此功能。
閱讀文章 →經過數個月的開發,Voice Pro v1.0今日正式推出,支援Windows同Linux系統。它提供30種語言的轉錄功能以及22種粵語方言嘅轉錄,支援完全離線轉錄、任意位置嘅熱鍵聽寫,而且只需一次性付款,無需訂閱。以下係納入初版的功能,以及我哋接下來要開發嘅內容。
閱讀文章 →Champions Program今日開放,持續到5月16日。每種支援嘅語言可獲得50個免費嘅Personal許可證——合共1,800個——而所有未能進入前50名嘅參賽者可享70%折扣。以下係其運作方式,以及我哋為何採取呢種做法。
閱讀文章 →我哋參考了撰稿人、顧問同翻譯人員嘅早期反饋,佢哋認為舊版嘅「僅限個人使用」說明令人困惑。現在價格為49美元嘅個人許可證已明確涵蓋個人及自由職業者嘅商業用途。而團隊用戶則需要購買每個席位149美元的企業許可證。以下係改動之處同原因。
閱讀文章 →Brethof Voice Pro而家可以將語音轉錄並以30種外文語言同22種中文方言呈現:阿拉伯文、廣東話、中文、捷克文、丹麥文、荷蘭文、英語、菲律賓文、芬蘭文、法文、德文、希臘文、印地語、匈牙利語、印尼文、意大利文、日文、韓文、馬其頓文、馬來文、波斯文、波蘭文、葡萄牙文、羅馬尼亞文、俄文、西班牙文、瑞典文、泰文、土耳其文、越南文。以下介紹呢個應用如何選擇合適嘅翻譯方式,以及「完整翻譯」究竟係點樣嘅含義。
閱讀文章 →Brethof Voice Pro嘅ASR後端係用llama.cpp同GGUF量化過嘅Qwen模型運作,而非ONNX Runtime。其結果係安裝檔體更小(83 MB嘅exe對比400MB以上),冷啟動速度更快,而且唔需要再喺每個平台上處理CUDA/DirectML相關嘅問題。以下就係進行呢次轉換嘅技術背後故事。
閱讀文章 →所有主流嘅聽寫產品都會將用戶嘅聲音傳送到其他人嘅伺服器上。我哋認為呢種設定係錯誤嘅。用戶嘅聲音係最私人化嘅資料——包括醫療記錄、法律文件、私人日記、工作機密等。正因如此,Brethof Voice Pro 才沒有雲端模式、沒有「可選的遠程監測功能」,亦不需要帳戶就能進行轉錄。
閱讀文章 →本地語音轉文字功能,可學習你嘅聲音。永久授權。我哋嘅旗艦產品。
已付款 · 旗艦店
Claude Code嘅本地長期記憶體——全文、向量、圖表,基於SurrealDB。MIT。
免費 · 開源
可直接列印嘅數碼模型,附有STL/3MF/OBJ格式。終身存取。
已付款 · 數碼目錄
我哋嘅印刷設計,運送全歐洲。買物件,唔係買檔案。
已付款 · 實體物品
Cyber-tiger AI 主機。以用戶私隱為首要的 AI 解釋,無企業干預。
頻道 · 現場直播
精心挑選嘅 GitHub 清單,涵蓋 AI、MCP、本地 AI、用於 AI 嘅 Linux 等主題。只講證據,唔講感覺。
免費 · 精選
關於喺 Linux、Windows、macOS 上運行本地 AI 嘅詳細操作指南。提供真實嘅配置參數,而非宣傳內容。
免費 · 即將推出
經過實際生產環境測試嘅 ComfyUI 圖表——LTX 分塊迴圈、Nova 流程,以及更多。
免費 · 工作流程登陸頁
負面篩選:浪費你時間嘅做法同工具,並附排名。需要提供收據。
免費 · 即將推出
我哋係邊個?點解要開發以本地為優先嘅 AI?以及有咩事情我哋唔會做?