新版本 · v2.0.0

裏面嘅所有嘢 一個應用程式

轉錄 30種語言 + 22種粵語方言

翻譯 38種語言,完全離線使用

時間戳記 自己製作字幕

MCP伺服器 用你嘅 AI 平台同佢對話

可在本地運行——就算在筆電上亦然無需訂閱14日免費試用

Brethof Voice Pro — Main Screen
Brethof Voice Pro — Recording
🔒

完全隱私保護

你說的每一個字都會在您的裝置上進行處理。任何音頻、文字或元數據都唔會傳送到任何伺服器。冇雲端後端,冇遠端監控,冇分析功能,亦冇自動回傳功能。

  • 轉錄過程中完全無網絡呼叫。
  • 下載一次後儲存於本地的模型
  • 開源嘅 Qwen3-ASR 引擎——可完全審計

GPU加速

Brethof Voice Pro採用經GGUF優化且搭配lama.cpp嘅引擎,實現極速推論。出廠即支援所有三大主要GPU製造商嘅產品。

  • NVIDIA — Vulkan加速技術(GTX 10系列及更新款)
  • AMD — Vulkan加速技術(RX 500系列及更新款)
  • Intel — Vulkan加速技術(Arc GPU同埋集成圖形處理器)
  • CPU 备用方案 — 可以唔使 GPU 來運行,只不過速度會慢啲。
🌐

離線轉錄 — 30種語言 + 22種粵語方言

由 llama.cpp 驅動,搭配 Qwen3-ASR 使用。可鎖定特定語言以獲得最高準確度,或讓引擎自動辨識。所有資料皆會留在您的電腦上。

英語中文廣東話阿拉伯文 德文法文西班牙文葡萄牙文 義大利文荷蘭語俄文印度尼西亞語 韓文泰文越南文日文 土耳其文唔識。馬來語瑞典語 丹麥文芬蘭語打磨捷克語 菲律賓人波斯文希臘文羅馬尼亞語 匈牙利語馬其頓語

另外,當語言設定為中文或自動辨識時,會自動識別22種中文方言(安徽話、東北話、福建話、河南話、湖南話、山東話、四川話、吳語、閩南語等)。

💬

離線翻譯 — 38種語言 v2.0.0版本嘅新功能

可將任何轉錄內容、語音鍵盤輸出、純文字或字幕檔案進行翻譯——全部在您的電腦上完成。由……提供技術支持 Tencent Hunyuan MT2:在 FLORES-200 (XCOMET-XXL) 中,品質等級可達到 Google Gemini 3.1 Pro有97.9%嘅用戶滿意度 而緊湊型 Fast 級別嘅表現有 89.9%,喺真實環境測試(WildMTBench)同少數語言翻譯方面都優於 Gemini 3.1 Pro。

中文英語法文葡萄牙文 西班牙文日文土耳其文俄文 阿拉伯文韓文泰文義大利文 德文越南文馬來語印度尼西亞語 菲律賓人唔識。翻譯成粵語打磨 捷克語荷蘭語高棉語緬甸語 波斯文古吉拉特語烏爾都語泰盧固語 馬拉地語希伯來文孟加拉語泰米爾語 烏克蘭文廣東話藏文哈薩克語 蒙古文維吾爾語
  • 轉錄 + 翻譯 — 在「轉錄」彈出視窗中選擇目標語言;ASR用於轉錄,MT用於翻譯,兩者會並排顯示結果
  • 語音鍵盤翻譯 — 講話時,從三欄語言網格中選擇目標語言,鍵盤會輸入翻譯結果
  • 字幕翻譯工具 — SRT/VTT 檔案支援 38 種語言,亦可選擇雙語模式(每個時間軸顯示原文與翻譯文)。
  • 兩種模型等級 — 快速模式(約1 GB),在CPU或GPU上皆可在幾分之一秒內完成;高品質模式(約4.3 GB),在GPU上亦可在幾分之一秒內完成
  • 獨立裝置選擇器 — 用 Vulkan 0 執行 ASR,用 Vulkan 1 執行翻譯,或者兩者都用 CPU 執行。
📈

兩種模型尺寸

請根據您的電腦性能,選擇適合的準確度、速度與VRAM平衡方案。它們都採用相同的Qwen3-ASR架構;可隨時在「設定」→「模型」中進行切換。

  • 0.6B — 小型、快速,可在集成 GPU 或任何 4 GB+ 的 Vulkan 卡上運行。適合作為筆電的推薦預設選項。
  • 17億 — 可處理帶口音或雜音嘅音頻,精度更高。6 GB以上VRAM即可順利運行。在開源ASR技術中屬於最先進嘅級別。

可根據需要,透過「設定」→「模型」來下載選用附加組件。 強制對齊工具 (約540 MB)用於單字級時間戳。 Hunyuan MT2 Fast (約1 GB)或 品質 (約4.3 GB) 用於翻譯。

🎵

AI 專業降噪技術

為在嘈雜環境中錄製的音頻提供可選的 DeepFilter 噪音抑制功能——預設為關閉狀態,可從「噪音」彈出選項中啟用。對於乾淨的麥克風錄音而言,關閉此功能反而有助提升品質(DeepFilter 可能會對短時間、乾淨的音頻進行過度處理)。

  • 消除背景噪音、鍵盤按擊聲以及房間迴音。
  • 可調整的衰減功能
  • 無需額外硬體
  • 預設為關閉——可選擇每次錄製時啟用或持續開啟
🎓

個人語音訓練

可以使用 LoRA 用你自己的聲音對模型進行微調——整個過程都在你的電腦上端到端執行。每次你修正被錯誤辨識的詞語時,{clip, correction} 這對資料都會被儲存到你的本地訓練數據集中。主窗口中的訓練卡片能讓你一目了然地看到總樣本數及錄製時間——點擊它即可打開數據集瀏覽器,然後在訓練選項卡中選擇「開始訓練」。

  • 根據你的口音、方言同說話節奏進行調整
  • 修正內容會自動儲存——繼續使用該應用程式即可。
  • LoRA微調——快速、高效,無需完全重新訓練
  • 自動選擇 NVIDIA CUDA (cu128 PyTorch) 或者 CPU 後端系統
  • 完成後會自動將訓練好的模型導出為 GGUF 格式。
  • 你的語音資料絕對不會離開你的電腦。
  • 每張付費許可證均可免費使用
⌨️

語音鍵盤同直接文字輸入

按住熱鍵並說話,文字就會出現在游標所在的位置——就像使用鍵盤一樣。適用於瀏覽器、IDE、終端、聊天應用程式,任何能接受鍵盤輸入的文字欄位皆可使用。

  • 預設熱鍵 F9 — 可設定,可選擇持續錄音或切換模式
  • 可選擇以右鍵觸發,實現免持錄音
  • 即時翻譯晶片 — 用一種語言說話,鍵盤就會輸出翻譯結果。從三欄的網格中選擇一個或多個目標語言:每行一個,內聯顯示。EN: … || PL: …),或者只選第一個目標。
  • 可用於任何文字欄、編輯器、終端機或聊天軟體。
  • Linux 上嘅 X11 同 Wayland,Windows 上嘅原生輸入方式
📚

熱詞上下文與術語

一個裝置,兩種用途。可偏置使用 ASR 對於專有名詞、品牌名稱同專業術語而言——可避免“VFIO”被錯譯成“VEAF1”。同一欄位同時亦用於 翻譯術語詞典 — 設定「Brethof Voice」為固定值,令其在所有目標語言中皆保持「Brethof Voice」嘅名稱。

  • 喺設定入面添加詞彙——每行一個
  • 提升專有名詞同縮寫嘅識別準確度
  • 喺翻譯時會保留品牌名同技術術語嘅原貌。
  • 無需重新訓練——在推論時直接應用即可。
🤖

用於 AI Agent 的 MCP 伺服器 付費計劃

同一個用於運行 GUI 的二進制檔也可以作為模型上下文協定伺服器運行——有 19 種工具可以將 ASR 與 MT 功能提供給 Claude Desktop、Claude Code、Cursor、Cline 或任何支援 MCP 的代理程式。資料傳輸透過標準輸入輸出進行:無需端口、無需防火牆,也無需綁定到本地主機。代理程式負責掌控其整個生命週期。

  • 將音頻/視頻檔案、麥克風錄製的內容或系統音效轉寫為文字
  • 翻譯文本、SRT 或 VTT(支援雙語模式)
  • 即時切換 ASR 或 MT 計算裝置
  • 列出並切換個人語音檔案
  • 可以從該代理程式中讀取/寫入任何應用程式設定。

運行 brethof-voice --mcp 而且呢,呢個代理是透過標準輸入輸出來連接的。需要購買付費許可證——試用版用戶無法啟動伺服器。

準備好試一試嗎?

14日免費試用,所有功能全開放,無需信用卡。

我哋所打造的一切

外部:   YouTube · GitHub