全新版本 · v2.0.0

其中的所有內容 一個應用程式

轉錄 30種語言 + 22種中文方言

翻譯 38種語言,完全離線使用

時間戳記 自行製作字幕

MCP 伺服器 從您的 AI 平台與其對話

可在本地運行——即便在筆電上亦然無需訂閱14天免費試用

Brethof Voice Pro — Main Screen
Brethof Voice Pro — Recording
🔒

完全的隱私保護

您說的每一個字都會在您的裝置上進行處理。沒有任何音訊、文字或元資料會被傳送到任何伺服器。沒有雲端後端、沒有遠端監控、沒有分析功能,也沒有資料回傳。

  • 轉錄過程中無任何網路呼叫。
  • 下載一次後儲存在本地的模型
  • 開源的 Qwen3-ASR 引擎——完全可審計

GPU 加速

Brethof Voice Pro 採用經 GGUF 最優化且基於 llama.cpp 的引擎,實現極快的推論速度。出廠即支援所有三大主要 GPU 廠商的產品。

  • NVIDIA — Vulkan 加速功能(GTX 10 系列及更新款)
  • AMD — Vulkan 加速功能(RX 500 系列及更新款)
  • Intel — Vulkan 加速(Arc GPU及整合式圖形處理器)
  • CPU 备用方案 — 可在無 GPU 的環境下運作,只是速度較慢
🌐

離線轉錄 — 30種語言 + 22種中文方言

由 llama.cpp 驅動的 Qwen3-ASR 模組。可鎖定特定語言以獲得最高準確度,或讓引擎自動辨識。所有文字資料皆保留在您的電腦上。

英文中文廣東話阿拉伯文 德語法語西班牙語葡萄牙語 義大利語荷蘭語俄語印度尼西亞語 韓文泰語越南語日文 土耳其語無法翻譯馬來語瑞典語 丹麥語芬蘭語打磨捷克語 菲律賓語波斯語Greek羅馬尼亞語 匈牙利語馬其頓語

此外,當語言設定為中文或自動辨識時,還會自動辨識22種中文方言(安徽話、東北話、福建話、河南話、湖南話、山東話、四川話、吳語、閩南語等)。

💬

離線翻譯 — 38種語言 v2.0.0 的新功能

可將任何轉錄內容、語音鍵盤輸出、純文字或字幕檔案進行翻譯——全部在您的電腦上完成。由……提供技術支持。 騰訊 Hunyuan MT2在 FLORES-200 (XCOMET-XXL) 中,品質等級可達到 Google Gemini 3.1 Pro 的 97.9% 其緊湊型 Fast 級別的翻譯準確率達 89.9%,且在真實環境測試(WildMTBench)以及少數語言翻譯方面,其表現也優於 Gemini 3.1 Pro。

中文英文法語葡萄牙語 西班牙語日文土耳其語俄語 阿拉伯文韓文泰語義大利語 德語越南語馬來語印度尼西亞語 菲律賓語無法翻譯繁體中文打磨 捷克語荷蘭語高棉語緬甸語 波斯語古吉拉特語烏爾都語泰盧固語 馬拉地語希伯來語孟加拉語泰米爾語 烏克蘭語廣東話藏文哈薩克語 蒙古文維吾爾語
  • 轉錄 + 翻譯 — 在「轉錄」彈出視窗中選擇目標語言;ASR用於轉錄,MT用於翻譯,兩者會並排顯示結果。
  • 語音鍵盤翻譯 — 語音輸入,從三欄語言矩陣中選擇目標,鍵盤則用來輸入翻譯內容
  • 字幕翻譯工具 — 38種語言的SRT/VTT檔案,並提供選擇性的雙語模式(每個時間軸顯示原文與翻譯文)。
  • 兩種模型等級 — 在 CPU 或 GPU 上,快速模式(約 1 GB)的處理時間在幾分之一秒內;高品質模式(約 4.3 GB)的處理時間也在幾分之一秒內。
  • 獨立裝置選擇器 — 在 Vulkan 0 上執行 ASR,於 Vulkan 1 上執行翻譯,或兩者皆在 CPU 上執行。
📈

兩種模型尺寸

選擇適合您電腦的精確度、速度與 VRAM 之間的平衡點。這兩者皆採用相同的 Qwen3-ASR 架構;可隨時在「設定」→「模型」中進行切換。

  • 0.6B — 小型且快速,可在整合式 GPU 或任何 4 GB 以上的 Vulkan 顯卡上運行。是筆電的推薦預設選項。
  • 17億 — 能處理帶口音或雜音的音訊,且精度更高。6 GB以上 VRAM 即可順利運作。在開源 ASR 技術中屬於最先進的級別。

可根據需求,從「設定」→「模型」中下載選用附加元件: 強制對齊工具 (約 540 MB)用於單字級時間戳。 Hunyuan MT2 Fast (約 1 GB)或 品質 翻譯時需約 4.3 GB 的空間。

🎵

AI 噪音減少功能

為在嘈雜環境中錄製的音檔提供可選的 DeepFilter 噪聲抑制功能——預設為關閉狀態,可從「噪聲」彈出式選單中啟用。對於乾淨的麥克風錄音而言,關閉此功能反而有助提升品質(DeepFilter 可能會對短時間、乾淨的音訊進行過度處理)。

  • 可去除背景雜音、鍵盤按擊聲以及房間迴音。
  • 可設定的衰減功能
  • 不需要額外的硬體。
  • 預設為關閉——可選擇每次錄製時啟用或持續開啟
🎓

個人語音訓練

可利用 LoRA 以您自己的聲音對模型進行微調——整個過程都在您的電腦上端到端執行。每次您修正被錯誤辨識的詞語時,該{clip, correction}對組都會被儲存到您的本地訓練資料集中。主視窗中的訓練狀態卡能讓您一目了然地查看總樣本數及錄製時間——點擊它即可打開資料集瀏覽器,接著在訓練選單中按下「開始訓練」。

  • 可根據您的口音、方言及說話節奏進行調整
  • 修正內容已自動儲存——繼續使用該應用程式即可。
  • LoRA微調——快速、高效,且無需完整重新訓練
  • 自動選取 NVIDIA CUDA (cu128 PyTorch) 或 中央處理器 後端
  • 訓練完成後會自動將訓練好的模型匯出為 GGUF 格式。
  • 您的語音資料絕不會離開您的裝置。
  • 每個付費授權皆可免費使用
⌨️

語音鍵盤與直接文字輸入

按住熱鍵並說話,文字就會出現在游標所在的位置——就像使用鍵盤一樣。適用於瀏覽器、IDE、終端、聊天應用程式,以及任何能接受鍵盤輸入的文字欄位。

  • 預設熱鍵 F9 — 可設定為按住錄製或切換模式
  • 可選的滑鼠右鍵觸發功能,適用於免持錄音。
  • 即時翻譯晶片 — 以一種語言說話,鍵盤便會輸出翻譯結果。從三欄的網格中選擇一個或多個目標語言:每行選一個,以內聯方式顯示。EN: … || PL: …),或僅選擇第一個目標。
  • 可適用於任何文字欄、編輯器、終端機或聊天軟體。
  • Linux 上的 X11 與 Wayland,Windows 上的原生輸入功能
📚

熱詞上下文與術語

一個格式,兩種用途。可進行偏置處理 ASR 對於專有名詞、品牌名稱及行業術語而言,可避免“VFIO”被錯誤翻譯成“VEAF1”。同一欄位同時也用於 翻譯術語詞典 — 將「Brethof Voice」設為固定值,如此在所有目標語言中皆會顯示為「Brethof Voice」。

  • 在設定中新增條目——每行一個
  • 提升專有名詞與縮寫的辨識能力
  • 在翻譯時保留品牌名稱與技術術語。
  • 無需重新訓練——可在推論時直接使用
🤖

用於 AI 智能體的 MCP 伺服器 付費方案

運行 GUI 的同一個二進位檔案也可作為模型上下文協定伺服器使用——共有 19 種工具,能將 ASR 與 MT 功能提供給 Claude Desktop、Claude Code、Cursor、Cline 或任何支援 MCP 的代理程式。資料傳輸採用標準輸入輸出方式:無需端口、無防火牆設定,也不需要綁定到本機主機。代理程式負責掌控其整個生命週期。

  • 將音訊/影片檔案、麥克風錄製的內容或系統音訊轉寫為文字
  • 可翻譯文字、SRT 或 VTT格式(支援雙語模式)
  • 即時切換 ASR 或 MT 計算裝置
  • 列出並切換個人語音檔案
  • 從代理程式中讀取/寫入任何應用程式設定

運行 brethof-voice --mcp 且該代理程式透過 stdio 進行連線。需要購買付費授權——試用版使用者無法啟動伺服器。

準備好試用了嗎?

14天免費試用,所有功能全開放,無需信用卡。

我們所打造的一切

外部:   YouTube · GitHub