功能特色 — Brethof Voice Pro

🔒

完全的隱私保護

您說的每一個字都會在您的裝置上進行處理。沒有任何音訊、文字或元資料會被傳送到任何伺服器。沒有雲端後端、沒有遠端監控、沒有分析功能，也沒有資料回傳。

轉錄過程中無任何網路呼叫。
下載一次後儲存在本地的模型
開源的 Qwen3-ASR 引擎——完全可審計

⚡

GPU 加速

Brethof Voice Pro 採用經 GGUF 最優化且基於 llama.cpp 的引擎，實現極快的推論速度。出廠即支援所有三大主要 GPU 廠商的產品。

NVIDIA — Vulkan 加速功能（GTX 10 系列及更新款）
AMD — Vulkan 加速功能（RX 500 系列及更新款）
Intel — Vulkan 加速（Arc GPU及整合式圖形處理器）
CPU 备用方案 — 可在無 GPU 的環境下運作，只是速度較慢

🌐

離線轉錄 — 30種語言 + 22種中文方言

由 llama.cpp 驅動的 Qwen3-ASR 模組。可鎖定特定語言以獲得最高準確度，或讓引擎自動辨識。所有文字資料皆保留在您的電腦上。

英文中文廣東話阿拉伯文德語法語西班牙語葡萄牙語義大利語荷蘭語俄語印度尼西亞語韓文泰語越南語日文土耳其語無法翻譯馬來語瑞典語丹麥語芬蘭語打磨捷克語菲律賓語波斯語Greek羅馬尼亞語匈牙利語馬其頓語

此外，當語言設定為中文或自動辨識時，還會自動辨識22種中文方言（安徽話、東北話、福建話、河南話、湖南話、山東話、四川話、吳語、閩南語等）。

💬

離線翻譯 — 38種語言 v2.0.0 的新功能

可將任何轉錄內容、語音鍵盤輸出、純文字或字幕檔案進行翻譯——全部在您的電腦上完成。由……提供技術支持。 騰訊 Hunyuan MT2在 FLORES-200 (XCOMET-XXL) 中，品質等級可達到 Google Gemini 3.1 Pro 的 97.9% 其緊湊型 Fast 級別的翻譯準確率達 89.9%，且在真實環境測試（WildMTBench）以及少數語言翻譯方面，其表現也優於 Gemini 3.1 Pro。

中文英文法語葡萄牙語西班牙語日文土耳其語俄語阿拉伯文韓文泰語義大利語德語越南語馬來語印度尼西亞語菲律賓語無法翻譯繁體中文打磨捷克語荷蘭語高棉語緬甸語波斯語古吉拉特語烏爾都語泰盧固語馬拉地語希伯來語孟加拉語泰米爾語烏克蘭語廣東話藏文哈薩克語蒙古文維吾爾語

轉錄 + 翻譯 — 在「轉錄」彈出視窗中選擇目標語言；ASR用於轉錄，MT用於翻譯，兩者會並排顯示結果。
語音鍵盤翻譯 — 語音輸入，從三欄語言矩陣中選擇目標，鍵盤則用來輸入翻譯內容
字幕翻譯工具 — 38種語言的SRT/VTT檔案，並提供選擇性的雙語模式（每個時間軸顯示原文與翻譯文）。
兩種模型等級 — 在 CPU 或 GPU 上，快速模式（約 1 GB）的處理時間在幾分之一秒內；高品質模式（約 4.3 GB）的處理時間也在幾分之一秒內。
獨立裝置選擇器 — 在 Vulkan 0 上執行 ASR，於 Vulkan 1 上執行翻譯，或兩者皆在 CPU 上執行。

📈

兩種模型尺寸

選擇適合您電腦的精確度、速度與 VRAM 之間的平衡點。這兩者皆採用相同的 Qwen3-ASR 架構；可隨時在「設定」→「模型」中進行切換。

0.6B — 小型且快速，可在整合式 GPU 或任何 4 GB 以上的 Vulkan 顯卡上運行。是筆電的推薦預設選項。
17億 — 能處理帶口音或雜音的音訊，且精度更高。6 GB以上 VRAM 即可順利運作。在開源 ASR 技術中屬於最先進的級別。

可根據需求，從「設定」→「模型」中下載選用附加元件： 強制對齊工具 （約 540 MB）用於單字級時間戳。 Hunyuan MT2 Fast （約 1 GB）或品質翻譯時需約 4.3 GB 的空間。

🎵

AI 噪音減少功能

為在嘈雜環境中錄製的音檔提供可選的 DeepFilter 噪聲抑制功能——預設為關閉狀態，可從「噪聲」彈出式選單中啟用。對於乾淨的麥克風錄音而言，關閉此功能反而有助提升品質（DeepFilter 可能會對短時間、乾淨的音訊進行過度處理）。

可去除背景雜音、鍵盤按擊聲以及房間迴音。
可設定的衰減功能
不需要額外的硬體。
預設為關閉——可選擇每次錄製時啟用或持續開啟

🎓

個人語音訓練

可利用 LoRA 以您自己的聲音對模型進行微調——整個過程都在您的電腦上端到端執行。每次您修正被錯誤辨識的詞語時，該{clip, correction}對組都會被儲存到您的本地訓練資料集中。主視窗中的訓練狀態卡能讓您一目了然地查看總樣本數及錄製時間——點擊它即可打開資料集瀏覽器，接著在訓練選單中按下「開始訓練」。

可根據您的口音、方言及說話節奏進行調整
修正內容已自動儲存——繼續使用該應用程式即可。
LoRA微調——快速、高效，且無需完整重新訓練
自動選取 NVIDIA CUDA (cu128 PyTorch) 或 中央處理器 後端
訓練完成後會自動將訓練好的模型匯出為 GGUF 格式。
您的語音資料絕不會離開您的裝置。
每個付費授權皆可免費使用

⌨️

語音鍵盤與直接文字輸入

按住熱鍵並說話，文字就會出現在游標所在的位置——就像使用鍵盤一樣。適用於瀏覽器、IDE、終端、聊天應用程式，以及任何能接受鍵盤輸入的文字欄位。

預設熱鍵 F9 — 可設定為按住錄製或切換模式
可選的滑鼠右鍵觸發功能，適用於免持錄音。
即時翻譯晶片 — 以一種語言說話，鍵盤便會輸出翻譯結果。從三欄的網格中選擇一個或多個目標語言：每行選一個，以內聯方式顯示。EN: … || PL: …)，或僅選擇第一個目標。
可適用於任何文字欄、編輯器、終端機或聊天軟體。
Linux 上的 X11 與 Wayland，Windows 上的原生輸入功能

📚

熱詞上下文與術語

一個格式，兩種用途。可進行偏置處理 ASR 對於專有名詞、品牌名稱及行業術語而言，可避免“VFIO”被錯誤翻譯成“VEAF1”。同一欄位同時也用於 翻譯術語詞典 — 將「Brethof Voice」設為固定值，如此在所有目標語言中皆會顯示為「Brethof Voice」。

在設定中新增條目——每行一個
提升專有名詞與縮寫的辨識能力
在翻譯時保留品牌名稱與技術術語。
無需重新訓練——可在推論時直接使用

🤖

用於 AI 智能體的 MCP 伺服器付費方案

運行 GUI 的同一個二進位檔案也可作為模型上下文協定伺服器使用——共有 19 種工具，能將 ASR 與 MT 功能提供給 Claude Desktop、Claude Code、Cursor、Cline 或任何支援 MCP 的代理程式。資料傳輸採用標準輸入輸出方式：無需端口、無防火牆設定，也不需要綁定到本機主機。代理程式負責掌控其整個生命週期。

將音訊/影片檔案、麥克風錄製的內容或系統音訊轉寫為文字
可翻譯文字、SRT 或 VTT格式（支援雙語模式）
即時切換 ASR 或 MT 計算裝置
列出並切換個人語音檔案
從代理程式中讀取/寫入任何應用程式設定

運行 brethof-voice --mcp 且該代理程式透過 stdio 進行連線。需要購買付費授權——試用版使用者無法啟動伺服器。

其中的所有內容一個應用程式

完全的隱私保護

GPU 加速

離線轉錄 — 30種語言 + 22種中文方言

離線翻譯 — 38種語言 v2.0.0 的新功能

兩種模型尺寸

AI 噪音減少功能

個人語音訓練

語音鍵盤與直接文字輸入

熱詞上下文與術語

用於 AI 智能體的 MCP 伺服器付費方案

準備好試用了嗎？

我們所打造的一切

Brethof Voice Pro

Brethof Mind

3D 模型

3D列印

Nova

精彩清單

指南

ComfyUI 工作流程

反作弊等級榜

關於 Brethof AI

其中的所有內容 一個應用程式

完全的隱私保護

GPU 加速

離線轉錄 — 30種語言 + 22種中文方言

離線翻譯 — 38種語言 v2.0.0 的新功能

兩種模型尺寸

AI 噪音減少功能

個人語音訓練

語音鍵盤與直接文字輸入

熱詞上下文與術語

用於 AI 智能體的 MCP 伺服器 付費方案

準備好試用了嗎？

我們所打造的一切

Brethof Voice Pro

Brethof Mind

3D 模型

3D列印

Nova

精彩清單

指南

ComfyUI 工作流程

反作弊等級榜

關於 Brethof AI

其中的所有內容一個應用程式

用於 AI 智能體的 MCP 伺服器付費方案