功能特點 — Brethof Voice Pro

🔒

完全隱私保護

你說的每一個字都會在您的裝置上進行處理。任何音頻、文字或元數據都唔會傳送到任何伺服器。冇雲端後端，冇遠端監控，冇分析功能，亦冇自動回傳功能。

轉錄過程中完全無網絡呼叫。
下載一次後儲存於本地的模型
開源嘅 Qwen3-ASR 引擎——可完全審計

⚡

GPU加速

Brethof Voice Pro採用經GGUF優化且搭配lama.cpp嘅引擎，實現極速推論。出廠即支援所有三大主要GPU製造商嘅產品。

NVIDIA — Vulkan加速技術（GTX 10系列及更新款）
AMD — Vulkan加速技術（RX 500系列及更新款）
Intel — Vulkan加速技術（Arc GPU同埋集成圖形處理器）
CPU 备用方案 — 可以唔使 GPU 來運行，只不過速度會慢啲。

🌐

離線轉錄 — 30種語言 + 22種粵語方言

由 llama.cpp 驅動，搭配 Qwen3-ASR 使用。可鎖定特定語言以獲得最高準確度，或讓引擎自動辨識。所有資料皆會留在您的電腦上。

英語中文廣東話阿拉伯文德文法文西班牙文葡萄牙文義大利文荷蘭語俄文印度尼西亞語韓文泰文越南文日文土耳其文唔識。馬來語瑞典語丹麥文芬蘭語打磨捷克語菲律賓人波斯文希臘文羅馬尼亞語匈牙利語馬其頓語

另外，當語言設定為中文或自動辨識時，會自動識別22種中文方言（安徽話、東北話、福建話、河南話、湖南話、山東話、四川話、吳語、閩南語等）。

💬

離線翻譯 — 38種語言 v2.0.0版本嘅新功能

可將任何轉錄內容、語音鍵盤輸出、純文字或字幕檔案進行翻譯——全部在您的電腦上完成。由……提供技術支持 Tencent Hunyuan MT2：在 FLORES-200 (XCOMET-XXL) 中，品質等級可達到 Google Gemini 3.1 Pro有97.9%嘅用戶滿意度 而緊湊型 Fast 級別嘅表現有 89.9%，喺真實環境測試（WildMTBench）同少數語言翻譯方面都優於 Gemini 3.1 Pro。

中文英語法文葡萄牙文西班牙文日文土耳其文俄文阿拉伯文韓文泰文義大利文德文越南文馬來語印度尼西亞語菲律賓人唔識。翻譯成粵語打磨捷克語荷蘭語高棉語緬甸語波斯文古吉拉特語烏爾都語泰盧固語馬拉地語希伯來文孟加拉語泰米爾語烏克蘭文廣東話藏文哈薩克語蒙古文維吾爾語

轉錄 + 翻譯 — 在「轉錄」彈出視窗中選擇目標語言；ASR用於轉錄，MT用於翻譯，兩者會並排顯示結果
語音鍵盤翻譯 — 講話時，從三欄語言網格中選擇目標語言，鍵盤會輸入翻譯結果
字幕翻譯工具 — SRT/VTT 檔案支援 38 種語言，亦可選擇雙語模式（每個時間軸顯示原文與翻譯文）。
兩種模型等級 — 快速模式（約1 GB），在CPU或GPU上皆可在幾分之一秒內完成；高品質模式（約4.3 GB），在GPU上亦可在幾分之一秒內完成
獨立裝置選擇器 — 用 Vulkan 0 執行 ASR，用 Vulkan 1 執行翻譯，或者兩者都用 CPU 執行。

📈

兩種模型尺寸

請根據您的電腦性能，選擇適合的準確度、速度與VRAM平衡方案。它們都採用相同的Qwen3-ASR架構；可隨時在「設定」→「模型」中進行切換。

0.6B — 小型、快速，可在集成 GPU 或任何 4 GB+ 的 Vulkan 卡上運行。適合作為筆電的推薦預設選項。
17億 — 可處理帶口音或雜音嘅音頻，精度更高。6 GB以上VRAM即可順利運行。在開源ASR技術中屬於最先進嘅級別。

可根據需要，透過「設定」→「模型」來下載選用附加組件。 強制對齊工具 （約540 MB）用於單字級時間戳。 Hunyuan MT2 Fast （約1 GB）或品質 (約4.3 GB) 用於翻譯。

🎵

AI 專業降噪技術

為在嘈雜環境中錄製的音頻提供可選的 DeepFilter 噪音抑制功能——預設為關閉狀態，可從「噪音」彈出選項中啟用。對於乾淨的麥克風錄音而言，關閉此功能反而有助提升品質（DeepFilter 可能會對短時間、乾淨的音頻進行過度處理）。

消除背景噪音、鍵盤按擊聲以及房間迴音。
可調整的衰減功能
無需額外硬體
預設為關閉——可選擇每次錄製時啟用或持續開啟

🎓

個人語音訓練

可以使用 LoRA 用你自己的聲音對模型進行微調——整個過程都在你的電腦上端到端執行。每次你修正被錯誤辨識的詞語時，{clip, correction} 這對資料都會被儲存到你的本地訓練數據集中。主窗口中的訓練卡片能讓你一目了然地看到總樣本數及錄製時間——點擊它即可打開數據集瀏覽器，然後在訓練選項卡中選擇「開始訓練」。

根據你的口音、方言同說話節奏進行調整
修正內容會自動儲存——繼續使用該應用程式即可。
LoRA微調——快速、高效，無需完全重新訓練
自動選擇 NVIDIA CUDA (cu128 PyTorch) 或者 CPU 後端系統
完成後會自動將訓練好的模型導出為 GGUF 格式。
你的語音資料絕對不會離開你的電腦。
每張付費許可證均可免費使用

⌨️

語音鍵盤同直接文字輸入

按住熱鍵並說話，文字就會出現在游標所在的位置——就像使用鍵盤一樣。適用於瀏覽器、IDE、終端、聊天應用程式，任何能接受鍵盤輸入的文字欄位皆可使用。

預設熱鍵 F9 — 可設定，可選擇持續錄音或切換模式
可選擇以右鍵觸發，實現免持錄音
即時翻譯晶片 — 用一種語言說話，鍵盤就會輸出翻譯結果。從三欄的網格中選擇一個或多個目標語言：每行一個，內聯顯示。EN: … || PL: …)，或者只選第一個目標。
可用於任何文字欄、編輯器、終端機或聊天軟體。
Linux 上嘅 X11 同 Wayland，Windows 上嘅原生輸入方式

📚

熱詞上下文與術語

一個裝置，兩種用途。可偏置使用 ASR 對於專有名詞、品牌名稱同專業術語而言——可避免“VFIO”被錯譯成“VEAF1”。同一欄位同時亦用於 翻譯術語詞典 — 設定「Brethof Voice」為固定值，令其在所有目標語言中皆保持「Brethof Voice」嘅名稱。

喺設定入面添加詞彙——每行一個
提升專有名詞同縮寫嘅識別準確度
喺翻譯時會保留品牌名同技術術語嘅原貌。
無需重新訓練——在推論時直接應用即可。

🤖

用於 AI Agent 的 MCP 伺服器付費計劃

同一個用於運行 GUI 的二進制檔也可以作為模型上下文協定伺服器運行——有 19 種工具可以將 ASR 與 MT 功能提供給 Claude Desktop、Claude Code、Cursor、Cline 或任何支援 MCP 的代理程式。資料傳輸透過標準輸入輸出進行：無需端口、無需防火牆，也無需綁定到本地主機。代理程式負責掌控其整個生命週期。

將音頻/視頻檔案、麥克風錄製的內容或系統音效轉寫為文字
翻譯文本、SRT 或 VTT（支援雙語模式）
即時切換 ASR 或 MT 計算裝置
列出並切換個人語音檔案
可以從該代理程式中讀取/寫入任何應用程式設定。

運行 brethof-voice --mcp 而且呢，呢個代理是透過標準輸入輸出來連接的。需要購買付費許可證——試用版用戶無法啟動伺服器。

裏面嘅所有嘢一個應用程式

完全隱私保護

GPU加速

離線轉錄 — 30種語言 + 22種粵語方言

離線翻譯 — 38種語言 v2.0.0版本嘅新功能

兩種模型尺寸

AI 專業降噪技術

個人語音訓練

語音鍵盤同直接文字輸入

熱詞上下文與術語

用於 AI Agent 的 MCP 伺服器付費計劃

準備好試一試嗎？

我哋所打造的一切

Brethof Voice Pro

Brethof Mind

3D模型

3D列印

Nova

正正係好嘅清單

指南

ComfyUI工作流程

反作弊等級榜

關於 Brethof AI

裏面嘅所有嘢 一個應用程式

完全隱私保護

GPU加速

離線轉錄 — 30種語言 + 22種粵語方言

離線翻譯 — 38種語言 v2.0.0版本嘅新功能

兩種模型尺寸

AI 專業降噪技術

個人語音訓練

語音鍵盤同直接文字輸入

熱詞上下文與術語

用於 AI Agent 的 MCP 伺服器 付費計劃

準備好試一試嗎？

我哋所打造的一切

Brethof Voice Pro

Brethof Mind

3D模型

3D列印

Nova

正正係好嘅清單

指南

ComfyUI工作流程

反作弊等級榜

關於 Brethof AI

裏面嘅所有嘢一個應用程式

用於 AI Agent 的 MCP 伺服器付費計劃