BARU · v2.0.0

Segala yang ada dalam Satu Aplikasi

Menyalin teks 30 bahasa + 22 dialek Cina

Terjemahkan 38 bahasa, sepenuhnya luar talian

Tarikh masa Cipta sarikata anda sendiri.

pelayan MCP Bercakap dengannya melalui rangkaian AI anda.

Berfungsi secara setempat — walaupun pada komputer ribaTiada langganan diperlukan.Ujian percuma selama 14 hari

Brethof Voice Pro — Main Screen
Brethof Voice Pro — Recording
🔒

Kesendirian sepenuhnya

Setiap perkataan yang anda ucapkan akan diproses pada peranti anda. Tiada audio, teks, atau metadata yang dihantar ke mana-mana pelayan. Tidak ada backend berasaskan awan, tiada pengumpulan data jarak jauh, tiada analitik, dan tiada fungsi penghantaran semula data ke pusat.

  • Tiada panggilan rangkaian semasa proses transkripsi.
  • Model yang disimpan secara setempat selepas dimuat turun sekali sahaja
  • Enjin sumber terbuka Qwen3-ASR — boleh diaudit sepenuhnya

Pengcepatan GPU

Brethof Voice Pro menggunakan enjin yang dioptimumkan untuk GGUF bersama llama.cpp untuk memberikan kelajuan pemprosesan yang sangat tinggi. Ia menyokong ketiga-tiga pengeluar GPU utama secara terus.

  • NVIDIA — Pemecutan Vulkan (siri GTX 10 dan yang lebih baru)
  • AMD — Pemecutan Vulkan (siri RX 500 dan yang lebih baru)
  • Intel — Pemecutan Vulkan (GPU Arc dan grafik terpadu)
  • Pilihan alternatif CPU — berjalan tanpa GPU, cuma lebih perlahan.
🌐

Transkripsi luar talian — 30 bahasa + 22 dialek Cina

Dikuasakan oleh Qwen3-ASR melalui llama.cpp. Tetapkan bahasa tertentu untuk ketepatan maksimum, atau biarkan enjin mengesan secara automatik. Setiap perkataan kekal di komputer anda.

Bahasa InggerisCinaKantonisBahasa Arab JermanPerancisSepanyolPortugis ItaliBelandaRusiaIndonesia KoreaThaiVietnamJepun TurkiTidak adaBahasa MelayuBahasa Sweden DenmarkBahasa FinlandMemperbaikiCeko FilipinaBahasa ParsiYunaniRumania HungariaMakedonia

Selain itu, terdapat 22 dialek serantau Cina (Anhui, Dongbei, Fujian, Henan, Hunan, Shandong, Sichuan, Wu, Minnan, dan lain-lain) yang akan dikenal pasti secara automatik apabila bahasa ditetapkan kepada Cina atau mod pengesanan automatik.

💬

Terjemahan luar talian — 38 bahasa Baru dalam versi 2.0.0

Terjemahkan sebarang transkripsi, hasil input papan kekunci suara, teks biasa, atau fail sarikata — sepenuhnya di komputer anda. Dikuasakan oleh Tencent Hunyuan MT2: Pada FLORES-200 (XCOMET-XXL), tahap kualitinya mencapai 97.9% daripada Google Gemini 3.1 Pro dan versi Fast yang kompak mencapai 89.9%, serta ia mengatasi Gemini 3.1 Pro dalam ujian dunia sebenar (WildMTBench) dan terjemahan bahasa minoriti.

CinaBahasa InggerisPerancisPortugis SepanyolJepunTurkiRusia Bahasa ArabKoreaThaiItali JermanVietnamBahasa MelayuIndonesia FilipinaTidak adaTerjemahan Bahasa CinaMemperbaiki CekoBelandaKembojaBurmese Bahasa ParsiGujaratiUrduTelugu MarathiIbraniBengaliTamil UkrainianKantonisTibetanKazakh MongolUyghur
  • Menyalin teks + menterjemahkan — Pilih bahasa sasaran dalam tetingkap pop timbul Transcribe; ASR akan menyalin teks, MT akan menterjemahkan teks, kedua-duanya dipaparkan secara selari.
  • Terjemahan papan kekunci suara — Bercakap, pilih sasaran daripada grid bahasa bersekolam 3, papan kekunci akan menaip terjemahan tersebut.
  • Penterjemah sarikata — Fail SRT/VTT dalam 38 bahasa yang berbeza, dengan mod dwibahasa pilihan (teks asal + terjemahan untuk setiap ayat).
  • Dua tahap model — Cepat (~1 GB), kurang daripada satu saat pada CPU atau GPU; Kualiti tinggi (~4.3 GB), kurang daripada satu saat pada GPU
  • Pemilih peranti bebas — jalankan ASR pada Vulkan 0, terjemahan pada Vulkan 1, atau kedua-duanya pada CPU
📈

Dua saiz model

Pilih keseimbangan antara ketepatan, kelajuan, dan VRAM yang sesuai dengan komputer anda. Kedua-duanya menggunakan arsitektur Qwen3-ASR yang sama; anda boleh bertukar bila-bila masa melalui Settings → Models.

  • 0.6B — Saiznya kecil, berkelajuan tinggi, berfungsi pada GPU terbina dalam atau sebarang kad Vulkan dengan kapasiti 4 GB+. Pilihan lalai yang disyorkan untuk komputer riba.
  • 1.7B — Prestasi yang lebih baik dan ketepatan yang lebih tinggi untuk audio yang mempunyai aksen atau bising. Boleh berfungsi dengan lancar menggunakan VRAM 6 GB+. Termasuk dalam kategori terbaik di kalangan alat ASR terbuka.

Muat turun add-on pilihan mengikut keperluan melalui Settings → Models: Alat Penyelarasan Paksa (~540 MB) untuk tarikh masa pada peringkat perkataan. Hunyuan MT2 Fast (~1 GB) atau Kualiti (~4.3 GB) untuk proses terjemahan.

🎵

Pengurangan Bunyi AI

Fungsi penindasan bunyi DeepFilter yang boleh dipilih untuk rakaman yang dibuat di bilik bising — ditutup secara lalai, aktifkan melalui tetingkap pop-up Noise. Mengabaikan fungsi ini pada rakaman mikrofon yang bersih sebenarnya membantu meningkatkan kualiti (DeepFilter boleh memproses audio yang pendek dan bersih secara berlebihan).

  • Menghilangkan bunyi bising latar, bunyi ketukan papan kunci, dan gema di dalam bilik.
  • Penurunan isyarat yang boleh dikonfigurasikan
  • Tiada peranti keras tambahan diperlukan.
  • Dihentikan secara lalai — tukar antara setiap rakaman atau sentiasa dihidupkan
🎓

Latihan Suara Peribadi

Lakukan penalaan semula model menggunakan suara anda sendiri melalui LoRA — prosesnya berjalan sepenuhnya pada komputer anda. Setiap kali anda membetulkan perkataan yang dikenal pasti secara salah, pasangan {clip, correction} akan disimpan ke dalam set data latihan tempatan anda. Kartu latihan di tetingkap utama menunjukkan jumlah sampel dan minit yang dirakam dengan sekali pandang — kliknya untuk membuka pelayar set data, kemudian pilih “Start training” di tab Training.

  • Menyesuaikan diri dengan loghat, dialek, dan irama percakapan anda.
  • Perubahan telah disimpan secara automatik — teruskan sahaja menggunakan aplikasi ini.
  • Penalaan LoRA — cepat, cekap, tanpa perlu latihan semula sepenuhnya
  • Pemilihan automatik NVIDIA CUDA (cu128 PyTorch) atau CPU lapisan belakang
  • Eksport automatik model yang telah dilatih ke GGUF setelah selesai.
  • Data suara anda tidak akan pernah keluar dari komputer anda.
  • Diberikan secara percuma untuk setiap lesen berbayar
⌨️

Papan Kekunci Suara & Penyisipan Teks Langsung

Tahan kekunci khas, bercakap, dan teks akan muncul di mana sahaja kursor berada — seperti papan kekunci. Berfungsi dalam pelayar, IDE, terminal, aplikasi sembang, di mana-mana sahaja yang membenarkan input papan kekunci.

  • Kunci pintas lalai F9 — boleh dikonfigurasikan, rekod secara berterusan atau tukar antara mod
  • Pemicu butang kanan tetikus pilihan untuk rakaman tanpa tangan
  • Cip terjemahan secara langsung — Bercakap dalam satu bahasa, papan kekunci akan menaip terjemahannya. Pilih satu atau lebih sasaran daripada grid 3 lajur: satu setiap baris, secara bersiri.EN: … || PL: …), atau hanya sasaran pertama sahaja.
  • Bekerja dengan mana-mana medan teks, editor, terminal, atau chat.
  • X11 dan Wayland pada Linux, input asli pada Windows
📚

Konteks dan Istilah Kata Kunci Panas

Satu alat, dua kegunaan. Berat sebelah dalam ASR Bagi nama khas, nama jenama, dan istilah teknikal — ia mengurangkan risiko “VFIO” disalahterjemahkan sebagai “VEAF1”. Medan yang sama juga berfungsi sebagai Kamus istilah terjemahan — Pasang pin “Brethof Voice” supaya ia kekal sebagai “Brethof Voice” dalam setiap bahasa sasaran.

  • Tambahkan istilah dalam Tetapan — satu per baris
  • Meningkatkan pengenalan nama khas dan singkatan.
  • Menjaga nama jenama dan istilah teknikal dalam terjemahan.
  • Tiada keperluan untuk latihan semula — digunakan semasa proses inferensi.
🤖

Pelayan MCP untuk Ejen AI Pelan berbayar

Binari yang sama yang menjalankan antaramuka grafik boleh berfungsi sebagai pelayan Model Context Protocol — terdapat 19 alat yang menyediakan fungsi ASR dan MT untuk Claude Desktop, Claude Code, Cursor, Cline, atau sebarang agen yang serasi dengan MCP. Proses penghantaran data dilakukan melalui stdio: tiada port, tiada firewall, tiada pengikatan ke localhost. Agen tersebut yang mengawal kitaran hayatnya.

  • Transkripsi fail audio/video, rakaman mikrofon, atau audio sistem
  • Terjemahkan teks, SRT, atau VTT (mod dwibahasa disokong).
  • Tukar peranti pengiraan ASR atau MT secara serta-merta
  • Senaraikan dan tukar profil suara peribadi
  • Baca/tulis sebarang tetapan aplikasi daripada ejen.

Jalankan brethof-voice --mcp Dan ejen tersebut berhubung melalui stdio. Perlu ada lesen berbayar — pengguna ujian tidak boleh menjalankan pelayan.

Sudah bersedia untuk mencubanya?

Ujian percuma selama 14 hari. Semua ciri tersedia tanpa had. Tidak memerlukan kad kredit.

Segala yang kami bina

Luaran:   YouTube · GitHub