Fitur — Brethof Voice Pro

🔒

Privasi Lengkap

Setiap kata yang Anda ucapkan diproses di perangkat Anda. Tidak ada audio, teks, atau metadata yang dikirim ke server apa pun. Tidak ada layanan backend berbasis cloud, tidak ada pengumpulan data jarak jauh, tidak ada analitik, dan tidak ada fungsi pelaporan kembali ke server pusat.

Tidak ada panggilan jaringan selama proses transkripsi
Model yang disimpan secara lokal setelah diunduh sekali saja
Mesin Qwen3-ASR berbasis sumber terbuka — sepenuhnya dapat diaudit

⚡

Akselerasi GPU

Brethof Voice Pro memanfaatkan mesin yang dioptimalkan untuk format GGUF bersama llama.cpp guna memberikan proses inferensi yang sangat cepat. Software ini mendukung ketiga produsen GPU terkemuka secara langsung tanpa perlu pengaturan tambahan.

NVIDIA — Akselerasi Vulkan (GTX seri 10 dan yang lebih baru)
AMD — Akselerasi Vulkan (RX 500-series dan yang lebih baru)
Intel — Akselerasi Vulkan (GPU Arc dan grafis terintegrasi)
Solusi cadangan CPU — berjalan tanpa GPU, hanya lebih lambat

🌐

Transkripsi Offline — 30 Bahasa + 22 Dialek Mandarin

Ditunjang oleh Qwen3-ASR melalui llama.cpp. Pilih bahasa tertentu untuk akurasi maksimal, atau biarkan mesin mendeteksi secara otomatis. Setiap kata tetap berada di perangkat Anda.

Bahasa InggrisBahasa TionghoaKantoneseBahasa Arab JermanPrancisSpanyolPortugis ItaliaBelandaBahasa RusiaBahasa Indonesia KoreaThaiVietnamiaBahasa Jepang TurkiTidak adaMelayuSwedia DenmarkBahasa FinlandiaPenyempurnaanCeko FilipinaPersiaYunaniRumania HongariaMakedonia

Ditambah 22 dialek regional Tionghoa (Anhui, Dongbei, Fujian, Henan, Hunan, Shandong, Sichuan, Wu, Minnan, dan lainnya) yang diakui secara otomatis ketika bahasa ditetapkan ke bahasa Tionghoa atau mode deteksi otomatis.

💬

Terjemahan Offline — 38 Bahasa Fitur baru di v2.0.0

Terjemahkan segala teks transkripsi, hasil input suara-kunci papan ketik, teks biasa, atau berkas subtitle — semuanya di komputer Anda sendiri. Ditenagai oleh Tencent Hunyuan MT2: pada FLORES-200 (XCOMET-XXL), tingkatan kualitas mencapai 97,9% dari Google Gemini 3.1 Pro Dan versi Fast yang kompak mencapai 89,9%, serta unggul atas Gemini 3.1 Pro dalam uji coba di dunia nyata (WildMTBench) maupun penerjemahan bahasa minoritas.

Bahasa TionghoaBahasa InggrisPrancisPortugis SpanyolBahasa JepangTurkiBahasa Rusia Bahasa ArabKoreaThaiItalia JermanVietnamiaMelayuBahasa Indonesia FilipinaTidak adaTerjemahan Bahasa TionghoaPenyempurnaan CekoBelandaKhmerBurmese PersiaGujaratiUrduTelugu MarathiIbraniBengaliTamil UkrainaKantoneseTibetanKazakh MongoliaUyghur

Menyalin teks + menerjemahkan — Pilih bahasa sasaran di jendela pop-up Transcribe; ASR digunakan untuk merekam suara, MT digunakan untuk menerjemahkan, keduanya ditampilkan berdampingan.
Terjemahan papan ketik suara — berbicara, pilih target dari grid bahasa berkolom 3, papan ketik mengetikkan terjemahannya
Penerjemah subtitle — File SRT/VTT dalam 38 bahasa apa pun, dengan mode bilingual opsional (teks asli + terjemahan per cue)
Dua tingkatan model — Cepat (~1 GB), kurang dari satu detik pada CPU atau GPU; Kualitas tinggi (~4,3 GB), kurang dari satu detik pada GPU
Pemilih perangkat mandiri — jalankan ASR di Vulkan 0, penerjemahan di Vulkan 1, atau keduanya di CPU

📈

Dua Ukuran Model

Pilih keseimbangan antara akurasi, kecepatan, dan VRAM yang sesuai dengan perangkat Anda. Keduanya menggunakan arsitektur Qwen3-ASR yang sama; Anda dapat menggantinya kapan saja melalui Settings → Models.

0,6 miliar — Berukuran kecil, cepat, berjalan pada GPU terintegrasi atau kartu Vulkan dengan kapasitas 4 GB+. Rekomendasi default untuk laptop.
1,7 miliar — Lebih besar, akurasi yang lebih tinggi pada audio beraksen atau bising. Bisa berjalan dengan lancar pada VRAM 6 GB+. Termasuk yang terbaik di antara solusi ASR terbuka.

Add-on opsional dapat diunduh sesuai kebutuhan dari Settings → Models: Alat Penyelarasan Paksa (~540 MB) untuk timestamp tingkat kata. Hunyuan MT2 Cepat (~1 GB) atau Kualitas (~4,3 GB) untuk proses penerjemahan.

🎵

Reduksi Kebisingan AI

Fungsi penekan kebisingan DeepFilter yang dapat diaktifkan secara opsional untuk rekaman yang dibuat di ruangan bising — dalam keadaan off secara default, aktifkan melalui menu pop-up Noise. Mengabaikan fungsi ini pada rekaman suara yang bersih justru membantu meningkatkan kualitasnya (DeepFilter dapat memproses audio yang singkat dan bersih secara berlebihan).

Menghilangkan suara bising latar, bunyi ketukan keyboard, dan gema di ruangan
Atenuasi yang dapat dikonfigurasi
Tidak diperlukan perangkat keras tambahan.
Disonaktifkan secara default — ubah menjadi aktif setiap perekaman atau selalu aktif

🎓

Pelatihan Suara Pribadi

Lakukan penyetelan ulang model menggunakan suara Anda sendiri dengan LoRA — prosesnya berjalan secara end-to-end di perangkat Anda. Setiap kali Anda memperbaiki kata yang tidak terdeteksi dengan benar, pasangan {clip, correction} akan disimpan ke dalam dataset pelatihan lokal Anda. Kartu pelatihan di jendela utama menampilkan total sampel dan durasi waktu yang digunakan secara sekilas — kliknya untuk membuka browser dataset, lalu pilih “Start training” di tab Training.

Berpasangan dengan aksen, dialek, dan irama bicara Anda.
Koreksi akan disimpan otomatis — terus saja gunakan aplikasinya.
Penyetelan ulang LoRA — cepat, efisien, tanpa perlu pelatihan ulang penuh
Pemilihan otomatis NVIDIA CUDA (cu128 PyTorch) atau CPU layanan pendorong
Mengekspor otomatis model yang telah dilatih ke GGUF setelah selesai.
Data suara Anda tidak pernah meninggalkan perangkat Anda.
Gratis untuk setiap lisensi berbayar

⌨️

Papan Kunci Suara & Injeksi Teks Langsung

Tahan tombol pintas, ucapkan kata-kata Anda, dan teksnya akan muncul di tempat kursor berada — seolah-olah menggunakan papan ketik. Bisa digunakan di browser, IDE, terminal, aplikasi chat, atau di mana saja ada field teks yang menerima masukan dari papan ketik.

Kunci pintas default F9 — dapat dikonfigurasi, rekam saat menekan tombol atau berfungsi sebagai sakelar
Pemicu opsi tombol kanan mouse untuk perekaman tanpa menggunakan tangan
Chip penerjemahan secara langsung — Bicaralah dalam satu bahasa, lalu papan ketik akan mengetikkan terjemahannya. Pilih satu atau lebih bahasa sasaran dari grid berkolom 3: satu per baris, secara inline.EN: … || PL: …), atau hanya target pertama saja.
Bisa digunakan pada field teks apa pun, editor, terminal, atau chat.
X11 dan Wayland di Linux, input bawaan di Windows

📚

Konteks Kata Kunci & Istilah

Satu perangkat, dua kegunaan. Memberikan kecenderungan ASR terhadap nama diri, nama merek, dan jargon — mengurangi kemungkinan “VFIO” disalahterjemahkan menjadi “VEAF1”. Bidang yang sama juga berfungsi sebagai Kamus istilah penerjemahan — Pasang pin “Brethof Voice” agar tetap menjadi “Brethof Voice” dalam setiap bahasa sasaran.

Tambahkan istilah-istilah di Pengaturan — satu per baris
Meningkatkan kemampuan pengenalan nama khusus dan singkatan.
Mempertahankan nama merek dan istilah teknis dalam terjemahan.
Tidak perlu pelatihan ulang — diterapkan saat proses inferensi

🤖

MCP Server untuk Agen AI Paket berbayar

Binary yang sama yang digunakan untuk menjalankan antarmuka grafis juga dapat berfungsi sebagai server Model Context Protocol — 19 alat yang menyediakan fitur ASR dan MT bagi Claude Desktop, Claude Code, Cursor, Cline, atau agen apa pun yang kompatibel dengan MCP. Proses transmisi data dilakukan melalui stdio: tanpa port, tanpa firewall, tanpa keterikatan pada localhost. Agenlah yang mengendalikan siklus hidupnya.

Transkripsikan berkas audio/video, rekaman mikrofon, atau audio sistem.
Terjemahkan teks, SRT, atau VTT (dukungan mode bilingual).
Ganti perangkat komputasi ASR atau MT secara langsung
Daftarkan dan ganti profil suara pribadi
Baca/tulis pengaturan aplikasi apa pun dari agen tersebut

Jalankan brethof-voice --mcp Dan agen tersebut terhubung melalui stdio. Diperlukan lisensi berbayar — pengguna versi uji coba tidak dapat menjalankan server.

Semua yang ada di dalam Satu Aplikasi

Privasi Lengkap

Akselerasi GPU

Transkripsi Offline — 30 Bahasa + 22 Dialek Mandarin

Terjemahan Offline — 38 Bahasa Fitur baru di v2.0.0

Dua Ukuran Model

Reduksi Kebisingan AI

Pelatihan Suara Pribadi

Papan Kunci Suara & Injeksi Teks Langsung

Konteks Kata Kunci & Istilah

MCP Server untuk Agen AI Paket berbayar

Siap mencobanya?

Semua yang kami bangun

Brethof Voice Pro

Brethof Mind

Model 3D

Cetak 3D

Nova

Daftar luar biasa

Panduan

Alur kerja ComfyUI

Daftar peringkat anti-dev tier

Tentang Brethof AI