BARU · v2.0.0

Semua yang ada di dalam Satu Aplikasi

Mencatat suara 30 bahasa + 22 dialek bahasa Tionghoa

Terjemahkan 38 bahasa, sepenuhnya offline

Waktu Tanda Tangan buat subtitle Anda sendiri

server MCP Bicaralah dengannya melalui stack AI Anda.

Bekerja secara lokal — bahkan di laptopTidak perlu berlanggananUji coba gratis selama 14 hari

Brethof Voice Pro — Main Screen
Brethof Voice Pro — Recording
🔒

Privasi Lengkap

Setiap kata yang Anda ucapkan diproses di perangkat Anda. Tidak ada audio, teks, atau metadata yang dikirim ke server apa pun. Tidak ada layanan backend berbasis cloud, tidak ada pengumpulan data jarak jauh, tidak ada analitik, dan tidak ada fungsi pelaporan kembali ke server pusat.

  • Tidak ada panggilan jaringan selama proses transkripsi
  • Model yang disimpan secara lokal setelah diunduh sekali saja
  • Mesin Qwen3-ASR berbasis sumber terbuka — sepenuhnya dapat diaudit

Akselerasi GPU

Brethof Voice Pro memanfaatkan mesin yang dioptimalkan untuk format GGUF bersama llama.cpp guna memberikan proses inferensi yang sangat cepat. Software ini mendukung ketiga produsen GPU terkemuka secara langsung tanpa perlu pengaturan tambahan.

  • NVIDIA — Akselerasi Vulkan (GTX seri 10 dan yang lebih baru)
  • AMD — Akselerasi Vulkan (RX 500-series dan yang lebih baru)
  • Intel — Akselerasi Vulkan (GPU Arc dan grafis terintegrasi)
  • Solusi cadangan CPU — berjalan tanpa GPU, hanya lebih lambat
🌐

Transkripsi Offline — 30 Bahasa + 22 Dialek Mandarin

Ditunjang oleh Qwen3-ASR melalui llama.cpp. Pilih bahasa tertentu untuk akurasi maksimal, atau biarkan mesin mendeteksi secara otomatis. Setiap kata tetap berada di perangkat Anda.

Bahasa InggrisBahasa TionghoaKantoneseBahasa Arab JermanPrancisSpanyolPortugis ItaliaBelandaBahasa RusiaBahasa Indonesia KoreaThaiVietnamiaBahasa Jepang TurkiTidak adaMelayuSwedia DenmarkBahasa FinlandiaPenyempurnaanCeko FilipinaPersiaYunaniRumania HongariaMakedonia

Ditambah 22 dialek regional Tionghoa (Anhui, Dongbei, Fujian, Henan, Hunan, Shandong, Sichuan, Wu, Minnan, dan lainnya) yang diakui secara otomatis ketika bahasa ditetapkan ke bahasa Tionghoa atau mode deteksi otomatis.

💬

Terjemahan Offline — 38 Bahasa Fitur baru di v2.0.0

Terjemahkan segala teks transkripsi, hasil input suara-kunci papan ketik, teks biasa, atau berkas subtitle — semuanya di komputer Anda sendiri. Ditenagai oleh Tencent Hunyuan MT2: pada FLORES-200 (XCOMET-XXL), tingkatan kualitas mencapai 97,9% dari Google Gemini 3.1 Pro Dan versi Fast yang kompak mencapai 89,9%, serta unggul atas Gemini 3.1 Pro dalam uji coba di dunia nyata (WildMTBench) maupun penerjemahan bahasa minoritas.

Bahasa TionghoaBahasa InggrisPrancisPortugis SpanyolBahasa JepangTurkiBahasa Rusia Bahasa ArabKoreaThaiItalia JermanVietnamiaMelayuBahasa Indonesia FilipinaTidak adaTerjemahan Bahasa TionghoaPenyempurnaan CekoBelandaKhmerBurmese PersiaGujaratiUrduTelugu MarathiIbraniBengaliTamil UkrainaKantoneseTibetanKazakh MongoliaUyghur
  • Menyalin teks + menerjemahkan — Pilih bahasa sasaran di jendela pop-up Transcribe; ASR digunakan untuk merekam suara, MT digunakan untuk menerjemahkan, keduanya ditampilkan berdampingan.
  • Terjemahan papan ketik suara — berbicara, pilih target dari grid bahasa berkolom 3, papan ketik mengetikkan terjemahannya
  • Penerjemah subtitle — File SRT/VTT dalam 38 bahasa apa pun, dengan mode bilingual opsional (teks asli + terjemahan per cue)
  • Dua tingkatan model — Cepat (~1 GB), kurang dari satu detik pada CPU atau GPU; Kualitas tinggi (~4,3 GB), kurang dari satu detik pada GPU
  • Pemilih perangkat mandiri — jalankan ASR di Vulkan 0, penerjemahan di Vulkan 1, atau keduanya di CPU
📈

Dua Ukuran Model

Pilih keseimbangan antara akurasi, kecepatan, dan VRAM yang sesuai dengan perangkat Anda. Keduanya menggunakan arsitektur Qwen3-ASR yang sama; Anda dapat menggantinya kapan saja melalui Settings → Models.

  • 0,6 miliar — Berukuran kecil, cepat, berjalan pada GPU terintegrasi atau kartu Vulkan dengan kapasitas 4 GB+. Rekomendasi default untuk laptop.
  • 1,7 miliar — Lebih besar, akurasi yang lebih tinggi pada audio beraksen atau bising. Bisa berjalan dengan lancar pada VRAM 6 GB+. Termasuk yang terbaik di antara solusi ASR terbuka.

Add-on opsional dapat diunduh sesuai kebutuhan dari Settings → Models: Alat Penyelarasan Paksa (~540 MB) untuk timestamp tingkat kata. Hunyuan MT2 Cepat (~1 GB) atau Kualitas (~4,3 GB) untuk proses penerjemahan.

🎵

Reduksi Kebisingan AI

Fungsi penekan kebisingan DeepFilter yang dapat diaktifkan secara opsional untuk rekaman yang dibuat di ruangan bising — dalam keadaan off secara default, aktifkan melalui menu pop-up Noise. Mengabaikan fungsi ini pada rekaman suara yang bersih justru membantu meningkatkan kualitasnya (DeepFilter dapat memproses audio yang singkat dan bersih secara berlebihan).

  • Menghilangkan suara bising latar, bunyi ketukan keyboard, dan gema di ruangan
  • Atenuasi yang dapat dikonfigurasi
  • Tidak diperlukan perangkat keras tambahan.
  • Disonaktifkan secara default — ubah menjadi aktif setiap perekaman atau selalu aktif
🎓

Pelatihan Suara Pribadi

Lakukan penyetelan ulang model menggunakan suara Anda sendiri dengan LoRA — prosesnya berjalan secara end-to-end di perangkat Anda. Setiap kali Anda memperbaiki kata yang tidak terdeteksi dengan benar, pasangan {clip, correction} akan disimpan ke dalam dataset pelatihan lokal Anda. Kartu pelatihan di jendela utama menampilkan total sampel dan durasi waktu yang digunakan secara sekilas — kliknya untuk membuka browser dataset, lalu pilih “Start training” di tab Training.

  • Berpasangan dengan aksen, dialek, dan irama bicara Anda.
  • Koreksi akan disimpan otomatis — terus saja gunakan aplikasinya.
  • Penyetelan ulang LoRA — cepat, efisien, tanpa perlu pelatihan ulang penuh
  • Pemilihan otomatis NVIDIA CUDA (cu128 PyTorch) atau CPU layanan pendorong
  • Mengekspor otomatis model yang telah dilatih ke GGUF setelah selesai.
  • Data suara Anda tidak pernah meninggalkan perangkat Anda.
  • Gratis untuk setiap lisensi berbayar
⌨️

Papan Kunci Suara & Injeksi Teks Langsung

Tahan tombol pintas, ucapkan kata-kata Anda, dan teksnya akan muncul di tempat kursor berada — seolah-olah menggunakan papan ketik. Bisa digunakan di browser, IDE, terminal, aplikasi chat, atau di mana saja ada field teks yang menerima masukan dari papan ketik.

  • Kunci pintas default F9 — dapat dikonfigurasi, rekam saat menekan tombol atau berfungsi sebagai sakelar
  • Pemicu opsi tombol kanan mouse untuk perekaman tanpa menggunakan tangan
  • Chip penerjemahan secara langsung — Bicaralah dalam satu bahasa, lalu papan ketik akan mengetikkan terjemahannya. Pilih satu atau lebih bahasa sasaran dari grid berkolom 3: satu per baris, secara inline.EN: … || PL: …), atau hanya target pertama saja.
  • Bisa digunakan pada field teks apa pun, editor, terminal, atau chat.
  • X11 dan Wayland di Linux, input bawaan di Windows
📚

Konteks Kata Kunci & Istilah

Satu perangkat, dua kegunaan. Memberikan kecenderungan ASR terhadap nama diri, nama merek, dan jargon — mengurangi kemungkinan “VFIO” disalahterjemahkan menjadi “VEAF1”. Bidang yang sama juga berfungsi sebagai Kamus istilah penerjemahan — Pasang pin “Brethof Voice” agar tetap menjadi “Brethof Voice” dalam setiap bahasa sasaran.

  • Tambahkan istilah-istilah di Pengaturan — satu per baris
  • Meningkatkan kemampuan pengenalan nama khusus dan singkatan.
  • Mempertahankan nama merek dan istilah teknis dalam terjemahan.
  • Tidak perlu pelatihan ulang — diterapkan saat proses inferensi
🤖

MCP Server untuk Agen AI Paket berbayar

Binary yang sama yang digunakan untuk menjalankan antarmuka grafis juga dapat berfungsi sebagai server Model Context Protocol — 19 alat yang menyediakan fitur ASR dan MT bagi Claude Desktop, Claude Code, Cursor, Cline, atau agen apa pun yang kompatibel dengan MCP. Proses transmisi data dilakukan melalui stdio: tanpa port, tanpa firewall, tanpa keterikatan pada localhost. Agenlah yang mengendalikan siklus hidupnya.

  • Transkripsikan berkas audio/video, rekaman mikrofon, atau audio sistem.
  • Terjemahkan teks, SRT, atau VTT (dukungan mode bilingual).
  • Ganti perangkat komputasi ASR atau MT secara langsung
  • Daftarkan dan ganti profil suara pribadi
  • Baca/tulis pengaturan aplikasi apa pun dari agen tersebut

Jalankan brethof-voice --mcp Dan agen tersebut terhubung melalui stdio. Diperlukan lisensi berbayar — pengguna versi uji coba tidak dapat menjalankan server.

Siap mencobanya?

Uji coba gratis selama 14 hari. Semua fitur tersedia tanpa pembatasan. Tidak perlu kartu kredit.

Semua yang kami bangun

Eksternal:   YouTube · GitHub