Mga anunsyo sa paglulunsad, balita tungkol sa Champions Program, mga bagong tampok, at impormasyon mula sa likod ng entablado hinggil sa engineering mula sa koponan ng Brethof Voice Pro.
Ang Brethof Voice Pro ay hindi na lamang isang tool para sa pag-convert ng boses sa teksto. Ito ay inilabas na sa bersyon 2.0.0. pagsasalin nang offline pinapatakbo ng Tencent Hunyuan MT2 — sa FLORES-200 (XCOMET-XXL), naaabot ng antas 7B 97.9% ng Google Gemini 3.1 ProAt nalalampasan nito ang Gemini sa mga pagsubok sa totoong mundo at sa mga wika ng minorya. Ang pagsasalin ay isinasagawa nang buo sa iyong aparato. Mayroong dalawang antas ng modelo, na maaaring i-download ayon sa pangangailangan: Fast (~1 GB, mas mababa sa isang segundo sa CPU o GPU) at Quality (~4.3 GB, mas mababa sa isang segundo sa GPU). Kasama rin dito ang ilang karagdagang tampok na matagal nang hinihintay.
Ano ang bago sa v2.0.0:
EN: … || PL: …), o tanging unang target lamang.translate_text, translate_srt, list_compute_devices, set_compute_deviceAng kabuuang bilang ng mga tool ay 19 na ngayon.Ang binary ng Linux ay 161 MB, habang ang installer ng Windows ay 118 MB. Pareho ang presyo sa paglulunsad: $49 para sa personal na gamit, $149 para sa negosyo. Ang mga umiiral nang lisensya ay mananatiling balido — sapat na iyon. I-download ang v2.0.0 At ang mga modelo sa pagsasalin ay lalabas sa Settings → Models.
I-download ang v2.0.0 →Naipadala na ang pipeline para sa pagsasanay. Ang LoRA fine-tuning gamit ang sarili mong boses ay maaari nang isagawa nang end-to-end sa iyong makina — awtomatikong pinipili ng app NVIDIA CUDA or CPUKapag tapos na, awtomatikong inililipat ng Brethof Voice Pro ang natrain na modelo sa format na GGUF. Bawat pagwawasto na ginagawa mo sa GUI ay awtomatikong na-i-save sa iyong lokal na dataset para sa pagsasanay; ipinapakita ng card para sa pagsasanay sa pangunahing bintana ang kabuuang bilang ng mga sample at oras sa isang sulyap.
Bonus: Tumaas ang katumpakan ng voice-keyboard sa lahat ng wika dahil sa pag-upgrade ng llama.cpp (build b9222) na nag-ayos sa problema sa hangganan ng mga bahagi sa mahahabang clip. Libre ito kasama ng bawat bayad na lisensya.
Dalawang bagong tool para sa MCP ang dumating: start_transcription nakakabalik agad ng job ID upang makapagpatuloy ang ahente sa ibang gawain, at get_transcription_status Mga poll para sa pagkumpleto. Isang gawain sa bawat pagkakataon, ang resulta ay ipapakita kapag natapos na. Ang mga malalaking file ay hindi na nakakahadlang sa loop ng ahente.
Kasama rin dito ang serye ng mga pag-aayos para sa output ng SRT/VTT sa antas ng bawat salita: wala nang mga espasyo bago ang mga bantas, wala nang mga tanda na may solong tuldok, at wala nang mga hotword o string ng konteksto na nakakalusot sa transcript. Mas malinis ang mga subtitle, at hindi na kailangan ng manu-manong paglilinis.
Buong muling pagsulat ng engine. Ang Brethof Voice Pro ay ngayon gumagamit ng Qwen3-ASR nang end-to-end. llama.cpp sa pamamagitan ng mga timbang na GGUF-quantised libmtmdWala na ang ONNX Runtime. Ang resulta: mas maliit na laki ng installer (~83 MB na binary, mula sa 400+ MB), mas mabilis na pag-start, at wala nang problema sa mga CUDA/DirectML na bersyon para sa iba’t ibang platform.
Awtomatikong kinikilala ng Vulkan ang iyong GPU — maging ito man ay NVIDIA, AMD, o Intel Arc — at gumagamit ng CPU bilang kapalit kung wala namang GPU. Ang parehong engine ang nagpapatakbo sa lahat ng kasamang tampok: ASR, voice keyboard, MCP server, at (sa bersyon 2.0.0 na) pagsasalin.
Nakarating na ang server ng Model Context Protocol. Anumang AI agent na compatible sa MCP — Claude Desktop, Claude Code, Cursor, Cline — maaaring magpatakbo ng transkripsyon sa pamamagitan ng stdio (walang port, walang firewall). Kasama rin sa parehong bersyon ang tagapili ng multi-GPU device upang makapili ka kung aling Vulkan GPU ang gagamitin para sa ASR, pati na rin ang opsyonal na mga ito Forced Aligner add-on para sa mga timestamp sa antas ng salita sa bawat transkripsyon.
Para lamang sa may bayad na tier — tumatanggi ang MCP server na mag-start nang wala ang Personal o Business license. brethof-voice --mcp Ito ang paraan ng pagpapatakbo sa isang linya.
Ang pinakakaraniwang tanong bago ang paglulunsad ay “Kailan ang macOS?”. Sagot: nasa aktibong yugto ng pagbuo. Unang ilulunsad ang bersyon na gumagamit ng Apple Silicon na may Metal acceleration, kasunod nito ang bersyon para sa Intel. Target na petsa ay Q3 2026 — at magbubukas kami ng closed beta sa Q2. Narito kung ano ang binubuo at kung paano makapag-sign up.
Basahin ang post →Mayroong personal na pagsasanay sa boses sa Voice Pro. Sa bawat pagwasto mo sa salitang mali ang pagkilala, ang audio clip kasama ang pagwasto ay awtomatikong nai-save sa iyong lokal na dataset para sa pagsasanay. Isang klik lang sa tab na Training ay sapat upang i-adjust ang LoRA ayon sa iyong accent — awtomatikong pinipili ng app kung gagamit ng NVIDIA CUDA o CPU, at pagkatapos ay awtomatikong inililipat ang nai-train na modelo sa format na GGUF. Libre ito kasama ng bawat bayad na lisensya.
Basahin ang post →Matapos ang ilang buwang pagbuo, inilabas na ngayon ang Voice Pro v1.0 para sa Windows at Linux. Mayroon itong 30 wika para sa transkripsyon kasama ang 22 diyalekto ng Tsino, ganap na offline na transkripsyon, kakayahang magsalita gamit ang hotkey kahit saan, at presyong isang beses lang nang walang subscription. Narito kung ano ang nasa bersyon na ito at kung ano ang aming pinagtatrabahuhan sa susunod.
Basahin ang post →Nagsisimula ngayon ang Champions Program at tatagal hanggang Mayo 16. Mayroong limampung libreng Personal license para sa bawat wika na sinusuportahan — kabuuang 1,800 — kasama ang 70% diskwento para sa bawat kalahok na hindi nakapasok sa top 50. Narito kung paano ito gumagana at bakit namin ito ginagawa sa paraang ito.
Basahin ang post →Nakinig kami sa mga paunang puna mula sa mga manunulat, tagapayo, at tagasalin na nagsabing nakalilito ang dating probisyon na “para lamang sa personal na paggamit”. Ang Personal license na nagkakahalaga ng $49 ay malinaw nang sumasaklaw sa paggamit nito ng mga indibidwal at freelance para sa komersyal na layunin. Ang Business license naman ($149 bawat upuan) ay para sa mga team. Narito kung ano ang nagbago at bakit.
Basahin ang post →Ang Brethof Voice Pro ay nakakapag-transcribe at makapagpapakita ng teksto sa 30 wika pati na rin sa 22 diyalekto ng Tsino: Arabiko, Kantonese, Tsino, Czech, Danish, Dutch, Ingles, Filipino, Finnish, Pranses, Aleman, Griyego, Hindi, Hungarian, Indonesian, Italyano, Hapon, Koreano, Macedonian, Malay, Persian, Polish, Portuges, Romanian, Ruso, Espanyol, Swedish, Thai, Turkish, Vietnamese. Narito kung paano pinipili ng app ang tamang wika at kung ano talaga ang ibig sabihin ng “buong pagsasalin”.
Basahin ang post →Ang ASR backend ng Brethof Voice Pro ay gumagana gamit ang llama.cpp kasama ang mga Qwen model na nai-quantize sa GGUF, sa halip na ONNX Runtime. Ang resulta nito: mas maliit na laki ng file na kailangang i-install (83 MB exe kumpara sa 400+ MB), mas mabilis na pag-start kapag una itong ginagamit, at wala nang problema sa paggamit ng mga CUDA/DirectML component sa bawat platform. Narito ang kuwento sa likod ng pagpapalit na ito.
Basahin ang post →Lahat ng pangunahing produkto para sa pagsasalita ay nagpapadala ng iyong boses sa server ng ibang tao. Sa aming palagay, iyan ay maling default na setting. Ang iyong boses ay ang pinakapersonal na impormasyon na nililikha mo — mga tala medikal, mga draft na legal, pribadong talaarawan, mga lihim sa trabaho. Ito ang dahilan kung bakit ang Voice Pro ay walang cloud mode, walang “optional telemetry”, at hindi nangangailangan ng account para sa pag-transcribe.
Basahin ang post →Lumikha ng account upang makatanggap ka ng abiso kapag naglathala kami ng mga bagong post at nagpapadala ng mga bagong bersyon.
Lumikha ng Accountlokal na speech-to-text na natututo sa iyong boses. Walang hanggang lisensya. Ang aming flagship.
Bayad · flagship
Lokal na pangmatagalang memorya para sa Claude Code — buong teksto + vector + graph, sa SurrealDB. MIT.
LIBRE · open source
Mga digital na modelo na handa nang i-print. Kasama ang STL/3MF/OBJ. Lifetime access.
Bayad · digital na katalogo
Ang aming mga nakalimbag na disenyo ay ipinapadala sa buong Europa. Bumili ng produkto, hindi ang file.
Bayad · mga pisikal na bagay
Cyber-tiger AI host. Paliwanag tungkol sa AI na nagbibigay-priyoridad sa privacy, nang walang corporate filter.
CHANNEL · live
Mga napiling listahan sa GitHub para sa AI, MCP, lokal na AI, Linux para sa AI, at iba pa. Resibo, hindi damdamin.
LIBRE · curated
Mga detalyadong gabay kung paano gamitin ang lokal na AI sa Linux, Windows, at macOS. Tunay na mga configuration, hindi marketing.
LIBRE · malapit nang dumating
Mga graph ng ComfyUI na nasubok sa produksyon — LTX chunked-loop, ang Nova pipeline, at marami pang iba.
LIBRE · mga landing page para sa workflow
Negatibong kurasyon: mga pamamaraan at kasangkapan na nag-aaksaya ng iyong oras, na nakaayos ayon sa ranggo. Kinakailangan ang mga resibo.
LIBRE · malapit nang dumating
Sino kami, bakit kami gumagawa ng AI na lokal-first, at ano ang hindi namin gagawin.