Dnes je k stažení verze Brethof Voice Pro v1.0 pro Windows 10/11 a Linux (Ubuntu, Fedora, Arch). Jedná se o desktopovou aplikaci, která zachycuje zvuk z mikrofonu a spouští model ASR založený na Qwen3-ASR. lokalně na vašem CPU nebo GPU a zadejte přepsaný text do okna, na které máte zaměřenou pozornost.
Které soubory v verzi 1.0
- 30 jazyků pro transkripci a 38 jazyků pro překlad — arabština, kantonština, čínština, čeština, dánština, nizozemština, angličtina, filipínská, finská, francouzština, němčina, řečtina, hindština, chorvatský, maďarský, indonéský, italština, japonština, korejština, makedonština, malajština, perština, polština, portugalština, rumunština, ruština, srbský, slovenský, slovinský, španělština, švédština, thajština, turečtina, ukrajinština, vietnamština, bulharský.
- Globální přepínací klávesa pro dikci — stiskněte svou klávesu s předvolbou kdekoli, mluvte, pustěte ji a text se vloží do aplikace, která je v popředí.
- 100 % offline — žádný cloud, žádná telemetrie, k transkripci není potřeba účet.
- Tři úrovně modelů — základní (rychlé, 0,6 miliardy parametrů), střední (1,7 miliardy), velké (3 miliardy). Vyberte si podle svého hardwaru.
- Snižování šumu prostřednictvím DeepFilterNet a detekce aktivity hlasu přes Silero VAD, oba běží lokálně.
- Klíčová slova — Vložte názvy, zkratky a termíny domén jako nápovědy během procesu inference (není potřeba přeškolování).
Jedna věc ne V verzi 1.0: doladění modelu. Starší verze toho využívaly PyTorch, ale když jsme přesunuli proces inference na GGUF, narušili jsme trénovací proces, a proto to nezasíláme, dokud nebude konverzní krok spolehlivý. Viz Příspěvek o plánu na doladění.
Ceny
Jednorázová koupě, bez předplatného:
- Osobní — 49 $, 2 stroje, vhodné pro soukromé i nezávislé komerční využití.
- Podnikání — 149 $/místo, využití pro týmy/organizace s slevami při objednávce od 10 míst.
- 14denní bezplatná zkušební verze — bez kreditní karty, všechny funkce odemčeny.
Ceny se automaticky přizpůsobují podle regionu: pokud se nacházíte ve východní Evropě, jihovýchodní Asii, Latinské Americe nebo Africe, uvidíte ceny podle parity kupní síly. Osobní licence v Polsku stojí přibližně 39 dolarů, v Indii 29 dolarů.
Co jsme udělali správně
To, čím jsme nejšťastnější, je čas do prvního slovaOtevřete aplikaci, stiskněte svou klávesu s přiřazeným příkazem a mluvte. Žádné registrace, žádný prohlížeč, žádné nahrávání, žádné čekání na zpracování v cloudu. Na notebooku střední třídy dokáže Voice Pro přepsat pětisekundovou větu za méně než 400 ms s základním modelem. Právě tato rychlost byla hlavním cílem.
Co bude dál
- verze pro macOS — v průběhu práce, cíl: 3. čtvrtletí 2026.
- Dokonalé přizpůsobení vašemu hlasu a slovníku — bude k dispozici, jakmile bude hotový proces převodu z PyTorch do GGUF. Cíl: 3. čtvrtletí 2026.
- Režim streamování v reálném čase — slova se zobrazují v okamžiku, kdy mluvíte, a ne až po uvolnění klávesy.
- Více úrovní modelů — ultrakompaktní model určený k použití na zařízeních s omezenými prostředky a model o velikosti 7 miliard parametrů pro výkonnější stroje.
Pokud jste čekali na nástroj pro dikci, který respektuje soukromí, dnes je ten správný den. Stáhněte si zkušební verzi, diktuujte po dobu 14 dní a dejte nám vědět, kde selhává. Přečteme si každý e-mail.