Vlastnosti — Brethof Voice Pro

🔒

Úplná soukromost

Každé slovo, které řeknete, je zpracováno na vašem zařízení. Žádný zvuk, text ani metadata nejsou nikdy odesílány na žádný server. Neexistuje cloudový backend, žádná telemetrie, žádná analýza a žádné hlášení zpět.

Žádné síťové volání během transkripce
Modely uložené lokálně po jednorázovém stažení
Open-source engine Qwen3-ASR – zcela kontrolovatelný

⚡

Akcelerace GPU

Brethof Voice Pro využívá engine optimalizovaný pro formát GGUF spolu s nástrojem llama.cpp pro mimořádně rychlé zpracování. Od začátku podporuje všechny tři hlavní výrobce GPU.

NVIDIA — urychlení prostřednictvím Vulkanu (GTX 10-series a novější modely)
AMD — urychlení prostřednictvím Vulkanu (série RX 500 a novější)
Intel — urychlení prostřednictvím Vulkanu (GPU Arc a integrované grafiky)
Náhradní režim CPU — běží bez GPU, jen pomaleji

🌐

Přepis offline – 30 jazyků + 22 čínských nářečí

Poháněno nástrojem Qwen3-ASR prostřednictvím llama.cpp. Pro maximální přesnost můžete nastavit jazyk, nebo nechat engine automaticky určit jazyk. Všechna slova zůstávají na vašem počítači.

angličtinačínštinakantonská čínštinaarabský jazyk NěmčinaFrancouzštinašpanělštinaportugalsky ItalštinanizozemštinaRuskyindonéština korejštinaThajštinaVietnamskyjaponsky TurečtinaNení k dispozici.Malajštinašvédština dánskyFinskýPolskyčeština FilipínskyperskýŘečtinarumunština maďarštinaMakedonština

Kromě toho 22 čínských regionálních nářečí (Anhui, Dongbei, Fujian, Henan, Hunan, Shandong, Sichuan, Wu, Minnan a další), která jsou automaticky rozpoznána, je-li jazyk nastaven na čínštinu nebo automatické rozpoznání.

💬

Překlad offline – 38 jazyků Novinky v verzi 2.0.0

Překládejte jakékoli transkripce, výstupy z hlasové klávesnice, běžný text nebo soubory s titulky – výhradně na vašem počítači. Poháněno Tencent Hunyuan MT2: V rámci FLORES-200 (XCOMET-XXL) dosahuje úroveň kvality 97,9 % Google Gemini 3.1 Pro A kompaktní verze Fast dosahuje 89,9 %, přičemž převyšuje Gemini 3.1 Pro v reálných podmínkách (WildMTBench) i při překladu jazyků menšin.

čínštinaangličtinaFrancouzštinaportugalsky španělštinajaponskyTurečtinaRusky arabský jazykkorejštinaThajštinaItalština NěmčinaVietnamskyMalajštinaindonéština FilipínskyNení k dispozici.Překlad z čínštinyPolsky češtinanizozemštinaKhmerbarmský perskýGudžarátštinaUrdutelugština maráthštinahebrejštinabengálštinaTamilština Ukrajinskýkantonská čínštinatibetštinaKazachstán mongolštinaUjgurština

Transkribovat + překládat — Vyberte cílový jazyk v okně Transcribe; ASR přepisuje, MT překládá, oba zobrazují se vedle sebe
Překlad hlasové klávesnice — mluvte, vybírejte cíle z jazykové sítě se 3 sloupci, klávesnice vypíše překlad
Překladač titulků — Soubory SRT/VTT v jakémkoli z 38 jazyků, s volitelným dvoujazyčným režimem (zdroj + překlad u každého záznamu)
Dva úrovně modelů — Rychlé překladání (~1 GB) během několika sekund na CPU nebo GPU; kvalitní překladání (~4,3 GB) během několika sekund na GPU
Nezávislý výběrek zařízení — spusťte ASR na Vulkan 0, překlad na Vulkan 1, nebo obojí na CPU

📈

Dva velikosti modelů

Vyberte si rovnováhu mezi přesností, rychlostí a množstvím VRAM, která vyhovuje vašemu počítači. Obě verze využívají stejnou architekturu Qwen3-ASR; můžete mezi nimi kdykoli přepínat z nabídky Nastavení → Modely.

0,6 miliardy — malý, rychlý, funguje na integrovaných GPU nebo jakékoli kartě s Vulkan a 4 GB paměti. Doporučená výchozí volba pro notebooky.
1,7 miliardy — vyšší přesnost u audio s diakritikou nebo šumem. Funkční s 6 GB+ VRAM. Nejmodernější řešení mezi otevřenými ASR systémy.

Volitelné doplňky lze stahovat na požádání z Nastavení → Modely: Vynucený zarovnávač (~540 MB) pro časové značky na úrovni slov, Hunyuan MT2 Fast (~1 GB) nebo Kvalita (~4,3 GB) na překlad.

🎵

Snížení šumu pomocí AI

Volitelné potlačení šumu pomocí DeepFilter pro nahrávky pořízené v hlučných prostorách – výchozím nastavením je vypnuté, lze ho aktivovat z nabídky Noise. Jeho vynechání u čistých zvukových úryvků ve skutečnosti zlepšuje kvalitu (DeepFilter může nadměrně zpracovávat krátké, čisté zvuky).

Odstraňuje šum v pozadí, klepání klávesnice a ozvěnu v místnosti
Nastavitelná atenuace
Není potřeba žádné další hardwarové vybavení
Výchozím nastavením vypnuté – přepnout mezi zapnutím při každém nahrávání nebo neustálým provozem

🎓

Osobní trénink hlasu

Přizpůsobte model svému vlastnímu hlasu pomocí LoRA – celý proces probíhá přímo na vašem počítači. Pokaždé, když opravíte špatně rozpoznané slovo, je pár {clip, correction} uložen do vašeho místního souboru dat určeného k trénování. Karta trénování v hlavním okně okamžitě zobrazuje celkový počet vzorků a strávených minut – klikněte na ni pro otevření prohlížeče souborů dat a poté na kartě Trénování na tlačítko „Začít trénovat“.

Přizpůsobte se vašemu přízvuku, dialektu a rytmu mluvení.
Úpravy se automaticky ukládají – prostě pokračujte v používání aplikace.
Dolaďování pomocí LoRA – rychlé, efektivní, bez úplného přetrénování
Automatické výběry NVIDIA CUDA (cu128 PyTorch) nebo CPU backend
Po dokončení automaticky exportuje trénovaný model do formátu GGUF.
Vaše hlasová data nikdy neopouštějí váš počítač.
Zdarma k každé placené licenci

⌨️

Hlasová klávesnice a přímá vložka textu

Udržte stisknutou klávesu, mluvte a text se objeví tam, kde se nachází váš kurzor – jako u klávesnice. Funguje v prohlížečích, IDE, terminálech, aplikacích na chatování, kdekoli textové pole přijímá vstup z klávesnice.

Výchozí klávesa s rychlým přístupem F9 — konfigurovatelné, režim nahrávání po stisknutí nebo přepínání
Volitelné spuštění pomocí pravého tlačítka myši pro nahrávání bez rukou
Čip pro živý překlad — Mluvte v jednom jazyce, klávesnice vygeneruje překlad. Vyberte jeden nebo více cílových jazyků z 3sloupcové mřížky: jeden na řádek, v rámci textu.EN: … || PL: …), nebo pouze první cíl.
Funguje s jakýmkoli textovým polem, editorem, terminálem nebo chatem.
X11 a Wayland v Linuxu, nativní vstup v Windows

📚

Kontext a terminologie hotwordů

Jedno zařízení, dvě využití. Zaujatost ASR v případě vlastních jmen, názvů značek a odborné terminologie – zabraňuje nesprávnému přepisu „VFIO“ na „VEAF1“. Stejné pole slouží také jako slovník terminologie pro překlad — Přiřaďte „Brethof Voice“ tak, aby v každém cílovém jazyce zůstalo „Brethof Voice“.

Přidejte položky v Nastaveních — jednu na řádek
Zlepšuje rozpoznávání vlastních jmen a zkratků
V překladech se zachovávají názvy značek a odborné termíny.
Není potřeba přeškolení – používá se během zpracování požadavku.

🤖

MCP Server pro umělé inteligentní agenty Platné plány

Stejný binář, který spouští grafické rozhraní, může být také použit jako server Model Context Protocol – 19 nástrojů, které umožňují využití funkcí ASR a MT v aplikacích Claude Desktop, Claude Code, Cursor, Cline nebo jakémkoli jiném agentovi kompatibilním s MCP. Přenos dat probíhá prostřednictvím stdio: žádný port, žádná firewall, žádné připojení k localhostu. Životní cyklus agenta je pod jeho kontrolou.

Přepisujte soubory audio/video, nahrávky z mikrofonu nebo systémový zvuk.
Přeložte text, SRT nebo VTT (podporován dvoujazyčný režim).
Přepněte v průběhu provozu výpočetní zařízení ASR nebo MT
Seznam a výběr osobních hlasových profilů
Čtení/zápis jakéhokoli nastavení aplikace z agenta

Spusťte brethof-voice --mcp A agent se připojuje přes stdio. Vyžaduje se placená licence – uživatelé v zkušební verzi nemohou spustit server.

Všechno v Jedna aplikace

Úplná soukromost

Akcelerace GPU

Přepis offline – 30 jazyků + 22 čínských nářečí

Překlad offline – 38 jazyků Novinky v verzi 2.0.0

Dva velikosti modelů

Snížení šumu pomocí AI

Osobní trénink hlasu

Hlasová klávesnice a přímá vložka textu

Kontext a terminologie hotwordů

MCP Server pro umělé inteligentní agenty Platné plány

Jste připraveni to vyzkoušet?

Vše, co vytváříme

Brethof Voice Pro

Brethof Mind

3D modely

3D tisk

Nova

Skvělé seznamy

Průvodce

Pracovní postupy ComfyUI

Seznam úrovní proti devům

O Brethof AI