NOVÉ · v2.0.0

Všechno v Jedna aplikace

Přepis 30 jazyků + 22 čínských nářečí

Přeložte 38 jazyků, zcela offline

Časová značka vytvořte si vlastní titulky

MCP server Mluvte s ním prostřednictvím svého AI stacku

Funguje lokálně – dokonce i na noteboocíchŽádné předplatné14denní bezplatná zkušební verze

Brethof Voice Pro — Main Screen
Brethof Voice Pro — Recording
🔒

Úplná soukromost

Každé slovo, které řeknete, je zpracováno na vašem zařízení. Žádný zvuk, text ani metadata nejsou nikdy odesílány na žádný server. Neexistuje cloudový backend, žádná telemetrie, žádná analýza a žádné hlášení zpět.

  • Žádné síťové volání během transkripce
  • Modely uložené lokálně po jednorázovém stažení
  • Open-source engine Qwen3-ASR – zcela kontrolovatelný

Akcelerace GPU

Brethof Voice Pro využívá engine optimalizovaný pro formát GGUF spolu s nástrojem llama.cpp pro mimořádně rychlé zpracování. Od začátku podporuje všechny tři hlavní výrobce GPU.

  • NVIDIA — urychlení prostřednictvím Vulkanu (GTX 10-series a novější modely)
  • AMD — urychlení prostřednictvím Vulkanu (série RX 500 a novější)
  • Intel — urychlení prostřednictvím Vulkanu (GPU Arc a integrované grafiky)
  • Náhradní režim CPU — běží bez GPU, jen pomaleji
🌐

Přepis offline – 30 jazyků + 22 čínských nářečí

Poháněno nástrojem Qwen3-ASR prostřednictvím llama.cpp. Pro maximální přesnost můžete nastavit jazyk, nebo nechat engine automaticky určit jazyk. Všechna slova zůstávají na vašem počítači.

angličtinačínštinakantonská čínštinaarabský jazyk NěmčinaFrancouzštinašpanělštinaportugalsky ItalštinanizozemštinaRuskyindonéština korejštinaThajštinaVietnamskyjaponsky TurečtinaNení k dispozici.Malajštinašvédština dánskyFinskýPolskyčeština FilipínskyperskýŘečtinarumunština maďarštinaMakedonština

Kromě toho 22 čínských regionálních nářečí (Anhui, Dongbei, Fujian, Henan, Hunan, Shandong, Sichuan, Wu, Minnan a další), která jsou automaticky rozpoznána, je-li jazyk nastaven na čínštinu nebo automatické rozpoznání.

💬

Překlad offline – 38 jazyků Novinky v verzi 2.0.0

Překládejte jakékoli transkripce, výstupy z hlasové klávesnice, běžný text nebo soubory s titulky – výhradně na vašem počítači. Poháněno Tencent Hunyuan MT2: V rámci FLORES-200 (XCOMET-XXL) dosahuje úroveň kvality 97,9 % Google Gemini 3.1 Pro A kompaktní verze Fast dosahuje 89,9 %, přičemž převyšuje Gemini 3.1 Pro v reálných podmínkách (WildMTBench) i při překladu jazyků menšin.

čínštinaangličtinaFrancouzštinaportugalsky španělštinajaponskyTurečtinaRusky arabský jazykkorejštinaThajštinaItalština NěmčinaVietnamskyMalajštinaindonéština FilipínskyNení k dispozici.Překlad z čínštinyPolsky češtinanizozemštinaKhmerbarmský perskýGudžarátštinaUrdutelugština maráthštinahebrejštinabengálštinaTamilština Ukrajinskýkantonská čínštinatibetštinaKazachstán mongolštinaUjgurština
  • Transkribovat + překládat — Vyberte cílový jazyk v okně Transcribe; ASR přepisuje, MT překládá, oba zobrazují se vedle sebe
  • Překlad hlasové klávesnice — mluvte, vybírejte cíle z jazykové sítě se 3 sloupci, klávesnice vypíše překlad
  • Překladač titulků — Soubory SRT/VTT v jakémkoli z 38 jazyků, s volitelným dvoujazyčným režimem (zdroj + překlad u každého záznamu)
  • Dva úrovně modelů — Rychlé překladání (~1 GB) během několika sekund na CPU nebo GPU; kvalitní překladání (~4,3 GB) během několika sekund na GPU
  • Nezávislý výběrek zařízení — spusťte ASR na Vulkan 0, překlad na Vulkan 1, nebo obojí na CPU
📈

Dva velikosti modelů

Vyberte si rovnováhu mezi přesností, rychlostí a množstvím VRAM, která vyhovuje vašemu počítači. Obě verze využívají stejnou architekturu Qwen3-ASR; můžete mezi nimi kdykoli přepínat z nabídky Nastavení → Modely.

  • 0,6 miliardy — malý, rychlý, funguje na integrovaných GPU nebo jakékoli kartě s Vulkan a 4 GB paměti. Doporučená výchozí volba pro notebooky.
  • 1,7 miliardy — vyšší přesnost u audio s diakritikou nebo šumem. Funkční s 6 GB+ VRAM. Nejmodernější řešení mezi otevřenými ASR systémy.

Volitelné doplňky lze stahovat na požádání z Nastavení → Modely: Vynucený zarovnávač (~540 MB) pro časové značky na úrovni slov, Hunyuan MT2 Fast (~1 GB) nebo Kvalita (~4,3 GB) na překlad.

🎵

Snížení šumu pomocí AI

Volitelné potlačení šumu pomocí DeepFilter pro nahrávky pořízené v hlučných prostorách – výchozím nastavením je vypnuté, lze ho aktivovat z nabídky Noise. Jeho vynechání u čistých zvukových úryvků ve skutečnosti zlepšuje kvalitu (DeepFilter může nadměrně zpracovávat krátké, čisté zvuky).

  • Odstraňuje šum v pozadí, klepání klávesnice a ozvěnu v místnosti
  • Nastavitelná atenuace
  • Není potřeba žádné další hardwarové vybavení
  • Výchozím nastavením vypnuté – přepnout mezi zapnutím při každém nahrávání nebo neustálým provozem
🎓

Osobní trénink hlasu

Přizpůsobte model svému vlastnímu hlasu pomocí LoRA – celý proces probíhá přímo na vašem počítači. Pokaždé, když opravíte špatně rozpoznané slovo, je pár {clip, correction} uložen do vašeho místního souboru dat určeného k trénování. Karta trénování v hlavním okně okamžitě zobrazuje celkový počet vzorků a strávených minut – klikněte na ni pro otevření prohlížeče souborů dat a poté na kartě Trénování na tlačítko „Začít trénovat“.

  • Přizpůsobte se vašemu přízvuku, dialektu a rytmu mluvení.
  • Úpravy se automaticky ukládají – prostě pokračujte v používání aplikace.
  • Dolaďování pomocí LoRA – rychlé, efektivní, bez úplného přetrénování
  • Automatické výběry NVIDIA CUDA (cu128 PyTorch) nebo CPU backend
  • Po dokončení automaticky exportuje trénovaný model do formátu GGUF.
  • Vaše hlasová data nikdy neopouštějí váš počítač.
  • Zdarma k každé placené licenci
⌨️

Hlasová klávesnice a přímá vložka textu

Udržte stisknutou klávesu, mluvte a text se objeví tam, kde se nachází váš kurzor – jako u klávesnice. Funguje v prohlížečích, IDE, terminálech, aplikacích na chatování, kdekoli textové pole přijímá vstup z klávesnice.

  • Výchozí klávesa s rychlým přístupem F9 — konfigurovatelné, režim nahrávání po stisknutí nebo přepínání
  • Volitelné spuštění pomocí pravého tlačítka myši pro nahrávání bez rukou
  • Čip pro živý překlad — Mluvte v jednom jazyce, klávesnice vygeneruje překlad. Vyberte jeden nebo více cílových jazyků z 3sloupcové mřížky: jeden na řádek, v rámci textu.EN: … || PL: …), nebo pouze první cíl.
  • Funguje s jakýmkoli textovým polem, editorem, terminálem nebo chatem.
  • X11 a Wayland v Linuxu, nativní vstup v Windows
📚

Kontext a terminologie hotwordů

Jedno zařízení, dvě využití. Zaujatost ASR v případě vlastních jmen, názvů značek a odborné terminologie – zabraňuje nesprávnému přepisu „VFIO“ na „VEAF1“. Stejné pole slouží také jako slovník terminologie pro překlad — Přiřaďte „Brethof Voice“ tak, aby v každém cílovém jazyce zůstalo „Brethof Voice“.

  • Přidejte položky v Nastaveních — jednu na řádek
  • Zlepšuje rozpoznávání vlastních jmen a zkratků
  • V překladech se zachovávají názvy značek a odborné termíny.
  • Není potřeba přeškolení – používá se během zpracování požadavku.
🤖

MCP Server pro umělé inteligentní agenty Platné plány

Stejný binář, který spouští grafické rozhraní, může být také použit jako server Model Context Protocol – 19 nástrojů, které umožňují využití funkcí ASR a MT v aplikacích Claude Desktop, Claude Code, Cursor, Cline nebo jakémkoli jiném agentovi kompatibilním s MCP. Přenos dat probíhá prostřednictvím stdio: žádný port, žádná firewall, žádné připojení k localhostu. Životní cyklus agenta je pod jeho kontrolou.

  • Přepisujte soubory audio/video, nahrávky z mikrofonu nebo systémový zvuk.
  • Přeložte text, SRT nebo VTT (podporován dvoujazyčný režim).
  • Přepněte v průběhu provozu výpočetní zařízení ASR nebo MT
  • Seznam a výběr osobních hlasových profilů
  • Čtení/zápis jakéhokoli nastavení aplikace z agenta

Spusťte brethof-voice --mcp A agent se připojuje přes stdio. Vyžaduje se placená licence – uživatelé v zkušební verzi nemohou spustit server.

Jste připraveni to vyzkoušet?

14denní bezplatná zkušební verze. Všechny funkce jsou k dispozici. Nepotřebujete kreditní kartu.

Vše, co vytváříme

Externí:   YouTube · GitHub