Is my voice data sent to any server?

No. Brethof Voice Pro processes everything locally on your device. No audio or text data ever leaves your computer. There is no cloud component, no telemetry, and no analytics.

Any modern GPU works. NVIDIA, AMD, and Intel Arc all use Vulkan acceleration. You can also run on CPU only, though transcription will be slower. The 0.6B model runs comfortably on integrated graphics or any 4 GB+ Vulkan card.

Which model size should I choose?

Start with the 0.6B model — it is the recommended default and runs great on most GPUs. If you need higher accuracy on accented or noisy audio, switch to the 1.7B model (needs 6 GB+ VRAM). You can switch sizes at any time from Settings → Models without re-downloading.

Does it work on Linux and Windows?

Yes. Brethof Voice Pro supports both Linux and Windows natively. On Linux it works with X11 and Wayland. On Windows it runs as a standard desktop application.

What happens after my update pass expires?

Your license is perpetual — the app keeps working forever with whatever version you have. The optional $20/year Update Pass gives you access to new features and model improvements. Without it, you simply stay on your current version.

Can I train the model on my voice?

Personal model training is included in v2.0.0. The app collects training data from your corrections, then fine-tunes a custom LoRA adapter on your machine — your voice data never leaves your device.

Brethof Voice Pro — oprogramowanie do konwersji głosu na tekst w trybie offline

Dlaczego Voice Pro

Wszystko, czego potrzebujesz, niczego, czego nie potrzebujesz

Profesjonalny przetwornik mowy na tekst, napędzany silnikiem Qwen3-ASR z optymalizacją GGUF.

🔒

Pełna prywatność

Każde słowo, które wypowiesz, jest przetwarzane lokalnie. Nic nie jest wysyłane na serwer. Twoje dane zawsze pozostają na twoim urządzeniu.

🌐

30 języków + 22 dialekty chińskie

Zaawansowane oprogramowanie do rozpoznawania mowy Qwen3-ASR. Można wybrać konkretny język lub pozwolić silnikowi na automatyczne wykrycie języka. Automatycznie rozpoznaje 22 chińskie dialekty regionalne.

💬

Tłumaczenie offline — 38 języków Nowości w wersji 2.0.0

Tencent Hunyuan MT2 – jakość tłumaczenia porównywalna z Google Gemini 3.1 Pro w teście FLORES-200 (XCOMET-XXL), działające w całości na Twoim własnym komputerze. Można nim tłumaczyć dowolne transkrypcje, wyniki wprowadzane za pomocą klawiatury głosowej lub pliki napisów w formacie SRT/VTT.

✈️

Całkowicie offline

Pobierz model raz (~1–3 GB dla ASR, opcjonalnie ~1 lub ~4,3 GB dla tłumaczenia). Po ustawieniach nie jest potrzebne połączenie z Internetem.

📈

Dwa rozmiary modeli

0,6 miliarda parametrów dla laptopów i GPU zintegrowanych, 1,7 miliarda parametrów dla wyższej dokładności przy dźwięku z akcentami lub z szumem. Można zmieniać w dowolnym momencie z zakładki Ustawienia → Modele.

🎓

Osobiste szkolenie głosu

Dostosuj syntezę głosu do swojego akcentu za pomocą LoRA — przetwarzanie odbywa się w całości na twoim komputerze. Automatycznie zapisuje korekty z codziennego użytkowania i po zakończeniu eksportuje je do formatu GGUF. Dostępne bezpłatnie przy każdej licencji płatnej.

💰

Płatność raz, własność na zawsze

Licencja dożywotnia. Brak opłat miesięcznych, brak ograniczeń korzystania, brak liczenia tokenów. Jedna zakupiona licencja zapewnia dostęp na całe życie.

🎵

Wbudowana funkcja redukcji szumów

Opcjonalne tłumienie szumów za pomocą DeepFilter dla nagrań w hałaśliwych pomieszczeniach. Wyłączone domyślnie – włącz je z menu „Szum” w momencie potrzeby.

⌨️

Klawiatura głosowa + chip tłumaczeniowy

Utrzymaj naciśnięty klawisz F9, mów, a tekst pojawi się w miejscu, gdzie znajduje się kursor. Opcjonalnie chip tłumaczeniowy może wpisać przetłumaczony tekst — mów w jednym języku, pisz w innym.

Rozmiary modeli

Dwie wielkości, decyzja należy do ciebie

Oba wykorzystują tę samą architekturę Qwen3-ASR. Wybierz jeden raz, a w dowolnym momencie możesz zmienić go z zakładki Ustawienia → Modele.

Zalecane

0,6 miliarda

Kompaktowy · Vulkan / CPU

~1–1.5 GB

Domyślny wybór dla laptopów i kart graficznych zintegrowanych. Działa na każdej karcie Vulkan o pojemności co najmniej 4 GB. Doskonała jakość przy niewielkich rozmiarach.

1,7 miliarda

Wielki · Vulkan / CPU

~2–3 GB

Wyższa dokładność przy dźwięku z akcentami lub z szumem. Kompatybilne z VRAM o pojemności 6 GB+. Najnowocześniejsze rozwiązanie wśród otwartych systemów ASR.

Dodatkowe moduły można pobrać na żądanie z Ustawień → Modele:

Forced Aligner (~540 MB) dla czasów oznaczonych na poziomie słów · Hunyuan MT2 Fast (~1 GB) lub Jakość (~4,3 GB) na potrzeby tłumaczenia.

Porównanie

Jak dokonujemy porównań

Funkcja	Brethof Voice Pro	Smok	Google STT	Otter.ai	Whisper (OSS)
100% przetwarzania lokalnego	✓	✓	✗	✗	✓
Licencja wieczysta	✓	~	✗	✗	✓
Rdzenna obsługa Linuxa	✓	✗	~	✗	✓
Natywna obsługa Windowsa	✓	✓	~	✗	~
30 języków ASR + automatyczne wykrywanie	✓	✗	✓	~	✓
Tłumaczenie offline (38 języków)	✓	✗	✗	✗	✗
Przyspieszenie GPU (NVIDIA + AMD + Intel)	✓	✗	N/A	N/A	~
Doprecyzowanie modelu osobistego (LoRA)	✓	✓	✗	✗	✗
Serwer MCP dla agentów AI	✓	✗	✗	✗	✗
Wbudowana funkcja redukcji szumów	✓	✓	✓	✓	✗
Bezpośrednia injekcja tekstu	✓	✓	✗	✗	✗
Ulepszona interfejs graficzna na komputerze stacjonarnym	✓	✓	✗	✓	✗
Typowa cena	$49 kiedyś	350$/rok	17 dolarów/miesiąc	17 dolarów/miesiąc	Darmowy

Ceny

Płacisz raz. Posiadasz na zawsze.

Brak opłat miesięcznych. Brak ograniczeń korzystania. Licencja dożywotnia z 1 rokiem aktualizacji w cenie.

Bezpłatna próba

$ 0

Nie potrzebna jest karta kredytowa. Wystarczy e-mail w celu potwierdzenia próbnego okresu używania.

✓ Obie wielkości modeli (0,6 mld + 1,7 mld)
✓ Przyspieszenie za pomocą GPU
✓ 30 ASR + 38 języków tłumaczenia
✓ Redukcja szumów
× Brak indywidualnych treningów (tylko plany płatne)
× Brak serwera MCP (tylko plany płatne)
× 14-dniowy limit

Rozpocznij bezpłatną próbę

Najpopularniejsze

Osobiste

$ 49

Cena regularna: $99

Licencja dożywotnia. 2 urządzenia osobiste. W cenie 1 rok aktualizacji.

✓ Licencja wieczysta (opłata jednorazowa)
✓ 2 urządzenia osobiste
✓ Obie wersje ASR (0,6 mld + 1,7 mld)
✓ Tłumaczenie offline (38 języków)
✓ Osobiste szkolenie głosu (LoRA)
✓ Serwer MCP dla agentów AI
✓ 1 rok aktualizacji
✓ Do użycia indywidualnego i jako freelancer

Kup licencję osobistą

Ceny bez podatku. Następnie 20 dolarów rocznie za aktualizacje (opcjonalne).

Biznes

$ 149 /seat

Cena regularna: $249/seat

Licencja dożywotnia na jedno urządzenie. Do użytku w zespołach i organizacjach. 1 rok aktualizacji.

✓ Licencja wieczysta (na jedno stanowisko)
✓ Użycie przez zespoły i organizacje
✓ Obie wersje ASR (0,6 mld + 1,7 mld)
✓ Tłumaczenie offline (38 języków)
✓ Osobiste szkolenie głosu (LoRA)
✓ Serwer MCP dla agentów AI
✓ Priorytetowe wsparcie
✓ Zniżki za większą liczbę sztuk (10+ miejsc)

Kup licencję biznesową

Ceny bez podatku. Następnie 20 dolarów za miejsce rocznie za aktualizacje (opcjonalne).

FAQ

Często zadawane pytania

Nie. Brethof Voice Pro przetwarza wszystko lokalnie na twoim urządzeniu. Żadne dane audio ani tekstowe nie opuszczają twojego komputera. Nie ma komponentu chmurowego, żadnej telemetrii ani analizy danych.

Wystarczy dowolna nowoczesna karta graficzna. NVIDIA, AMD oraz Intel Arc wykorzystują przyspieszenie Vulkan. Można również korzystać wyłącznie z procesora CPU, choć transkrypcja będzie wolniejsza. Model o pojemności 0,6 miliarda parametrów działa sprawnie zarówno z grafiką wbudowaną, jak i z dowolną kartą graficzną obsługującą Vulkan o pojemności co najmniej 4 GB.

Zacznij od Model 0,6 miliarda — jest to zalecana wartość domyślna i działa doskonale na większości kart graficznych (a nawet na procesorze w większości nowoczesnych komputerów). Jeśli potrzebujesz wyższej dokładności przy dźwięku z akcentami lub z szumem, przejdź na Model 1,7 miliarda (Wymaga co najmniej 6 GB pamięci VRAM). Możesz w dowolnym momencie zmienić rozmiar w ustawieniach → Modele bez konieczności ponownego pobierania.

Tak. Brethof Voice Pro obsługuje zarówno Linux, jak i Windows w sposób natywny. Na Linuxie działa z X11 i Wayland. Na Windowsie funkcjonuje jako standardowa aplikacja biurowa.

Twoja licencja jest trwała – aplikacja będzie funkcjonować wiecznie, niezależnie od wersji, którą posiadasz. Opcjonalny abonament Update Pass w cenie 20 dolarów rocznie umożliwia dostęp do nowych funkcji oraz ulepszeń modeli. Bez niego pozostajesz przy obecnej wersji.

Tak — trening głosu osobistego jest już dostępny w wersji v2.0.0 i odbywa się w całości na twoim komputerze. Za każdym razem, gdy poprawiasz błędnie rozpoznane słowo, para {clip, correction} jest automatycznie zapisywana do twojego lokalnego zestawu danych treningowych. Karta treningu w głównym oknie pokazuje od razu łączną liczbę próbek oraz minut nagrań — kliknij „Start training” na karcie Training, aby dostosować model LoRA do twojego akcentu. Wynik jest automatycznie eksportowany w formacie GGUF, który można szybko otworzyć jednym kliknięciem. Dostępny bezpłatnie przy każdej licencji płatnej, twoje dane głosowe nigdy nie opuszczają twojego komputera.