Najnowocześniejsza technologia transkrypcji i tłumaczenia AI, działająca w całości na twoim urządzeniu. Mów w 30 językach, tłumacz na 38 — bez chmury, bez subskrypcji, bez zbierania danych.
Nie wymagane karty kredytowej. Działa offline po konfiguracji.
Profesjonalny przetwornik mowy na tekst, napędzany silnikiem Qwen3-ASR z optymalizacją GGUF.
Każde słowo, które wypowiesz, jest przetwarzane lokalnie. Nic nie jest wysyłane na serwer. Twoje dane zawsze pozostają na twoim urządzeniu.
Zaawansowane oprogramowanie do rozpoznawania mowy Qwen3-ASR. Można wybrać konkretny język lub pozwolić silnikowi na automatyczne wykrycie języka. Automatycznie rozpoznaje 22 chińskie dialekty regionalne.
Tencent Hunyuan MT2 – jakość tłumaczenia porównywalna z Google Gemini 3.1 Pro w teście FLORES-200 (XCOMET-XXL), działające w całości na Twoim własnym komputerze. Można nim tłumaczyć dowolne transkrypcje, wyniki wprowadzane za pomocą klawiatury głosowej lub pliki napisów w formacie SRT/VTT.
Pobierz model raz (~1–3 GB dla ASR, opcjonalnie ~1 lub ~4,3 GB dla tłumaczenia). Po ustawieniach nie jest potrzebne połączenie z Internetem.
0,6 miliarda parametrów dla laptopów i GPU zintegrowanych, 1,7 miliarda parametrów dla wyższej dokładności przy dźwięku z akcentami lub z szumem. Można zmieniać w dowolnym momencie z zakładki Ustawienia → Modele.
Dostosuj syntezę głosu do swojego akcentu za pomocą LoRA — przetwarzanie odbywa się w całości na twoim komputerze. Automatycznie zapisuje korekty z codziennego użytkowania i po zakończeniu eksportuje je do formatu GGUF. Dostępne bezpłatnie przy każdej licencji płatnej.
Licencja dożywotnia. Brak opłat miesięcznych, brak ograniczeń korzystania, brak liczenia tokenów. Jedna zakupiona licencja zapewnia dostęp na całe życie.
Opcjonalne tłumienie szumów za pomocą DeepFilter dla nagrań w hałaśliwych pomieszczeniach. Wyłączone domyślnie – włącz je z menu „Szum” w momencie potrzeby.
Utrzymaj naciśnięty klawisz F9, mów, a tekst pojawi się w miejscu, gdzie znajduje się kursor. Opcjonalnie chip tłumaczeniowy może wpisać przetłumaczony tekst — mów w jednym języku, pisz w innym.
Oba wykorzystują tę samą architekturę Qwen3-ASR. Wybierz jeden raz, a w dowolnym momencie możesz zmienić go z zakładki Ustawienia → Modele.
Domyślny wybór dla laptopów i kart graficznych zintegrowanych. Działa na każdej karcie Vulkan o pojemności co najmniej 4 GB. Doskonała jakość przy niewielkich rozmiarach.
Wyższa dokładność przy dźwięku z akcentami lub z szumem. Kompatybilne z VRAM o pojemności 6 GB+. Najnowocześniejsze rozwiązanie wśród otwartych systemów ASR.
Dodatkowe moduły można pobrać na żądanie z Ustawień → Modele:
Forced Aligner (~540 MB) dla czasów oznaczonych na poziomie słów · Hunyuan MT2 Fast (~1 GB) lub Jakość (~4,3 GB) na potrzeby tłumaczenia.
| Funkcja | Brethof Voice Pro | Smok | Google STT | Otter.ai | Whisper (OSS) |
|---|---|---|---|---|---|
| 100% przetwarzania lokalnego | ✓ | ✓ | ✗ | ✗ | ✓ |
| Licencja wieczysta | ✓ | ~ | ✗ | ✗ | ✓ |
| Rdzenna obsługa Linuxa | ✓ | ✗ | ~ | ✗ | ✓ |
| Natywna obsługa Windowsa | ✓ | ✓ | ~ | ✗ | ~ |
| 30 języków ASR + automatyczne wykrywanie | ✓ | ✗ | ✓ | ~ | ✓ |
| Tłumaczenie offline (38 języków) | ✓ | ✗ | ✗ | ✗ | ✗ |
| Przyspieszenie GPU (NVIDIA + AMD + Intel) | ✓ | ✗ | N/A | N/A | ~ |
| Doprecyzowanie modelu osobistego (LoRA) | ✓ | ✓ | ✗ | ✗ | ✗ |
| Serwer MCP dla agentów AI | ✓ | ✗ | ✗ | ✗ | ✗ |
| Wbudowana funkcja redukcji szumów | ✓ | ✓ | ✓ | ✓ | ✗ |
| Bezpośrednia injekcja tekstu | ✓ | ✓ | ✗ | ✗ | ✗ |
| Ulepszona interfejs graficzna na komputerze stacjonarnym | ✓ | ✓ | ✗ | ✓ | ✗ |
| Typowa cena | $49 kiedyś | 350$/rok | 17 dolarów/miesiąc | 17 dolarów/miesiąc | Darmowy |
Brak opłat miesięcznych. Brak ograniczeń korzystania. Licencja dożywotnia z 1 rokiem aktualizacji w cenie.
Nie potrzebna jest karta kredytowa. Wystarczy e-mail w celu potwierdzenia próbnego okresu używania.
Licencja dożywotnia. 2 urządzenia osobiste. W cenie 1 rok aktualizacji.
Ceny bez podatku. Następnie 20 dolarów rocznie za aktualizacje (opcjonalne).
Licencja dożywotnia na jedno urządzenie. Do użytku w zespołach i organizacjach. 1 rok aktualizacji.
Ceny bez podatku. Następnie 20 dolarów za miejsce rocznie za aktualizacje (opcjonalne).
Nie. Brethof Voice Pro przetwarza wszystko lokalnie na twoim urządzeniu. Żadne dane audio ani tekstowe nie opuszczają twojego komputera. Nie ma komponentu chmurowego, żadnej telemetrii ani analizy danych.
Wystarczy dowolna nowoczesna karta graficzna. NVIDIA, AMD oraz Intel Arc wykorzystują przyspieszenie Vulkan. Można również korzystać wyłącznie z procesora CPU, choć transkrypcja będzie wolniejsza. Model o pojemności 0,6 miliarda parametrów działa sprawnie zarówno z grafiką wbudowaną, jak i z dowolną kartą graficzną obsługującą Vulkan o pojemności co najmniej 4 GB.
Zacznij od Model 0,6 miliarda — jest to zalecana wartość domyślna i działa doskonale na większości kart graficznych (a nawet na procesorze w większości nowoczesnych komputerów). Jeśli potrzebujesz wyższej dokładności przy dźwięku z akcentami lub z szumem, przejdź na Model 1,7 miliarda (Wymaga co najmniej 6 GB pamięci VRAM). Możesz w dowolnym momencie zmienić rozmiar w ustawieniach → Modele bez konieczności ponownego pobierania.
Tak. Brethof Voice Pro obsługuje zarówno Linux, jak i Windows w sposób natywny. Na Linuxie działa z X11 i Wayland. Na Windowsie funkcjonuje jako standardowa aplikacja biurowa.
Twoja licencja jest trwała – aplikacja będzie funkcjonować wiecznie, niezależnie od wersji, którą posiadasz. Opcjonalny abonament Update Pass w cenie 20 dolarów rocznie umożliwia dostęp do nowych funkcji oraz ulepszeń modeli. Bez niego pozostajesz przy obecnej wersji.
Tak — trening głosu osobistego jest już dostępny w wersji v2.0.0 i odbywa się w całości na twoim komputerze. Za każdym razem, gdy poprawiasz błędnie rozpoznane słowo, para {clip, correction} jest automatycznie zapisywana do twojego lokalnego zestawu danych treningowych. Karta treningu w głównym oknie pokazuje od razu łączną liczbę próbek oraz minut nagrań — kliknij „Start training” na karcie Training, aby dostosować model LoRA do twojego akcentu. Wynik jest automatycznie eksportowany w formacie GGUF, który można szybko otworzyć jednym kliknięciem. Dostępny bezpłatnie przy każdej licencji płatnej, twoje dane głosowe nigdy nie opuszczają twojego komputera.
14-dniowy okres próbny bezpłatnie. Brak konieczności używania karty kredytowej. Brak chmury obliczeniowej. Żadnych kompromisów.
Lokalna konwersja mowy na tekst, która uczy się twojego głosu. Licencja dożywotnia. Nasz flagowy produkt.
PAID · flagship
Lokalna pamięć długoterminowa dla Claude Code — pełnotekstowa + wektorowa + grafowa, na SurrealDB. MIT.
BEZPŁATNE · open source
Gotowe do druku modele cyfrowe. Włączone pliki STL/3MF/OBJ. Dostęp dożywotni.
Płatny · katalog cyfrowy
Nasze drukowane projekty wysyłane po całej Europie. Kup produkt, a nie plik.
PŁATNE · przedmioty fizyczne
Host AI Cyber-tiger. Wyjaśnienie koncepcji AI skupiającej się na prywatności, bez korporacyjnych ograniczeń.
KANAŁ · transmisja na żywo
Wyselekcjonowane listy na GitHubie dotyczące AI, MCP, lokalnej AI, Linuxa do AI i wielu innych. Dowody, a nie tylko vibes.
BEZPŁATNE · starannie wybrane
Szczegółowe instrukcje dotyczące lokalnego AI na Linux, Windows i macOS. Prawdziwe konfiguracje, bez marketingu.
BEZPŁATNE · wkrótce dostępne
Sprawdzone w praktyce schematy ComfyUI — LTX chunked-loop, pipeline Nova i wiele innych.
BEZPŁATNIE · landing page workflowów
Negatywna kuracja: praktyki i narzędzia, które marnują Twój czas, sklasyfikowane. Paragon wymagany.
BEZPŁATNE · wkrótce dostępne
Kim jesteśmy, dlaczego tworzymy sztuczną inteligencję z naciskiem na lokalność i czego nie robimy.