Ogłoszenia o uruchomieniu, nowości z programu Champions Program, nowe funkcje oraz informacje z zakresu inżynierii pochodzące od zespołu Brethof Voice Pro.
Brethof Voice Pro to już nie tylko narzędzie do konwersji mowy na tekst. Wersja 2.0.0 jest już dostępna. tłumaczenie offline zasilane przez Tencent Hunyuan MT2 — na FLORES-200 (XCOMET-XXL) poziom 7B osiąga 97,9% Google Gemini 3.1 ProPrzewyższa również Gemini w testach związanych z rzeczywistym środowiskiem oraz językami mniejszościowymi. Tłumaczenie odbywa się wyłącznie na twoim urządzeniu. Dwa poziomy modeli do pobrania według potrzeb: szybki (~1 GB, czas przetwarzania poniżej sekundy na CPU lub GPU) oraz wysokiej jakości (~4,3 GB, czas przetwarzania poniżej sekundy na GPU). Ponadto kilka długo oczekiwanych ulepszeń.
Co nowego w wersji 2.0.0:
EN: … || PL: …), albo tylko pierwszy cel.translate_text, translate_srt, list_compute_devices, set_compute_deviceŁączna liczba narzędzi wynosi teraz 19.Binarny plik dla Linuxa ma rozmiar 161 MB, a instalator dla Windowsa – 118 MB. Te same ceny wydania: 49 dolarów dla użytkowników indywidualnych, 149 dolarów dla firm. Istniejące licencje są przenoszone – po prostu Pobierz wersję 2.0.0 A modele tłumaczeniowe pojawią się w Ustawieniach → Modele.
Pobierz wersję 2.0.0 →Proces szkolenia został wdrożony. Dostrojenie LoRA pod własny głos teraz działa w całości na twoim komputerze — aplikacja automatycznie wybiera NVIDIA CUDA or CPUNastępnie po zakończeniu automatycznie eksportuje przeszkolony model do formatu GGUF. Każda korekta dokonana w interfejsie graficznym jest automatycznie zapisywana do lokalnego zestawu danych treningowych; na karcie treningowej w głównym oknie od razu widać łączną liczbę próbek oraz czas trwania treningu.
Bonus: dokładność klawiatury głosowej poprawiła się we wszystkich językach dzięki aktualizacji llama.cpp (wersja b9222), która naprawiła problem z przerywaniem fragmentów w długich nagraniach. Dostępna za darmo przy każdej licencji płatnej.
Dostępne są dwa nowe narzędzia MCP: start_transcription zwraca natychmiast identyfikator zlecenia, aby agent mógł wykonywać inne zadania, oraz get_transcription_status Głosowanie w celu zakończenia. Jedno zadanie naraz, wynik jest wyświetlany po zakończeniu. Długie pliki już nie blokują pętli agenta.
Ponadto seria poprawek dotyczących wyjścia w formacie SRT/VTT na poziomie słów: brak już przerw przed znakami interpunkcyjnymi, brak samotnych kropek, brak wycieków słów kluczowych lub ciągów kontekstowych do transkrypcji. Czystsze napisy – nie wymagają ręcznej edycji.
Całkowite przepisanie silnika. Brethof Voice Pro teraz wykorzystuje Qwen3-ASR w trybie end-to-end llama.cpp za pomocą wag skwantyzowanych w formacie GGUF libmtmdONNX Runtime już nie istnieje. Rezultat: mniejsza wielkość instalacji (~83 MB pliku binarnego, w porównaniu z 400+ MB), szybszy start, a także koniec z problemami związanych z różnicami w wersjach CUDA/DirectML na poszczególnych platformach.
Vulkan automatycznie wykrywa twoją kartę graficzną — NVIDIA, AMD lub Intel Arc — przy czym w przypadku braku karty graficznej używa procesora jako alternatywy. Ten sam silnik napędza teraz wszystkie funkcje: ASR, klawiaturę głosową, serwer MCP oraz (w wersji 2.0.0) tłumaczenie.
Serwer Protocolu Kontekstu Modelu został uruchomiony. Każdy agent sztucznej inteligencji kompatybilny z MCP — Claude Desktop, Claude Code, Kursor, Cline — może przetwarzać transkrypcję przez stdio (bez portu, bez firewalla). Ta sama wersja zawiera również wybieracz urządzeń z wieloma GPU aby można było wybrać, który GPU Vulkan obsługuje ASR, plus opcjonalnie Forced Aligner dodatek umożliwiający umieszczanie danych czasowych na poziomie słów w każdej transkrypcji.
Tylko w wersji płatnej — serwer MCP odmawia uruchomienia bez licencji osobistej lub biznesowej. brethof-voice --mcp Jest to wywołanie jednoliniowe.
Najczęściej zadawanym pytaniem przed premierą było: „Kiedy macOS?”. Odpowiedź: w trakcie aktywnej rozwoju. Najpierw pojawi się wersja dostosowana do procesorów Apple Silicon z przyspieszeniem Metal, a potem wersja dla procesorów Intel. Cel to III kwartał 2026 roku – w II kwartale uruchomimy zamkniętą wersję beta. Oto, co jest w trakcie tworzenia oraz jak się zapisać.
Przeczytaj post →Trening głosu osobistego jest dostępny w Voice Pro. Za każdym razem, gdy poprawiasz błędnie rozpoznane słowo, klip audio wraz z tą korektą jest automatycznie zapisywany do twojego lokalnego zestawu danych treningowych. Jeden kliknięcie w zakładce Trening pozwala dostosować model LoRA pod twój akcent – aplikacja automatycznie wybiera NVIDIA CUDA lub CPU, a następnie eksportuje przeszkolony model do formatu GGUF. Dostępne bezpłatnie przy każdej licencji płatnej.
Przeczytaj post →Po miesiącach pracy inżynierskiej, Voice Pro v1.0 jest już dostępny dla systemów Windows i Linux. Dostępne są 30 języków transkrypcji oraz 22 dialekty chińskie, pełna transkrypcja offline, możliwość dyktowania za pomocą skrótów klawiszowych w dowolnym miejscu, a także cena jednorazowa bez konieczności subskrypcji. Oto, co znalazło się w wersji początkowej produktu, oraz nad czym pracujemy dalej.
Przeczytaj post →Program Champions otwiera się dziś i trwa do 16 maja. Pięćdziesiąt darmowych licencji osobistych na każdy obsługiwany język – łącznie 1800 – plus 70% zniżki dla każdego uczestnika, który nie znajdzie się w czołowej 50. Oto jak to działa i dlaczego postanowiliśmy to zrobić w taki sposób.
Przeczytaj post →Przeczytaliśmy wstępne opinie autorów, konsultantów oraz tłumaczy, którzy uważali, że stary napis „tylko do użytku osobistego” jest mylący. Licencja Personal w cenie 49 dolarów teraz wyraźnie obejmuje zarówno indywidualne, jak i niezależne zastosowania komercyjne. Licencja Business (149 dolarów za miejsce) przeznaczona jest dla zespołów. Oto, co się zmieniło i dlaczego.
Przeczytaj post →Brethof Voice Pro umożliwia transkrypcję i prezentację tekstu w 30 językach oraz 22 dialektach chińskich: arabskim, kantońskim, chińskim, czeskim, duńskim, holenderskim, angielskim, filipińskim, fińskim, francuskim, niemieckim, greckim, hindi, węgierskim, indonezyjskim, włoskim, japońskim, koreańskim, macedońskim, malajskim, perskim, polskim, portugalskim, rumuńskim, rosyjskim, hiszpańskim, szwedzkim, tajskim, tureckim i wietnamskim. Oto jak aplikacja wybiera odpowiedni język oraz co faktycznie oznacza „pełne tłumaczenie”.
Przeczytaj post →Tło technologiczne modułu ASR w Brethof Voice Pro opiera się na llama.cpp z modelami Qwen skwantyzowanymi w formacie GGUF, zamiast na ONNX Runtime. Efektem jest mniejsza rozmiarowość pliku instalacyjnego (83 MB w formacie exe w porównaniu z 400+ MB), szybszy start aplikacji oraz koniec z problemami z pakietami CUDA/DirectML na różnych platformach. Oto historia inżynieryjna stojąca za tą zmianą.
Przeczytaj post →Każdy popularny program do dyktowania przesyła twoje głosy przez serwery innych firm. Uważamy, że to niewłaściwy standard. Twój głos to najbardziej osobiste dane, jakie tworzysz – notatki medyczne, dokumenty prawnicze, prywatne dzienniki, tajemnice służbowe. Dlatego Voice Pro nie posiada trybu chmurowego, żadnej „opcjonalnej telemetrii” ani wymogu posiadania konta do transkrypcji.
Przeczytaj post →Utwórz konto, aby otrzymywać powiadomienia, gdy publikujemy nowe wpisy i wypuszczamy nowe wersje.
Utwórz kontoLokalna konwersja mowy na tekst, która uczy się twojego głosu. Licencja dożywotnia. Nasz flagowy produkt.
PAID · flagship
Lokalna pamięć długoterminowa dla Claude Code — pełnotekstowa + wektorowa + grafowa, na SurrealDB. MIT.
BEZPŁATNE · open source
Gotowe do druku modele cyfrowe. Włączone pliki STL/3MF/OBJ. Dostęp dożywotni.
Płatny · katalog cyfrowy
Nasze drukowane projekty wysyłane po całej Europie. Kup produkt, a nie plik.
PŁATNE · przedmioty fizyczne
Host AI Cyber-tiger. Wyjaśnienie koncepcji AI skupiającej się na prywatności, bez korporacyjnych ograniczeń.
KANAŁ · transmisja na żywo
Wyselekcjonowane listy na GitHubie dotyczące AI, MCP, lokalnej AI, Linuxa do AI i wielu innych. Dowody, a nie tylko vibes.
BEZPŁATNE · starannie wybrane
Szczegółowe instrukcje dotyczące lokalnego AI na Linux, Windows i macOS. Prawdziwe konfiguracje, bez marketingu.
BEZPŁATNE · wkrótce dostępne
Sprawdzone w praktyce schematy ComfyUI — LTX chunked-loop, pipeline Nova i wiele innych.
BEZPŁATNIE · landing page workflowów
Negatywna kuracja: praktyki i narzędzia, które marnują Twój czas, sklasyfikowane. Paragon wymagany.
BEZPŁATNE · wkrótce dostępne
Kim jesteśmy, dlaczego tworzymy sztuczną inteligencję z naciskiem na lokalność i czego nie robimy.