Produkt Aktualizacje

Ogłoszenia o uruchomieniu, nowości z programu Champions Program, nowe funkcje oraz informacje z zakresu inżynierii pochodzące od zespołu Brethof Voice Pro.

Wydanie 21 maja 2026 roku

v2.0.0 — Tłumaczenie offline w 38 językach

Brethof Voice Pro to już nie tylko narzędzie do konwersji mowy na tekst. Wersja 2.0.0 jest już dostępna. tłumaczenie offline zasilane przez Tencent Hunyuan MT2 — na FLORES-200 (XCOMET-XXL) poziom 7B osiąga 97,9% Google Gemini 3.1 ProPrzewyższa również Gemini w testach związanych z rzeczywistym środowiskiem oraz językami mniejszościowymi. Tłumaczenie odbywa się wyłącznie na twoim urządzeniu. Dwa poziomy modeli do pobrania według potrzeb: szybki (~1 GB, czas przetwarzania poniżej sekundy na CPU lub GPU) oraz wysokiej jakości (~4,3 GB, czas przetwarzania poniżej sekundy na GPU). Ponadto kilka długo oczekiwanych ulepszeń.

Co nowego w wersji 2.0.0:

  • Transkrypcja + tłumaczenie — Okno dialogowe Transcribe zawiera spadkowy menu „Przetłumaczyć na:”. ASR dokonuje transkrypcji, a MT tłumaczy – oba wyniki są wyświetlane obok siebie. Działa z plikami, mikrofonem oraz dźwiękiem systemowym (przechwytywanie dźwięku z rozmów telefonicznych, kart przeglądarki, czegokolwiek, co gra z głośników).
  • Wielojęzyczna klawiatura głosowa — nowy chip tłumaczeniowy w głównej rzędzie otwiera siatkę językową z 3 kolumnami. Wybierz jeden lub więcej języków docelowych, a klawiatura wpisze tłumaczenie. Tryby układu: jeden na linii, w formie wstawkiEN: … || PL: …), albo tylko pierwszy cel.
  • Tłumacz napisów SRT / VTT — zachowuje czasy wykonywania oraz indeksy wskazówek, obsługuje tryb dwujęzyczny (linia źródłowa + tłumaczenie dla każdej wskazówki). Dostępne poprzez MCP w celu automatyzacji agentów AI.
  • Wielokarta GPU na silnik — Ustawienia → Modele zawierają oddzielny wybieracz urządzeń dla każdego silnika. Uruchom ASR na Vulkan 0, a tłumaczenie na Vulkan 1, lub przypisz Hunyuan MT2 7B do CPU na laptopach o ograniczonej ilości pamięci VRAM.
  • Osobiste treningi głosowe odbywają się w trybie na żywo. — Dostosowywanie LoRA pod własny głos, w całości na Twoim komputerze. Karta treningu w głównym oknie pokazuje od razu łączną liczbę próbek oraz czas nagrania; opcja „Rozpocznij trening” w karcie Trening automatycznie wybiera NVIDIA CUDA lub CPU, a następnie eksportuje przeszkolony model do formatu GGUF. Dostępne bezpłatnie przy każdej licencji płatnej.
  • 4 nowe narzędzia MCPtranslate_text, translate_srt, list_compute_devices, set_compute_deviceŁączna liczba narzędzi wynosi teraz 19.
  • Szczera mowa dzieli — ASR: 30 języków do wyboru + automatyczne rozpoznawanie + 22 dialekty chińskie (łącznie 52). Tłumaczenie: 38 języków (33 główne + 5 mniejszości z obszarów chińskojęzycznych). 23 z nich umożliwiają tłumaczenie w obie strony.

Binarny plik dla Linuxa ma rozmiar 161 MB, a instalator dla Windowsa – 118 MB. Te same ceny wydania: 49 dolarów dla użytkowników indywidualnych, 149 dolarów dla firm. Istniejące licencje są przenoszone – po prostu Pobierz wersję 2.0.0 A modele tłumaczeniowe pojawią się w Ustawieniach → Modele.

Pobierz wersję 2.0.0 →
Wydanie 20 maja 2026 roku

v1.6.16 — Trening głosu osobistego jest już dostępny

Proces szkolenia został wdrożony. Dostrojenie LoRA pod własny głos teraz działa w całości na twoim komputerze — aplikacja automatycznie wybiera NVIDIA CUDA or CPUNastępnie po zakończeniu automatycznie eksportuje przeszkolony model do formatu GGUF. Każda korekta dokonana w interfejsie graficznym jest automatycznie zapisywana do lokalnego zestawu danych treningowych; na karcie treningowej w głównym oknie od razu widać łączną liczbę próbek oraz czas trwania treningu.

Bonus: dokładność klawiatury głosowej poprawiła się we wszystkich językach dzięki aktualizacji llama.cpp (wersja b9222), która naprawiła problem z przerywaniem fragmentów w długich nagraniach. Dostępna za darmo przy każdej licencji płatnej.

Inżynieria 15 maja 2026 roku

v1.6.0 — Asynchroniczne zadania transkrypcji + udoskonalenia w formacie SRT na poziomie słów

Dostępne są dwa nowe narzędzia MCP: start_transcription zwraca natychmiast identyfikator zlecenia, aby agent mógł wykonywać inne zadania, oraz get_transcription_status Głosowanie w celu zakończenia. Jedno zadanie naraz, wynik jest wyświetlany po zakończeniu. Długie pliki już nie blokują pętli agenta.

Ponadto seria poprawek dotyczących wyjścia w formacie SRT/VTT na poziomie słów: brak już przerw przed znakami interpunkcyjnymi, brak samotnych kropek, brak wycieków słów kluczowych lub ciągów kontekstowych do transkrypcji. Czystsze napisy – nie wymagają ręcznej edycji.

Inżynieria 15 maja 2026 roku

v1.5.0 — Usunięto ONNX, czas wykonywania to teraz wyłącznie llama.cpp + libmtmd

Całkowite przepisanie silnika. Brethof Voice Pro teraz wykorzystuje Qwen3-ASR w trybie end-to-end llama.cpp za pomocą wag skwantyzowanych w formacie GGUF libmtmdONNX Runtime już nie istnieje. Rezultat: mniejsza wielkość instalacji (~83 MB pliku binarnego, w porównaniu z 400+ MB), szybszy start, a także koniec z problemami związanych z różnicami w wersjach CUDA/DirectML na poszczególnych platformach.

Vulkan automatycznie wykrywa twoją kartę graficzną — NVIDIA, AMD lub Intel Arc — przy czym w przypadku braku karty graficznej używa procesora jako alternatywy. Ten sam silnik napędza teraz wszystkie funkcje: ASR, klawiaturę głosową, serwer MCP oraz (w wersji 2.0.0) tłumaczenie.

Inżynieria 14 maja 2026 roku

v1.4.0 — debiut serwera MCP + wybieracz urządzeń z wieloma GPU

Serwer Protocolu Kontekstu Modelu został uruchomiony. Każdy agent sztucznej inteligencji kompatybilny z MCP — Claude Desktop, Claude Code, Kursor, Cline — może przetwarzać transkrypcję przez stdio (bez portu, bez firewalla). Ta sama wersja zawiera również wybieracz urządzeń z wieloma GPU aby można było wybrać, który GPU Vulkan obsługuje ASR, plus opcjonalnie Forced Aligner dodatek umożliwiający umieszczanie danych czasowych na poziomie słów w każdej transkrypcji.

Tylko w wersji płatnej — serwer MCP odmawia uruchomienia bez licencji osobistej lub biznesowej. brethof-voice --mcp Jest to wywołanie jednoliniowe.

Plan rozwoju 16 kwietnia 2026 roku

Wersja dla macOS jest w fazie rozwoju — najpierw na platformie Apple Silicon

Najczęściej zadawanym pytaniem przed premierą było: „Kiedy macOS?”. Odpowiedź: w trakcie aktywnej rozwoju. Najpierw pojawi się wersja dostosowana do procesorów Apple Silicon z przyspieszeniem Metal, a potem wersja dla procesorów Intel. Cel to III kwartał 2026 roku – w II kwartale uruchomimy zamkniętą wersję beta. Oto, co jest w trakcie tworzenia oraz jak się zapisać.

Przeczytaj post →
Produkt 16 kwietnia 2026 roku

Szkolenie modelu osobistego — dostosuj Brethof Voice Pro do swojego głosu

Trening głosu osobistego jest dostępny w Voice Pro. Za każdym razem, gdy poprawiasz błędnie rozpoznane słowo, klip audio wraz z tą korektą jest automatycznie zapisywany do twojego lokalnego zestawu danych treningowych. Jeden kliknięcie w zakładce Trening pozwala dostosować model LoRA pod twój akcent – aplikacja automatycznie wybiera NVIDIA CUDA lub CPU, a następnie eksportuje przeszkolony model do formatu GGUF. Dostępne bezpłatnie przy każdej licencji płatnej.

Przeczytaj post →
Ogłoszenie 16 kwietnia 2026 roku

Brethof Voice Pro jest już dostępny — przetwarzanie mowy na tekst, które pozostaje na twoim komputerze

Po miesiącach pracy inżynierskiej, Voice Pro v1.0 jest już dostępny dla systemów Windows i Linux. Dostępne są 30 języków transkrypcji oraz 22 dialekty chińskie, pełna transkrypcja offline, możliwość dyktowania za pomocą skrótów klawiszowych w dowolnym miejscu, a także cena jednorazowa bez konieczności subskrypcji. Oto, co znalazło się w wersji początkowej produktu, oraz nad czym pracujemy dalej.

Przeczytaj post →
Mistrzowie 16 kwietnia 2026 roku

1 800 darmowych licencji do zdobycia: program Champions jest otwarty

Program Champions otwiera się dziś i trwa do 16 maja. Pięćdziesiąt darmowych licencji osobistych na każdy obsługiwany język – łącznie 1800 – plus 70% zniżki dla każdego uczestnika, który nie znajdzie się w czołowej 50. Oto jak to działa i dlaczego postanowiliśmy to zrobić w taki sposób.

Przeczytaj post →
Licencjonowanie 16 kwietnia 2026 roku

Licencja osobista obejmuje teraz działalność samodzielną oraz prace na zlecenie.

Przeczytaliśmy wstępne opinie autorów, konsultantów oraz tłumaczy, którzy uważali, że stary napis „tylko do użytku osobistego” jest mylący. Licencja Personal w cenie 49 dolarów teraz wyraźnie obejmuje zarówno indywidualne, jak i niezależne zastosowania komercyjne. Licencja Business (149 dolarów za miejsce) przeznaczona jest dla zespołów. Oto, co się zmieniło i dlaczego.

Przeczytaj post →
Produkt 12 kwietnia 2026 roku

30 języków transkrypcji, w pełni przetłumaczona interfejs użytkownika — bez nieczytelnego tekstu wygenerowanego przez maszynę

Brethof Voice Pro umożliwia transkrypcję i prezentację tekstu w 30 językach oraz 22 dialektach chińskich: arabskim, kantońskim, chińskim, czeskim, duńskim, holenderskim, angielskim, filipińskim, fińskim, francuskim, niemieckim, greckim, hindi, węgierskim, indonezyjskim, włoskim, japońskim, koreańskim, macedońskim, malajskim, perskim, polskim, portugalskim, rumuńskim, rosyjskim, hiszpańskim, szwedzkim, tajskim, tureckim i wietnamskim. Oto jak aplikacja wybiera odpowiedni język oraz co faktycznie oznacza „pełne tłumaczenie”.

Przeczytaj post →
Inżynieria 8 kwietnia 2026 roku

Dlaczego przeszliśmy z ONNX na GGUF — szybciej, mniejszy rozmiar, łatwiejsze wdrożenie

Tło technologiczne modułu ASR w Brethof Voice Pro opiera się na llama.cpp z modelami Qwen skwantyzowanymi w formacie GGUF, zamiast na ONNX Runtime. Efektem jest mniejsza rozmiarowość pliku instalacyjnego (83 MB w formacie exe w porównaniu z 400+ MB), szybszy start aplikacji oraz koniec z problemami z pakietami CUDA/DirectML na różnych platformach. Oto historia inżynieryjna stojąca za tą zmianą.

Przeczytaj post →
Zasady 4 kwietnia 2026 roku

Dlaczego Brethof Voice Pro działa w 100% offline — i dlaczego to nie jest zwykła funkcja

Każdy popularny program do dyktowania przesyła twoje głosy przez serwery innych firm. Uważamy, że to niewłaściwy standard. Twój głos to najbardziej osobiste dane, jakie tworzysz – notatki medyczne, dokumenty prawnicze, prywatne dzienniki, tajemnice służbowe. Dlatego Voice Pro nie posiada trybu chmurowego, żadnej „opcjonalnej telemetrii” ani wymogu posiadania konta do transkrypcji.

Przeczytaj post →

Otrzymuj aktualizacje na swoją skrzynkę e-mail.

Utwórz konto, aby otrzymywać powiadomienia, gdy publikujemy nowe wpisy i wypuszczamy nowe wersje.

Utwórz konto

Wszystko, co tworzymy

🎤

Brethof Voice Pro

Lokalna konwersja mowy na tekst, która uczy się twojego głosu. Licencja dożywotnia. Nasz flagowy produkt.

PAID · flagship

🧠

Brethof-Mind

Lokalna pamięć długoterminowa dla Claude Code — pełnotekstowa + wektorowa + grafowa, na SurrealDB. MIT.

BEZPŁATNE · open source

🛠

Modele 3D

Gotowe do druku modele cyfrowe. Włączone pliki STL/3MF/OBJ. Dostęp dożywotni.

Płatny · katalog cyfrowy

📦

Druk 3D

Nasze drukowane projekty wysyłane po całej Europie. Kup produkt, a nie plik.

PŁATNE · przedmioty fizyczne

🎥

Nova

Host AI Cyber-tiger. Wyjaśnienie koncepcji AI skupiającej się na prywatności, bez korporacyjnych ograniczeń.

KANAŁ · transmisja na żywo

📚

Niesamowite listy

Wyselekcjonowane listy na GitHubie dotyczące AI, MCP, lokalnej AI, Linuxa do AI i wielu innych. Dowody, a nie tylko vibes.

BEZPŁATNE · starannie wybrane

📖

Przewodniki

Szczegółowe instrukcje dotyczące lokalnego AI na Linux, Windows i macOS. Prawdziwe konfiguracje, bez marketingu.

BEZPŁATNE · wkrótce dostępne

🔮

Przepływy pracy ComfyUI

Sprawdzone w praktyce schematy ComfyUI — LTX chunked-loop, pipeline Nova i wiele innych.

BEZPŁATNIE · landing page workflowów

🤯

Lista rankingowa anty-dev

Negatywna kuracja: praktyki i narzędzia, które marnują Twój czas, sklasyfikowane. Paragon wymagany.

BEZPŁATNE · wkrótce dostępne

👋

O Brethof AI

Kim jesteśmy, dlaczego tworzymy sztuczną inteligencję z naciskiem na lokalność i czego nie robimy.

Zewnętrzne:   YouTube · GitHub