Einführungsankündigungen, Neuigkeiten zum Champions Program, neue Funktionen sowie Einblicke in die Entwicklungsarbeit des Teams hinter Brethof Voice Pro.
Brethof Voice Pro ist nicht länger nur ein Tool zur Umwandlung von Sprache in Text. Die Version 2.0.0 ist jetzt verfügbar. Offline-Übersetzung angetrieben von Tencent Hunyuan MT2 — auf FLORES-200 (XCOMET-XXL) erreicht die 7B-Klasse 97,9 % von Google Gemini 3.1 ProUnd es übertrifft Gemini bei Tests in der realen Welt sowie bei Sprachen mit geringer Verbreitung. Die Übersetzung erfolgt vollständig auf Ihrem Gerät. Zwei Modellversionen, die nach Bedarf heruntergeladen werden können: Schnell (~1 GB, unter einer Sekunde auf CPU oder GPU) und Hochwertig (~4,3 GB, unter einer Sekunde auf GPU). Dazu noch mehrere lange erwartete Erweiterungen.
Was gibt es Neues in der Version 2.0.0:
EN: … || PL: …), oder nur das erste Ziel.translate_text, translate_srt, list_compute_devices, set_compute_deviceDie Gesamtzahl der Tools beträgt nun 19.Die Linux-Binärdatei hat eine Größe von 161 MB, der Windows-Installer 118 MB. Die Preise bleiben unverändert: 49 US-Dollar für Privatnutzer, 149 US-Dollar für Unternehmen. Bestehende Lizenzen bleiben gültig – einfach nur Download v2.0.0 Und die Übersetzungsmodelle werden unter Einstellungen → Modelle angezeigt.
Download v2.0.0 →Der Trainingsprozess ist verfügbar. Die LoRA-Anpassung an Ihre eigene Stimme wird nun vollständig auf Ihrem Gerät durchgeführt – die App wählt automatisch aus. NVIDIA CUDA or CPUAnschließend exportiert es das trainierte Modell automatisch in GGUF, sobald die Arbeit abgeschlossen ist. Jede Korrektur, die Sie in der GUI vornehmen, wird automatisch in Ihr lokales Trainingsdatensatz gespeichert; die Trainingsanzeige im Hauptfenster zeigt Ihnen auf einen Blick die Gesamtanzahl der Beispiele sowie die verstrichenen Minuten an.
Bonus: Die Genauigkeit der Sprach-Tastatur wurde in allen Sprachen durch ein Update von llama.cpp (Version b9222) verbessert, das ein Problem mit den Grenzen von Abschnitten in langen Clips behob. Enthält sich kostenlos bei jeder kostenpflichtigen Lizenz.
Zwei neue MCP-Tools sind verfügbar: start_transcription gibt sofort eine Job-ID zurück, damit der Agent andere Aufgaben erledigen kann, und get_transcription_status Abstimmungen zur Abschlussprüfung. Eine Aufgabe nach der anderen – das Ergebnis wird bei Fertigstellung direkt angezeigt. Lange Dateien blockieren den Agentenloop nicht mehr.
Zusätzlich eine Reihe von Korrekturen für die Wortebene der SRT/VTT-Ausgabe: Keine weiteren isolierten Leerzeichen vor Satzzeichen, keine weiteren Einzelpunkte als Zeitangaben, keine weiteren Hotword-/Kontextzeichenfolgen, die in die Transkription gelangen. Sauberere Untertitel – keine manuelle Bearbeitung mehr erforderlich.
Komplette Neuschreibung des Engines. Brethof Voice Pro nutzt nun Qwen3-ASR in vollem Umfang. llama.cpp mit GGUF-quantisierten Gewichten über libmtmdONNX Runtime ist nicht mehr verfügbar. Die Folgen sind eine kleinere Installation (etwa 83 MB großes Binärdatei, gegenüber mehr als 400 MB zuvor), ein schnellererer Start sowie das Ende der Probleme mit den plattformspezifischen CUDA/DirectML-Bibliotheken.
Vulkan erkennt automatisch Ihre GPU – NVIDIA, AMD oder Intel Arc – und greift bei Abwesenheit einer GPU auf einen CPU-Backup zurück. Derselbe Motor steuert nun alle damit verbundenen Funktionen: ASR, Sprachtastatur, den MCP-Server sowie (seit der Version 2.0.0) die Übersetzung.
Der Server des Model Context Protocol ist gestartet. Jeder mit MCP kompatible KI-Agent – Claude Desktop, Claude Code, Cursor, Cline — kann die Transkription über stdio ausführen (kein Port, kein Firewall). Derselbe Release enthält außerdem Multi-GPU-Geräte-Selektor damit Sie auswählen können, welche Vulkan-GPU zur Ausführung der ASR verwendet wird, sowie die optionale Gezwungener Ausrichter Erweiterung für Zeitstempel auf Wortebene in jeder Transkription.
Nur für die bezahlte Version – der MCP-Server weigert sich, ohne eine persönliche oder geschäftliche Lizenz zu starten. brethof-voice --mcp Es handelt sich um die einzeilige Aufrufweise.
Die am häufigsten gestellte Frage vor dem Release lautete: „Wann kommt macOS?“ Antwort: Es befindet sich in aktiver Entwicklung. Zuerst wird eine Version für Apple Silicon mit Metal-Beschleunigung veröffentlicht, danach eine für Intel. Ziel ist der 3. Quartal 2026 – und wir starten im 2. Quartal ein geschlossenes Beta-Programm. Hier erfahren Sie, an was gearbeitet wird, und wie Sie sich anmelden können.
Artikel lesen →Persönliches Stimmtraining ist in Voice Pro verfügbar. Jedes Mal, wenn Sie ein falsch erkanntes Wort korrigieren, wird das Audiodatei-Clip samt Korrektur automatisch in Ihr lokales Trainingsdatensatz gespeichert. Mit einem Klick im Reiter „Training“ kann eine LoRA an Ihrem Akzent angepasst werden – die App wählt automatisch entweder NVIDIA CUDA oder CPU aus und exportiert das trainierte Modell anschließend als GGUF. Im Lieferumfang jeder kostenpflichtigen Lizenz enthalten.
Artikel lesen →Nach monatelanger Entwicklungsarbeit wird Voice Pro v1.0 heute für Windows und Linux veröffentlicht. 30 Transkriptionssprachen sowie 22 chinesische Dialekte, vollständige Offline-Transkription, Sprecheingabe per Tastenkombination überall – und ein einmaliger Preis ohne Abonnement. Hier sind die Funktionen, die in die Erstversion aufgenommen wurden, sowie die nächsten Entwicklungsziele.
Artikel lesen →Das Champions Program startet heute und läuft bis zum 16. Mai. Fünfzig kostenlose Personal-Lizenzen pro unterstützter Sprache – insgesamt 1.800 – sowie ein Rabatt von 70 Prozent für alle Teilnehmer, die nicht unter den Top 50 landen. So funktioniert es und warum wir es auf diese Weise machen.
Artikel lesen →Wir haben frühe Rückmeldungen von Autoren, Beratern und Übersetzern geprüft, die der Ansicht waren, dass die alte Klausel „Nur für persönliche Nutzung“ verwirrend sei. Die Personal-Lizenz zum Preis von 49 Dollar umfasst nun ausdrücklich die kommerzielle Nutzung durch Einzelpersonen sowie Freiberufler. Die Business-Lizenz (149 Dollar pro Nutzer) ist für Teams bestimmt. Hier sind die Änderungen und der Grund dafür.
Artikel lesen →Brethof Voice Pro kann nun in 30 Sprachen sowie 22 chinesischen Dialekten transkribieren und anzeigen: Arabisch, Kantonesisch, Chinesisch, Tschechisch, Dänisch, Niederländisch, Englisch, Filipino, Finnisch, Französisch, Deutsch, Griechisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Mazedonisch, Malaiisch, Persisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch, Thailändisch, Türkisch, Vietnamesisch. Hier erfahren Sie, wie die App die richtige Sprache auswählt und was „vollständig übersetzt“ tatsächlich bedeutet.
Artikel lesen →Der ASR-Backend von Brethof Voice Pro basiert auf llama.cpp sowie GGUF-quantisierten Qwen-Modellen anstelle von ONNX Runtime. Das Ergebnis sind eine kleinere Installationsgröße (83 MB EXE gegenüber 400+ MB), ein schnellerer Start sowie keine Probleme mehr mit CUDA/DirectML-Bibliotheken auf verschiedenen Plattformen. Hier ist die technische Hintergrundgeschichte zu diesem Wechsel.
Artikel lesen →Jedes große Diktierprodukt leitet Ihre Stimme über den Server eines Dritten weiter. Wir sind der Ansicht, dass das die falsche Standardeinstellung ist. Ihre Stimme ist die persönlichste Datenart, die Sie erzeugen – medizinische Notizen, rechtliche Entwürfe, private Tagebücher, berufliche Geheimnisse. Deshalb verfügt Voice Pro weder über einen Cloud-Modus noch über „optionalen Telemetriedienst“ und erfordert auch keine Anmeldung zur Transkription.
Artikel lesen →Erstellen Sie ein Konto, um benachrichtigt zu werden, wenn wir neue Beiträge veröffentlichen und neue Versionen versenden.
Konto erstellenLokale Spracherkennung, die Ihre Stimme lernt. Lebenslange Lizenz. Unser Flaggschiff.
GEZAHLT · Flaggschiff
Lokales Langzeitgedächtnis für Claude Code – Volltext + Vektoren + Graphen, in SurrealDB. MIT.
KOSTENLOS · Open Source
Druckfertige digitale Modelle. STL/3MF/OBJ enthalten. Lebenslanger Zugang.
GEZAHLT · digitaler Katalog
Unsere gedruckten Designs werden in ganz Europa versandt. Kaufen Sie das Objekt, nicht die Datei.
BEZAHLT · physische Objekte
Cyber-Tiger AI-Host. Datenschutzorientierte KI – ohne Corporate-Filter.
KANAL · LIVE
Kuratierte GitHub-Listen für KI, MCP, lokale KI, Linux für KI und mehr. Belege, keine Stimmung.
KOSTENLOS · sorgfältig ausgewählt
Ausführliche Anleitungen zur Nutzung lokaler KI unter Linux, Windows und macOS. Echte Konfigurationen – kein Marketing.
KOSTENLOS · bald verfügbar
Produktionsgetestete ComfyUI-Graphen – LTX Chunked-Loop, die Nova-Pipeline und mehr.
KOSTENLOS · Workflows-Landingpage
Negative-Curation: Praktiken und Tools, die Ihre Zeit verschwenden – in einer Rangfolge. Belege erforderlich.
KOSTENLOS · bald verfügbar
Wer wir sind, warum wir lokale KI entwickeln und was wir nicht tun werden.