Aktualisierungen – Brethof Voice Pro

Veröffentlichung 21. Mai 2026

v2.0.0 – Offline-Übersetzung in 38 Sprachen

Brethof Voice Pro ist nicht länger nur ein Tool zur Umwandlung von Sprache in Text. Die Version 2.0.0 ist jetzt verfügbar. Offline-Übersetzung angetrieben von Tencent Hunyuan MT2 — auf FLORES-200 (XCOMET-XXL) erreicht die 7B-Klasse 97,9 % von Google Gemini 3.1 ProUnd es übertrifft Gemini bei Tests in der realen Welt sowie bei Sprachen mit geringer Verbreitung. Die Übersetzung erfolgt vollständig auf Ihrem Gerät. Zwei Modellversionen, die nach Bedarf heruntergeladen werden können: Schnell (~1 GB, unter einer Sekunde auf CPU oder GPU) und Hochwertig (~4,3 GB, unter einer Sekunde auf GPU). Dazu noch mehrere lange erwartete Erweiterungen.

Was gibt es Neues in der Version 2.0.0:

Transkribieren + übersetzen — Das Transcribe-Popup verfügt über ein Dropdown-Menü mit der Option „Übersetzen in:“ ASR führt die Transkription durch, MT übersetzt – beides wird nebeneinander angezeigt. Es funktioniert mit Dateien, Mikrofon sowie Systemtonen (Loopback-Aufnahmen von Telefonaten, Browsertabellen, allem, was über Ihre Lautsprecher abgespielt wird).
Mehrsprachiges Sprach-Tastaturfeld — Der neue Übersetzungschip in der Hauptzeile eröffnet ein 3-spaltiges Sprachgitter. Wählen Sie ein oder mehrere ZielSprachen aus, und die Tastatur tippt die Übersetzung ein. Anordnungsmodi: eine pro Zeile, eingebettetEN: … || PL: …), oder nur das erste Ziel.
SRT / VTT-Untertiteltreiber – Behält Zeitangaben sowie Cue-Indizes bei, unterstützt den zweisprachigen Modus (Quellzeile + Übersetzung pro Cue). Über MCP für die Automatisierung durch KI-Agenten zugänglich.
Mehrere GPUs pro Engine — Einstellungen → Modelle bietet einen separaten Geräteauswähler für jede Engine. Führen Sie die ASR auf Vulkan 0 und die Übersetzung auf Vulkan 1 aus, oder weisen Sie Hunyuan MT2 7B auf der CPU bei Laptops mit begrenzter VRAM-Kapazität zu.
Die persönliche Stimmausbildung findet vollständig in Echtzeit statt. — LoRA-Feinabstimmung anhand Ihrer eigenen Stimme, vollständig auf Ihrem Gerät. Auf der Trainingskarte im Hauptfenster werden die Gesamtanzahl der Samples sowie die aufgenommene Zeit auf einen Blick angezeigt; „Trainieren starten“ in der Trainingsleiste wählt automatisch entweder NVIDIA CUDA oder CPU aus und exportiert das trainierte Modell anschließend als GGUF. Im Lieferumfang jeder kostenpflichtigen Lizenz enthalten.
4 neue MCP-Tools — translate_text, translate_srt, list_compute_devices, set_compute_deviceDie Gesamtzahl der Tools beträgt nun 19.
Ehrliche Sprache teilt auf — ASR: 30 wählbare Sprachen + Automatisches Erkennen + 22 chinesische Dialekte (insgesamt 52). Übersetzung: 38 Sprachen (33 Hauptsprachen + 5 Minderheitensprachen aus chinesischen Gebieten). 23 davon ermöglichen die Übersetzung in beide Richtungen.

Die Linux-Binärdatei hat eine Größe von 161 MB, der Windows-Installer 118 MB. Die Preise bleiben unverändert: 49 US-Dollar für Privatnutzer, 149 US-Dollar für Unternehmen. Bestehende Lizenzen bleiben gültig – einfach nur Download v2.0.0 Und die Übersetzungsmodelle werden unter Einstellungen → Modelle angezeigt.

Download v2.0.0 →

Veröffentlichung 20. Mai 2026

v1.6.16 – Die persönliche Stimmenausbildung ist jetzt verfügbar

Der Trainingsprozess ist verfügbar. Die LoRA-Anpassung an Ihre eigene Stimme wird nun vollständig auf Ihrem Gerät durchgeführt – die App wählt automatisch aus. NVIDIA CUDA or CPUAnschließend exportiert es das trainierte Modell automatisch in GGUF, sobald die Arbeit abgeschlossen ist. Jede Korrektur, die Sie in der GUI vornehmen, wird automatisch in Ihr lokales Trainingsdatensatz gespeichert; die Trainingsanzeige im Hauptfenster zeigt Ihnen auf einen Blick die Gesamtanzahl der Beispiele sowie die verstrichenen Minuten an.

Bonus: Die Genauigkeit der Sprach-Tastatur wurde in allen Sprachen durch ein Update von llama.cpp (Version b9222) verbessert, das ein Problem mit den Grenzen von Abschnitten in langen Clips behob. Enthält sich kostenlos bei jeder kostenpflichtigen Lizenz.

Ingenieurwesen 15. Mai 2026

v1.6.0 — Asynchrone Transkriptionsaufgaben + Verbesserungen auf Wortebene in SRT

Zwei neue MCP-Tools sind verfügbar: start_transcription gibt sofort eine Job-ID zurück, damit der Agent andere Aufgaben erledigen kann, und get_transcription_status Abstimmungen zur Abschlussprüfung. Eine Aufgabe nach der anderen – das Ergebnis wird bei Fertigstellung direkt angezeigt. Lange Dateien blockieren den Agentenloop nicht mehr.

Zusätzlich eine Reihe von Korrekturen für die Wortebene der SRT/VTT-Ausgabe: Keine weiteren isolierten Leerzeichen vor Satzzeichen, keine weiteren Einzelpunkte als Zeitangaben, keine weiteren Hotword-/Kontextzeichenfolgen, die in die Transkription gelangen. Sauberere Untertitel – keine manuelle Bearbeitung mehr erforderlich.

Ingenieurwesen 15. Mai 2026

v1.5.0 — ONNX wurde entfernt, die Laufzeit basiert nun ausschließlich auf llama.cpp + libmtmd

Komplette Neuschreibung des Engines. Brethof Voice Pro nutzt nun Qwen3-ASR in vollem Umfang. llama.cpp mit GGUF-quantisierten Gewichten über libmtmdONNX Runtime ist nicht mehr verfügbar. Die Folgen sind eine kleinere Installation (etwa 83 MB großes Binärdatei, gegenüber mehr als 400 MB zuvor), ein schnellererer Start sowie das Ende der Probleme mit den plattformspezifischen CUDA/DirectML-Bibliotheken.

Vulkan erkennt automatisch Ihre GPU – NVIDIA, AMD oder Intel Arc – und greift bei Abwesenheit einer GPU auf einen CPU-Backup zurück. Derselbe Motor steuert nun alle damit verbundenen Funktionen: ASR, Sprachtastatur, den MCP-Server sowie (seit der Version 2.0.0) die Übersetzung.

Ingenieurwesen 14. Mai 2026

v1.4.0 — Erstveröffentlichung des MCP-Servers + Auswahlwerkzeug für mehrere GPU-Geräte

Der Server des Model Context Protocol ist gestartet. Jeder mit MCP kompatible KI-Agent – Claude Desktop, Claude Code, Cursor, Cline — kann die Transkription über stdio ausführen (kein Port, kein Firewall). Derselbe Release enthält außerdem Multi-GPU-Geräte-Selektor damit Sie auswählen können, welche Vulkan-GPU zur Ausführung der ASR verwendet wird, sowie die optionale Gezwungener Ausrichter Erweiterung für Zeitstempel auf Wortebene in jeder Transkription.

Nur für die bezahlte Version – der MCP-Server weigert sich, ohne eine persönliche oder geschäftliche Lizenz zu starten. brethof-voice --mcp Es handelt sich um die einzeilige Aufrufweise.

Roadmap 16. April 2026

Version für macOS in Entwicklung – zunächst für Apple Silicon

Die am häufigsten gestellte Frage vor dem Release lautete: „Wann kommt macOS?“ Antwort: Es befindet sich in aktiver Entwicklung. Zuerst wird eine Version für Apple Silicon mit Metal-Beschleunigung veröffentlicht, danach eine für Intel. Ziel ist der 3. Quartal 2026 – und wir starten im 2. Quartal ein geschlossenes Beta-Programm. Hier erfahren Sie, an was gearbeitet wird, und wie Sie sich anmelden können.

Artikel lesen →

Produkt 16. April 2026

Persönliches Modelltraining – Brethof Voice Pro an Ihrer eigenen Stimme anpassen

Persönliches Stimmtraining ist in Voice Pro verfügbar. Jedes Mal, wenn Sie ein falsch erkanntes Wort korrigieren, wird das Audiodatei-Clip samt Korrektur automatisch in Ihr lokales Trainingsdatensatz gespeichert. Mit einem Klick im Reiter „Training“ kann eine LoRA an Ihrem Akzent angepasst werden – die App wählt automatisch entweder NVIDIA CUDA oder CPU aus und exportiert das trainierte Modell anschließend als GGUF. Im Lieferumfang jeder kostenpflichtigen Lizenz enthalten.

Artikel lesen →

Ankündigung 16. April 2026

Brethof Voice Pro ist jetzt verfügbar – Sprach-zu-Text-Übersetzung, die auf Ihrem Gerät bleibt.

Nach monatelanger Entwicklungsarbeit wird Voice Pro v1.0 heute für Windows und Linux veröffentlicht. 30 Transkriptionssprachen sowie 22 chinesische Dialekte, vollständige Offline-Transkription, Sprecheingabe per Tastenkombination überall – und ein einmaliger Preis ohne Abonnement. Hier sind die Funktionen, die in die Erstversion aufgenommen wurden, sowie die nächsten Entwicklungsziele.

Artikel lesen →

Champions 16. April 2026

1.800 kostenlose Lizenzen verfügbar: Das Champions Program ist geöffnet

Das Champions Program startet heute und läuft bis zum 16. Mai. Fünfzig kostenlose Personal-Lizenzen pro unterstützter Sprache – insgesamt 1.800 – sowie ein Rabatt von 70 Prozent für alle Teilnehmer, die nicht unter den Top 50 landen. So funktioniert es und warum wir es auf diese Weise machen.

Artikel lesen →

Lizenzierung 16. April 2026

Die persönliche Lizenz umfasst nun auch selbstständige Geschäfte und freiberufliche Tätigkeiten.

Wir haben frühe Rückmeldungen von Autoren, Beratern und Übersetzern geprüft, die der Ansicht waren, dass die alte Klausel „Nur für persönliche Nutzung“ verwirrend sei. Die Personal-Lizenz zum Preis von 49 Dollar umfasst nun ausdrücklich die kommerzielle Nutzung durch Einzelpersonen sowie Freiberufler. Die Business-Lizenz (149 Dollar pro Nutzer) ist für Teams bestimmt. Hier sind die Änderungen und der Grund dafür.

Artikel lesen →

Produkt 12. April 2026

30 Transkriptionssprachen, vollständig übersetzte Benutzeroberfläche – kein maschinell übersetzter Textwall

Brethof Voice Pro kann nun in 30 Sprachen sowie 22 chinesischen Dialekten transkribieren und anzeigen: Arabisch, Kantonesisch, Chinesisch, Tschechisch, Dänisch, Niederländisch, Englisch, Filipino, Finnisch, Französisch, Deutsch, Griechisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Mazedonisch, Malaiisch, Persisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch, Thailändisch, Türkisch, Vietnamesisch. Hier erfahren Sie, wie die App die richtige Sprache auswählt und was „vollständig übersetzt“ tatsächlich bedeutet.

Artikel lesen →

Ingenieurwesen 8. April 2026

Warum wir von ONNX zu GGUF gewechselt sind – schneller, kleiner und einfacher zu verbreiten

Der ASR-Backend von Brethof Voice Pro basiert auf llama.cpp sowie GGUF-quantisierten Qwen-Modellen anstelle von ONNX Runtime. Das Ergebnis sind eine kleinere Installationsgröße (83 MB EXE gegenüber 400+ MB), ein schnellerer Start sowie keine Probleme mehr mit CUDA/DirectML-Bibliotheken auf verschiedenen Plattformen. Hier ist die technische Hintergrundgeschichte zu diesem Wechsel.

Artikel lesen →

Prinzipien 4. April 2026

Warum Brethof Voice Pro zu 100 Prozent offline läuft – und warum das nicht nur eine Funktion ist

Jedes große Diktierprodukt leitet Ihre Stimme über den Server eines Dritten weiter. Wir sind der Ansicht, dass das die falsche Standardeinstellung ist. Ihre Stimme ist die persönlichste Datenart, die Sie erzeugen – medizinische Notizen, rechtliche Entwürfe, private Tagebücher, berufliche Geheimnisse. Deshalb verfügt Voice Pro weder über einen Cloud-Modus noch über „optionalen Telemetriedienst“ und erfordert auch keine Anmeldung zur Transkription.

Artikel lesen →

Erhalten Sie Aktualisierungen in Ihrem Posteingang.

Erstellen Sie ein Konto, um benachrichtigt zu werden, wenn wir neue Beiträge veröffentlichen und neue Versionen versenden.

Konto erstellen

Produkt Aktualisierungen

v2.0.0 – Offline-Übersetzung in 38 Sprachen

v1.6.16 – Die persönliche Stimmenausbildung ist jetzt verfügbar

v1.6.0 — Asynchrone Transkriptionsaufgaben + Verbesserungen auf Wortebene in SRT

v1.5.0 — ONNX wurde entfernt, die Laufzeit basiert nun ausschließlich auf llama.cpp + libmtmd

v1.4.0 — Erstveröffentlichung des MCP-Servers + Auswahlwerkzeug für mehrere GPU-Geräte

Version für macOS in Entwicklung – zunächst für Apple Silicon

Persönliches Modelltraining – Brethof Voice Pro an Ihrer eigenen Stimme anpassen

Brethof Voice Pro ist jetzt verfügbar – Sprach-zu-Text-Übersetzung, die auf Ihrem Gerät bleibt.

1.800 kostenlose Lizenzen verfügbar: Das Champions Program ist geöffnet

Die persönliche Lizenz umfasst nun auch selbstständige Geschäfte und freiberufliche Tätigkeiten.

30 Transkriptionssprachen, vollständig übersetzte Benutzeroberfläche – kein maschinell übersetzter Textwall

Warum wir von ONNX zu GGUF gewechselt sind – schneller, kleiner und einfacher zu verbreiten

Warum Brethof Voice Pro zu 100 Prozent offline läuft – und warum das nicht nur eine Funktion ist

Erhalten Sie Aktualisierungen in Ihrem Posteingang.

Alles, was wir entwickeln

Brethof Voice Pro

Brethof-Mind

3D-Modelle

3D-Druck

Nova

Tolle Listen

Leitfäden

ComfyUI-Arbeitsabläufe

Anti-Dev-Rangliste

Über Brethof AI