Transkribieren 30 Sprachen + 22 chinesische Dialekte
Übersetzen 38 Sprachen, vollständig offline
Zeitstempel Erstellen Sie Ihre eigenen Untertitel.
MCP-Server Sprich mit ihm über Ihre AI-Plattform.
Funktioniert lokal – auch auf Laptops•Keine Abonnementgebühr•14-tägige kostenlose Testversion
Jedes Wort, das Sie aussprechen, wird auf Ihrem Gerät verarbeitet. Kein Audio, kein Text und keine Metadaten werden jemals an einen Server übertragen. Es gibt weder einen Cloud-Backend-Service noch Telemetriedaten, Analysefunktionen oder eine Rückmeldefunktion.
Brethof Voice Pro nutzt den für GGUF optimierten Engine mit llama.cpp, um blitzschnelle Inferenzleistungen zu erzielen. Es unterstützt von Anfang an alle drei großen GPU-Hersteller.
Angetrieben von Qwen3-ASR über llama.cpp. Wählen Sie eine bestimmte Sprache für maximale Genauigkeit aus oder überlassen Sie es dem Motor, sie automatisch zu erkennen. Jedes Wort bleibt auf Ihrem Gerät.
Zusätzlich 22 chinesische Dialekte (Anhui, Dongbei, Fujian, Henan, Hunan, Shandong, Sichuan, Wu, Minnan und weitere), die automatisch erkannt werden, wenn die Sprache auf Chinesisch oder Automatisches Erkennen eingestellt ist.
Übersetzen Sie jegliche Transkription, Sprach-Tastatur-Ausgabe, reinen Text oder Untertiteldatei – vollständig auf Ihrem Gerät. Angetrieben von Tencent Hunyuan MT2: Bei FLORES-200 (XCOMET-XXL) erreicht die Qualitätsebene 97,9 % von Google Gemini 3.1 Pro Und die kompakte Fast-Klasse erreicht 89,9 % – sie übertrifft Gemini 3.1 Pro bei der Anwendung in der Realwelt (WildMTBench) sowie bei der Übersetzung von Minderheitensprachen.
Wählen Sie das Verhältnis aus Genauigkeit, Geschwindigkeit und VRAM aus, das zu Ihrem Gerät passt. Beide nutzen dieselbe Qwen3-ASR-Architektur; wechseln Sie jederzeit über Einstellungen → Modelle.
Optionaler Download von Erweiterungen auf Anfrage über Einstellungen → Modelle: Gezwungener Ausrichter (~540 MB) für Zeitsignale auf Wortebene. Hunyuan MT2 Fast (~1 GB) oder Qualität (~4,3 GB) für die Übersetzung.
Optionelle DeepFilter-Rauschunterdrückung für Aufnahmen in lauten Räumen – standardmäßig deaktiviert, kann über das Pop-up-Menü „Rauschen“ aktiviert werden. Die Deaktivierung bei sauberen Mikrofonaufnahmen verbessert tatsächlich die Qualität (DeepFilter kann kurze, saubere Audiodateien übermäßig verarbeiten).
Passen Sie das Modell mit LoRA an Ihre eigene Stimme an – die Verarbeitung erfolgt vollständig auf Ihrem Gerät. Jedes Mal, wenn Sie ein falsch erkanntes Wort korrigieren, wird das {clip, Korrektur}-Paar in Ihr lokales Trainingsdatensatz gespeichert. Auf der Trainingskarte im Hauptfenster werden die Gesamtanzahl der Beispiele sowie die aufgenommene Zeit auf einen Blick angezeigt – klicken Sie darauf, um den Datensatzbrowser zu öffnen, und wählen Sie anschließend „Training starten“ in der Trainingsleiste.
Halten Sie die Schnelltaste gedrückt, sprechen Sie, und der Text wird an die Stelle gebracht, an der sich Ihr Cursor befindet – genauso wie bei einer Tastatur. Es funktioniert in Browsern, IDEs, Terminals, Chat-Apps – überall, wo ein Textfeld Tastatureingaben entgegennimmt.
EN: … || PL: …), oder nur das erste Ziel.Ein Feld, zwei Verwendungen. Bias die ASR bei Eigennamen, Markennamen und Fachbegriffen – verhindert, dass „VFIO“ fälschlicherweise als „VEAF1“ übersetzt wird. Dasselbe Feld dient außerdem als Wörterbuch für Übersetzungsterminologie — Markieren Sie „Brethof Voice“ damit es in jeder Zielsprache weiterhin als „Brethof Voice“ angezeigt wird.
Derselbe Binärdatei, der die GUI ausführt, kann auch als Server für das Model Context Protocol genutzt werden – 19 Tools, die ASR und MT für Claude Desktop, Claude Code, Cursor, Cline oder jeden MCP-kompatiblen Agenten bereitstellen. Die Kommunikation erfolgt über stdio: kein Port, keine Firewall, keine Bindung an localhost. Der Agent steuert den gesamten Lebenszyklus.
Ausführen brethof-voice --mcp Und der Agent stellt eine Verbindung über stdio her. Eine kostenpflichtige Lizenz ist erforderlich – Testnutzer können den Server nicht starten.
14-tägige kostenlose Testversion. Alle Funktionen sind verfügbar. Keine Kreditkarte erforderlich.
Lokale Spracherkennung, die Ihre Stimme lernt. Lebenslange Lizenz. Unser Flaggschiff.
GEZAHLT · Flaggschiff
Lokales Langzeitgedächtnis für Claude Code – Volltext + Vektoren + Graphen, in SurrealDB. MIT.
KOSTENLOS · Open Source
Druckfertige digitale Modelle. STL/3MF/OBJ enthalten. Lebenslanger Zugang.
GEZAHLT · digitaler Katalog
Unsere gedruckten Designs werden in ganz Europa versandt. Kaufen Sie das Objekt, nicht die Datei.
BEZAHLT · physische Objekte
Cyber-Tiger AI-Host. Datenschutzorientierte KI – ohne Corporate-Filter.
KANAL · LIVE
Kuratierte GitHub-Listen für KI, MCP, lokale KI, Linux für KI und mehr. Belege, keine Stimmung.
KOSTENLOS · sorgfältig ausgewählt
Ausführliche Anleitungen zur Nutzung lokaler KI unter Linux, Windows und macOS. Echte Konfigurationen – kein Marketing.
KOSTENLOS · bald verfügbar
Produktionsgetestete ComfyUI-Graphen – LTX Chunked-Loop, die Nova-Pipeline und mehr.
KOSTENLOS · Workflows-Landingpage
Negative-Curation: Praktiken und Tools, die Ihre Zeit verschwenden – in einer Rangfolge. Belege erforderlich.
KOSTENLOS · bald verfügbar
Wer wir sind, warum wir lokale KI entwickeln und was wir nicht tun werden.