Aggiornamenti — Brethof Voice Pro

Rilascio 21 maggio 2026

v2.0.0 — Traduzione offline in 38 lingue

Brethof Voice Pro non è più soltanto un strumento di conversione voce in testo. È stata rilasciata la versione 2.0.0 traduzione offline sviluppato da Tencent Hunyuan MT2 — su FLORES-200 (XCOMET-XXL) il livello 7B raggiunge 97,9% di Google Gemini 3.1 ProInoltre supera Gemini nei test sul mondo reale e nelle lingue minoritarie. La traduzione avviene interamente sul tuo dispositivo. Due livelli di modello, da scaricare su richiesta: Fast (~1 GB, in tempi inferiori a un secondo su CPU o GPU) e Quality (~4,3 GB, in tempi inferiori a un secondo su GPU). Inoltre sono presenti diverse aggiunte attese da tempo.

Cosa c’è di nuovo in v2.0.0:

Trascrivere + tradurre — Il pannello emergente di Trascrizione dispone di un menu a discesa “Traduci in:”. Qwen3-ASR effettua la trascrizione, Hunyuan MT2 esegue la traduzione; entrambi i risultati vengono visualizzati uno accanto all’altro. Funziona con file, microfono e audio del sistema (registrazioni in loop delle chiamate di riunione, schede del browser, qualsiasi cosa riprodotta dagli altoparlanti).
Tastiera vocale multilingue — Il nuovo chip di traduzione nella riga principale consente di visualizzare una griglia linguistica a 3 colonne. Scegli uno o più destinatari e la tastiera inserirà la traduzione. Modi di disposizione: uno per riga, in linea.EN: … || PL: …), oppure solo il primo obiettivo.
Traduttore di sottotitoli SRT / VTT — mantiene i tempi di riproduzione e gli indici delle indicazioni, supporta il modalità bilingue (riga di origine + traduzione per ogni indicazione). Disponibile tramite MCP per l’automazione degli agenti AI.
Multi-GPU per motore — Impostazioni → Modelli dispone di un selettore dispositivo indipendente per ciascun motore. Eseguire l’ASR su Vulkan 0 e la traduzione su Vulkan 1, oppure assegnare Hunyuan MT2 7B al CPU sui laptop con poca VRAM.
L’addestramento vocale personale avviene interamente in tempo reale. — Ottimizzazione LoRA con la propria voce, in modo end-to-end sul proprio computer. La scheda di addestramento nella finestra principale mostra in un colpo d’occhio il numero totale di campioni e i minuti registrati; “Inizia l’addestramento” nella scheda Addestramento seleziona automaticamente NVIDIA CUDA o CPU, per poi esportare automaticamente il modello addestrato in formato GGUF. Gratuito con ogni licenza a pagamento.
4 nuovi strumenti MCP — translate_text, translate_srt, list_compute_devices, set_compute_deviceIl numero totale di strumenti è ora 19.
Un linguaggio onesto divide. — ASR: 30 lingue selezionabili + rilevamento automatico + 22 dialetti cinesi (52 in totale). Traduzione: 38 lingue (33 principali + 5 minoranze delle aree cinesi). 23 permettono la traduzione in entrambe le direzioni.

Il file binario per Linux è di 161 MB, l’installer per Windows è di 118 MB. Stessi prezzi di lancio: 49 dollari per l’uso personale, 149 dollari per uso aziendale. Le licenze esistenti vengono trasferite — semplicemente Scarica la versione 2.0.0 I modelli di traduzione appariranno in Impostazioni → Modelli.

Scarica la versione v2.0.0 →

Rilascio 20 maggio 2026

v1.6.16 — L’addestramento vocale personale è ora disponibile

Il flusso di addestramento è stato rilasciato. Il fine-tuning con LoRA sulla propria voce ora avviene in modo end-to-end sul proprio dispositivo: l’app seleziona automaticamente NVIDIA CUDA or CPU, per poi esportare automaticamente il modello addestrato in formato GGUF una volta completato il processo. Ogni correzione effettuata nell’interfaccia utente viene salvata automaticamente nel dataset di addestramento locale; la scheda relativa all’addestramento nella finestra principale mostra in un colpo d’occhio il numero totale di campioni e i minuti impiegati.

Bonus: l’accuratezza della tastiera vocale è migliorata in tutti i linguaggi grazie a un aggiornamento di llama.cpp (build b9222) che ha risolto il problema dei confini dei blocchi nei clip lunghi. Incluso gratuitamente con ogni licenza a pagamento.

Ingegneria 15 maggio 2026

v1.6.0 — Lavori di trascrizione asincrona + ottimizzazione a livello di parola per i file SRT

Sono stati rilasciati due nuovi strumenti MCP: start_transcription restituisce immediatamente un ID del lavoro in modo che l’agente possa svolgere altre attività, e get_transcription_status Sondaggi per la completazione. Un lavoro alla volta, il risultato viene visualizzato non appena completato. I file lunghi non bloccano più il ciclo dell’agente.

Oltre a una serie di correzioni per l’output SRT/VTT a livello di parola: più spazi inutili prima delle punteggiature, nessuna indicazione con punto isolato, nessuna parola chiave o stringa di contesto che trapela nel testo trascritto. Sottotitoli più puliti, senza necessità di interventi manuali.

Ingegneria 15 maggio 2026

v1.5.0 — ONNX rimosso, il runtime è ora composto esclusivamente da llama.cpp + libmtmd

Riscrittura completa del motore. Brethof Voice Pro ora utilizza Qwen3-ASR in modo end-to-end per llama.cpp con pesi quantizzati in GGUF tramite libmtmdONNX Runtime non esiste più. I vantaggi sono: un’installazione più piccola (~83 MB di file binario, rispetto ai 400+ MB precedenti), un avvio più rapido e la fine dei problemi legati all’utilizzo di versioni diverse di CUDA/DirectML per ciascuna piattaforma.

Vulkan rileva automaticamente la tua GPU — NVIDIA, AMD o Intel Arc — e ricorre a un processore come soluzione di backup in assenza di GPU. Lo stesso motore alimenta ora tutte le funzionalità correlate: ASR, tastiera vocale, server MCP e (ora nella versione 2.0.0) la traduzione.

Ingegneria 14 maggio 2026

v1.4.0 — Debutto del server MCP + selezionatore di dispositivi multi-GPU

Il server del Model Context Protocol è stato avviato. Qualsiasi agente AI compatibile con MCP — Claude Desktop, Claude Code, Cursora, Cline — può eseguire la trascrizione tramite stdio (nessuna porta, nessun firewall). La stessa versione include selettore dispositivo multi-GPU così potrai scegliere quale GPU Vulkan esegue l’ASR, oltre all’opzionale Allineatore Forzato Estensione per l’aggiunta di timestamp a livello di parola in ogni trascrizione.

Disponibile solo nella versione a pagamento: il server MCP rifiuta di avviarsi senza una licenza personale o aziendale. brethof-voice --mcp È l’invocazione a una riga.

Piano di sviluppo 16 aprile 2026

Versione per macOS in fase di sviluppo: prima su Apple Silicon

La domanda più frequente prima del lancio era “quando macOS?”. Risposta: è in fase di sviluppo attivo. Prima arriverà la versione nativa per Apple Silicon con accelerazione Metal, seguita da quella per Intel. L’obiettivo è il terzo trimestre 2026 – e apriremo una beta chiusa nel secondo trimestre. Ecco cosa sta being sviluppato e come iscriversi.

Leggi l’articolo →

Prodotto 16 aprile 2026

Addestramento del modello personale: ottimizza Brethof Voice Pro in base alla tua voce

Con Voice Pro è disponibile un addestramento vocale personalizzato in tempo reale. Ogni volta che correggi una parola riconosciuta erroneamente, il clip audio corrispondente viene salvato automaticamente nel tuo dataset di addestramento locale. Un semplice clic nella scheda “Addestramento” permette di ottimizzare un modello LoRA in base al tuo accento: l’app seleziona automaticamente NVIDIA CUDA o CPU, per poi esportare il modello addestrato in formato GGUF. Gratuito con ogni licenza a pagamento.

Leggi l’articolo →

Annuncio 16 aprile 2026

Brethof Voice Pro è disponibile: conversione voce in testo che rimane sul tuo dispositivo

Dopo mesi di lavoro di ingegneria, Voice Pro v1.0 è ora disponibile per Windows e Linux. 30 lingue di trascrizione più 22 dialetti cinesi, trascrizione completamente offline, possibilità di dettare tramite tasto di scelta rapida ovunque, e un prezzo unico senza abbonamenti. Ecco cosa è stato incluso nella versione di lancio e su cosa stiamo lavorando ora.

Leggi l’articolo →

Campioni 16 aprile 2026

1.800 licenze gratuite disponibili: il Champions Program è aperto

Il Champions Program inizia oggi e durerà fino al 16 maggio. Cinquanta licenze personali gratuite per ogni lingua supportata – per un totale di 1.800 – oltre a uno sconto del 70% per tutti coloro che non rientrano tra i primi 50. Ecco come funziona e perché lo facciamo in questo modo.

Leggi l’articolo →

Licenze 16 aprile 2026

La licenza personale copre ora sia le attività imprenditoriali individuali che il lavoro autonomo.

Abbiamo preso in considerazione i primi feedback provenienti da scrittori, consulenti e traduttori, i quali ritenevano che la vecchia dicitura “uso personale esclusivo” fosse confusa. La licenza Personale, al prezzo di 49 dollari, copre ora esplicitamente l’uso commerciale da parte di individui o freelance. La licenza Business (149 dollari per postazione) è destinata a team. Ecco cosa è cambiato e perché.

Leggi l’articolo →

Prodotto 12 aprile 2026

30 lingue di trascrizione, interfaccia utente completamente tradotta — nessun testo risultato da traduzione automatica.

Brethof Voice Pro ora è in grado di trascrivere e presentare il testo in 30 lingue oltre a 22 dialetti cinesi: arabo, cantonese, cinese, ceco, danese, olandese, inglese, filippino, finlandese, francese, tedesco, greco, hindi, ungherese, indonesiano, italiano, giapponese, coreano, macedone, malese, persiano, polacco, portoghese, rumeno, russo, spagnolo, svedese, thailandese, turco, vietnamita. Ecco come l’app seleziona la lingua appropriata e cosa si intende esattamente per “traduzione completa”.

Leggi l’articolo →

Ingegneria 8 aprile 2026

Perché siamo passati da ONNX a GGUF: più veloce, più piccolo, più semplice da distribuire

Il backend ASR di Brethof Voice Pro funziona su llama.cpp con modelli Qwen quantizzati in formato GGUF, anziché su ONNX Runtime. Il risultato è un file da installare più piccolo (83 MB di exe contro oltre 400 MB), un avvio più rapido e l’assenza della necessità di gestire i pacchetti CUDA/DirectML su ogni piattaforma. Ecco la storia tecnica alla base di questo cambio.

Leggi l’articolo →

Principi 4 aprile 2026

Perché Brethof Voice Pro funziona al 100% in modalità offline — e perché non si tratta soltanto di una funzionalità

Ogni principale strumento di dettatura invia la voce dell’utente attraverso i server di terzi. Riteniamo che questa sia una scelta predefinita errata. La voce rappresenta i dati più personali che si generano: note mediche, bozze legali, diari privati, segreti lavorativi. Ecco perché Voice Pro non dispone di modalità cloud, né di “telemetria opzionale”, e non richiede l’uso di un account per effettuare la trascrizione.

Leggi l’articolo →

Ricevi aggiornamenti nella tua casella di posta

Crea un account per essere avvisato quando pubblichiamo nuovi post e rilasciamo nuove versioni.

Crea un account

Prodotto Aggiornamenti

v2.0.0 — Traduzione offline in 38 lingue

v1.6.16 — L’addestramento vocale personale è ora disponibile

v1.6.0 — Lavori di trascrizione asincrona + ottimizzazione a livello di parola per i file SRT

v1.5.0 — ONNX rimosso, il runtime è ora composto esclusivamente da llama.cpp + libmtmd

v1.4.0 — Debutto del server MCP + selezionatore di dispositivi multi-GPU

Versione per macOS in fase di sviluppo: prima su Apple Silicon

Addestramento del modello personale: ottimizza Brethof Voice Pro in base alla tua voce

Brethof Voice Pro è disponibile: conversione voce in testo che rimane sul tuo dispositivo

1.800 licenze gratuite disponibili: il Champions Program è aperto

La licenza personale copre ora sia le attività imprenditoriali individuali che il lavoro autonomo.

30 lingue di trascrizione, interfaccia utente completamente tradotta — nessun testo risultato da traduzione automatica.

Perché siamo passati da ONNX a GGUF: più veloce, più piccolo, più semplice da distribuire

Perché Brethof Voice Pro funziona al 100% in modalità offline — e perché non si tratta soltanto di una funzionalità

Ricevi aggiornamenti nella tua casella di posta

Tutto ciò che creiamo

Brethof Voice Pro

Brethof-Mind

Modelli 3D

Stampa 3D

Nova

Elenchi fantastici

Guide

Flussi di lavoro di ComfyUI

Classifica dei livelli anti-dev

Informazioni su Brethof AI