Annunci di lancio, notizie sul Champions Program, nuove funzionalità e informazioni sull’ingegneria dietro le quinte fornite dal team di Brethof Voice Pro.
Brethof Voice Pro non è più soltanto un strumento di conversione voce in testo. È stata rilasciata la versione 2.0.0 traduzione offline sviluppato da Tencent Hunyuan MT2 — su FLORES-200 (XCOMET-XXL) il livello 7B raggiunge 97,9% di Google Gemini 3.1 ProInoltre supera Gemini nei test sul mondo reale e nelle lingue minoritarie. La traduzione avviene interamente sul tuo dispositivo. Due livelli di modello, da scaricare su richiesta: Fast (~1 GB, in tempi inferiori a un secondo su CPU o GPU) e Quality (~4,3 GB, in tempi inferiori a un secondo su GPU). Inoltre sono presenti diverse aggiunte attese da tempo.
Cosa c’è di nuovo in v2.0.0:
EN: … || PL: …), oppure solo il primo obiettivo.translate_text, translate_srt, list_compute_devices, set_compute_deviceIl numero totale di strumenti è ora 19.Il file binario per Linux è di 161 MB, l’installer per Windows è di 118 MB. Stessi prezzi di lancio: 49 dollari per l’uso personale, 149 dollari per uso aziendale. Le licenze esistenti vengono trasferite — semplicemente Scarica la versione 2.0.0 I modelli di traduzione appariranno in Impostazioni → Modelli.
Scarica la versione v2.0.0 →Il flusso di addestramento è stato rilasciato. Il fine-tuning con LoRA sulla propria voce ora avviene in modo end-to-end sul proprio dispositivo: l’app seleziona automaticamente NVIDIA CUDA or CPU, per poi esportare automaticamente il modello addestrato in formato GGUF una volta completato il processo. Ogni correzione effettuata nell’interfaccia utente viene salvata automaticamente nel dataset di addestramento locale; la scheda relativa all’addestramento nella finestra principale mostra in un colpo d’occhio il numero totale di campioni e i minuti impiegati.
Bonus: l’accuratezza della tastiera vocale è migliorata in tutti i linguaggi grazie a un aggiornamento di llama.cpp (build b9222) che ha risolto il problema dei confini dei blocchi nei clip lunghi. Incluso gratuitamente con ogni licenza a pagamento.
Sono stati rilasciati due nuovi strumenti MCP: start_transcription restituisce immediatamente un ID del lavoro in modo che l’agente possa svolgere altre attività, e get_transcription_status Sondaggi per la completazione. Un lavoro alla volta, il risultato viene visualizzato non appena completato. I file lunghi non bloccano più il ciclo dell’agente.
Oltre a una serie di correzioni per l’output SRT/VTT a livello di parola: più spazi inutili prima delle punteggiature, nessuna indicazione con punto isolato, nessuna parola chiave o stringa di contesto che trapela nel testo trascritto. Sottotitoli più puliti, senza necessità di interventi manuali.
Riscrittura completa del motore. Brethof Voice Pro ora utilizza Qwen3-ASR in modo end-to-end per llama.cpp con pesi quantizzati in GGUF tramite libmtmdONNX Runtime non esiste più. I vantaggi sono: un’installazione più piccola (~83 MB di file binario, rispetto ai 400+ MB precedenti), un avvio più rapido e la fine dei problemi legati all’utilizzo di versioni diverse di CUDA/DirectML per ciascuna piattaforma.
Vulkan rileva automaticamente la tua GPU — NVIDIA, AMD o Intel Arc — e ricorre a un processore come soluzione di backup in assenza di GPU. Lo stesso motore alimenta ora tutte le funzionalità correlate: ASR, tastiera vocale, server MCP e (ora nella versione 2.0.0) la traduzione.
Il server del Model Context Protocol è stato avviato. Qualsiasi agente AI compatibile con MCP — Claude Desktop, Claude Code, Cursora, Cline — può eseguire la trascrizione tramite stdio (nessuna porta, nessun firewall). La stessa versione include selettore dispositivo multi-GPU così potrai scegliere quale GPU Vulkan esegue l’ASR, oltre all’opzionale Allineatore Forzato Estensione per l’aggiunta di timestamp a livello di parola in ogni trascrizione.
Disponibile solo nella versione a pagamento: il server MCP rifiuta di avviarsi senza una licenza personale o aziendale. brethof-voice --mcp È l’invocazione a una riga.
La domanda più frequente prima del lancio era “quando macOS?”. Risposta: è in fase di sviluppo attivo. Prima arriverà la versione nativa per Apple Silicon con accelerazione Metal, seguita da quella per Intel. L’obiettivo è il terzo trimestre 2026 – e apriremo una beta chiusa nel secondo trimestre. Ecco cosa sta being sviluppato e come iscriversi.
Leggi l’articolo →Con Voice Pro è disponibile un addestramento vocale personalizzato in tempo reale. Ogni volta che correggi una parola riconosciuta erroneamente, il clip audio corrispondente viene salvato automaticamente nel tuo dataset di addestramento locale. Un semplice clic nella scheda “Addestramento” permette di ottimizzare un modello LoRA in base al tuo accento: l’app seleziona automaticamente NVIDIA CUDA o CPU, per poi esportare il modello addestrato in formato GGUF. Gratuito con ogni licenza a pagamento.
Leggi l’articolo →Dopo mesi di lavoro di ingegneria, Voice Pro v1.0 è ora disponibile per Windows e Linux. 30 lingue di trascrizione più 22 dialetti cinesi, trascrizione completamente offline, possibilità di dettare tramite tasto di scelta rapida ovunque, e un prezzo unico senza abbonamenti. Ecco cosa è stato incluso nella versione di lancio e su cosa stiamo lavorando ora.
Leggi l’articolo →Il Champions Program inizia oggi e durerà fino al 16 maggio. Cinquanta licenze personali gratuite per ogni lingua supportata – per un totale di 1.800 – oltre a uno sconto del 70% per tutti coloro che non rientrano tra i primi 50. Ecco come funziona e perché lo facciamo in questo modo.
Leggi l’articolo →Abbiamo preso in considerazione i primi feedback provenienti da scrittori, consulenti e traduttori, i quali ritenevano che la vecchia dicitura “uso personale esclusivo” fosse confusa. La licenza Personale, al prezzo di 49 dollari, copre ora esplicitamente l’uso commerciale da parte di individui o freelance. La licenza Business (149 dollari per postazione) è destinata a team. Ecco cosa è cambiato e perché.
Leggi l’articolo →Brethof Voice Pro ora è in grado di trascrivere e presentare il testo in 30 lingue oltre a 22 dialetti cinesi: arabo, cantonese, cinese, ceco, danese, olandese, inglese, filippino, finlandese, francese, tedesco, greco, hindi, ungherese, indonesiano, italiano, giapponese, coreano, macedone, malese, persiano, polacco, portoghese, rumeno, russo, spagnolo, svedese, thailandese, turco, vietnamita. Ecco come l’app seleziona la lingua appropriata e cosa si intende esattamente per “traduzione completa”.
Leggi l’articolo →Il backend ASR di Brethof Voice Pro funziona su llama.cpp con modelli Qwen quantizzati in formato GGUF, anziché su ONNX Runtime. Il risultato è un file da installare più piccolo (83 MB di exe contro oltre 400 MB), un avvio più rapido e l’assenza della necessità di gestire i pacchetti CUDA/DirectML su ogni piattaforma. Ecco la storia tecnica alla base di questo cambio.
Leggi l’articolo →Ogni principale strumento di dettatura invia la voce dell’utente attraverso i server di terzi. Riteniamo che questa sia una scelta predefinita errata. La voce rappresenta i dati più personali che si generano: note mediche, bozze legali, diari privati, segreti lavorativi. Ecco perché Voice Pro non dispone di modalità cloud, né di “telemetria opzionale”, e non richiede l’uso di un account per effettuare la trascrizione.
Leggi l’articolo →Crea un account per essere avvisato quando pubblichiamo nuovi post e rilasciamo nuove versioni.
Crea un accountTrascrizione vocale locale che impara la tua voce. Licenza perpetua. Il nostro prodotto di punta.
A pagamento · modello di punta
Memoria a lungo termine locale per Claude Code: testo completo + vettoriale + grafi, su SurrealDB. MIT.
GRATIS · open source
Modelli digitali pronti per la stampa. STL/3MF/OBJ inclusi. Accesso a vita.
A pagamento · catalogo digitale
I nostri design stampati vengono spediti in tutta Europa. Acquistate l’oggetto, non il file.
A pagamento · oggetti fisici
Host AI Cyber-tiger: spiegazione dell’AI incentrata sulla privacy, senza filtri aziendali.
CANALE · in diretta
Elenchi curati su GitHub per AI, MCP, AI locale, Linux per l’AI e altro ancora. Fatti concreti, non solo impressioni.
GRATIS · selezionato con cura
Guide dettagliate su come utilizzare l’AI locale su Linux, Windows e macOS. Configurazioni reali, niente pubblicità.
GRATIS · presto disponibile
Grafici ComfyUI testati in produzione: LTX chunked-loop, la pipeline Nova e altro ancora.
GRATIS · landing page dei flussi di lavoro
Curatione negativa: pratiche e strumenti che sprecano il tuo tempo, classificati. Ricevute richieste.
GRATIS · presto disponibile
Chi siamo, perché costruiamo un'IA locale-first e cosa non faremo.