Annonces de lancement, actualités du programme Champions, nouvelles fonctionnalités, ainsi que des informations sur le travail d’ingénierie en coulisses provenant de l’équipe de Brethof Voice Pro.
Brethof Voice Pro n’est plus seulement un outil de conversion voix en texte. La version 2.0.0 est maintenant disponible. traduction hors ligne propulsé par Tencent Hunyuan MT2 — sur FLORES-200 (XCOMET-XXL), le niveau 7B est atteint 97,9 % de Google Gemini 3.1 ProEt il surpasse Gemini dans les tests en situation réelle ainsi que pour les langues minoritaires. La traduction s’effectue entièrement sur votre appareil. Deux niveaux de modèles, téléchargeables sur demande : Fast (~1 GB, en quelques fractions de seconde sur CPU ou GPU) et Quality (~4,3 GB, en quelques fractions de seconde sur GPU). Plus plusieurs ajouts très attendus.
Qu’y a-t-il de nouveau dans la version 2.0.0 ?
EN: … || PL: …), ou uniquement la première cible.translate_text, translate_srt, list_compute_devices, set_compute_deviceLe nombre total d’outils est maintenant de 19.Le binaire Linux fait 161 MB, l’installateur Windows fait 118 MB. Mêmes prix de vente : 49 Télécharger v2.0.0 Et les modèles de traduction apparaîtront dans Paramètres → Modèles.
Télécharger v2.0.0 →Le pipeline d’entraînement est disponible. L’ajustement de LoRA sur votre propre voix s’exécute désormais en continu sur votre appareil — l’application choisit automatiquement NVIDIA CUDA or CPU, puis exporte automatiquement le modèle entraîné en format GGUF une fois le processus terminé. Chaque correction effectuée dans l’interface graphique est enregistrée automatiquement dans votre ensemble de données d’entraînement local ; la carte d’entraînement de la fenêtre principale affiche d’un coup d’œil le nombre total d’échantillons et le temps écoulé.
Bonus : la précision du clavier vocal s’est améliorée dans toutes les langues grâce à une mise à jour de llama.cpp (version b9222) qui a corrigé le problème de délimitation des segments dans les clips longs. Offert gratuitement avec chaque licence payante.
Deux nouveaux outils MCP sont disponibles : start_transcription retourne immédiatement un ID de tâche afin que l’agent puisse s’occuper d’autres tâches, et get_transcription_status Sondages pour indiquer l’achèvement. Une tâche à la fois, le résultat est affiché une fois terminée. Les fichiers longs ne bloquent plus la boucle de l’agent.
De plus, une série de correctifs pour l’export SRT/VTT au niveau des mots : plus d’espaces isolés avant les signes de ponctuation, plus de codes avec un point seul, plus de mots-clés ou de chaînes contextuelles qui s’infiltrent dans le transcript. Des sous-titres plus propres, sans besoin de nettoyage manuel.
Réécriture complète du moteur. Brethof Voice Pro utilise désormais Qwen3-ASR de bout en bout pour llama.cpp avec des poids quantifiés en GGUF via libmtmd. ONNX Runtime a disparu. Résultat : une installation plus petite (~83 MB de binaire, contre plus de 400 MB), un démarrage plus rapide, et plus besoin de gérer des versions différentes de CUDA/DirectML pour chaque plateforme.
Vulkan détecte automatiquement votre GPU — NVIDIA, AMD ou Intel Arc — et recourt à un CPU en cas d’absence de GPU. Le même moteur alimente désormais toutes les fonctionnalités associées : ASR, clavier vocal, serveur MCP, ainsi que la traduction (désormais disponible dans la version 2.0.0).
Le serveur du Model Context Protocol est démarré. Tout agent IA compatible avec MCP — Claude Desktop, Claude Code, Pointeur, Cline — peut effectuer la transcription via stdio (pas de port, pas de pare-feu). La même version est fournie avec selecteur de dispositif multi-GPU afin que vous puissiez choisir quelle GPU Vulkan exécute l’ASR, ainsi que l’optionnel Aligneur forcé Complément permettant d’ajouter des timestamps au niveau des mots dans chaque transcription.
Uniquement disponible dans la version payante — le serveur MCP refuse de démarrer sans une licence Personnelle ou Professionnelle. brethof-voice --mcp Il s’agit de l’appel en une seule ligne.
La question la plus fréquente avant le lancement était : « Quand macOS ? » Réponse : en développement actif. Une version native pour Apple Silicon avec accélération Metal sera disponible en premier, suivie de celle pour Intel. La sortie est prévue pour le 3e trimestre 2026 — et nous lançons une bêta fermée au 2e trimestre. Voici ce qui est en cours de développement et comment s’inscrire.
Lire l’article →L’entraînement vocal personnel est disponible dans Voice Pro. Chaque fois que vous corrigez un mot mal reconnu, l’extrait audio ainsi que la correction sont automatiquement enregistrés dans votre ensemble de données d’entraînement local. Un clic dans l’onglet Entraînement permet d’affiner un modèle LoRA adapté à votre accent — l’application choisit automatiquement NVIDIA CUDA ou CPU, puis exporte le modèle entraîné en format GGUF. Disponible gratuitement avec toute licence payante.
Lire l’article →Après des mois de travail d’ingénierie, Voice Pro v1.0 est désormais disponible pour Windows et Linux. 30 langues de transcription ainsi que 22 dialectes chinois, transcription entièrement hors ligne, dictée par raccourci clavier n’importe où, et un prix unique sans abonnement. Voici ce qui a été inclus dans cette version de lancement et ce sur quoi nous travaillons ensuite.
Lire l’article →Le programme Champions commence aujourd’hui et se poursuivra jusqu’au 16 mai. Cinquante licences personnelles gratuites par langue prise en charge — soit au total 1 800 licences — ainsi qu’une remise de 70 % pour tous ceux qui ne se classent pas parmi les 50 meilleurs. Voici comment cela fonctionne et pourquoi nous procédons de cette manière.
Lire l’article →Nous avons pris en compte les retours initiaux des rédacteurs, consultants et traducteurs qui jugeaient l’ancienne mention « à usage personnel uniquement » confuse. La licence Personnelle, au prix de 49 $, couvre désormais explicitement l’utilisation commerciale en tant que travailleur indépendant ou solo. La licence d’entreprise (149 $ par poste) est destinée aux équipes. Voici ce qui a changé et pourquoi.
Lire l’article →Brethof Voice Pro permet désormais de transcrire et de présenter du texte dans 30 langues ainsi que 22 dialectes chinois : arabe, cantonais, chinois, tchèque, danois, néerlandais, anglais, philippin, finnois, français, allemand, grec, hindi, hongrois, indonésien, italien, japonais, coréen, macédonien, malais, persan, polonais, portugais, roumain, russe, espagnol, suédois, thaï, turc, vietnamien. Voici comment l’application choisit la bonne version et ce que signifie réellement « traduction complète ».
Lire l’article →Le moteur ASR de Brethof Voice Pro fonctionne avec llama.cpp et des modèles Qwen quantifiés en GGUF, au lieu d’ONNX Runtime. Le résultat : une taille d’installation plus réduite (83 MB pour l’exécutable contre plus de 400 MB), un démarrage plus rapide, et plus besoin de gérer les pilotes CUDA/DirectML sur chaque plateforme. Voici l’histoire technique derrière ce changement.
Lire l’article →Tous les principaux logiciels de dictée envoient votre voix via le serveur d’un tiers. Nous estimons que c’est la configuration par défaut erronée. Votre voix constitue les données les plus personnelles que vous générez – notes médicales, projets juridiques, journaux intimes, secrets professionnels. C’est pourquoi Voice Pro ne dispose d’aucun mode cloud, d’aucune « télémétrie optionnelle », et n’exige pas de compte pour effectuer la transcription.
Lire l’article →Créez un compte pour être averti lorsque nous publions de nouveaux articles et que de nouvelles versions sont mises en ligne.
Créer un compteReconnaissance vocale locale qui apprend votre voix. Licence perpétuelle. Notre produit phare.
PAIÉ · modèle phare
Mémoire à long terme locale pour Claude Code — texte intégral + vecteurs + graphes, sur SurrealDB. MIT.
GRATUIT · open source
Modèles numériques prêts à l’impression. STL/3MF/OBJ inclus. Accès à vie.
Payant · catalogue numérique
Nos designs imprimés, expédiés dans toute l’Europe. Achetez l’objet, pas le fichier.
PAIÉ · objets physiques
Hôte IA Cyber-tiger. Une explication de l’IA axée sur la confidentialité, sans les filtres des entreprises.
CANAL · en direct
Listes sélectionnées sur GitHub pour l’IA, MCP, l’IA locale, Linux pour l’IA, et bien plus encore. Des preuves, pas des vibes.
GRATUIT · sélectionné avec soin
Guides détaillés pour l’utilisation de l’IA locale sous Linux, Windows et macOS. Configurations réelles, pas de publicité.
GRATUIT · disponible bientôt
Graphiques ComfyUI éprouvés — boucle par bloc LTX, le pipeline Nova, et bien plus encore.
GRATUIT · page d’accueil des workflows
Curation négative : pratiques et outils qui vous font perdre du temps, classés. Justificatifs requis.
GRATUIT · disponible bientôt
Qui nous sommes, pourquoi nous développons une IA locale-first, et ce que nous ne ferons pas.