Actualizaciones — Brethof Voice Pro

Lanzamiento 21 de mayo de 2026

v2.0.0: Traducción sin conexión en 38 idiomas

Brethof Voice Pro ya no es solo una herramienta de texto a voz. Llega la versión 2.0.0 traducción sin conexión proporcionado por Tencent Hunyuan MT2 — en FLORES-200 (XCOMET-XXL), el nivel 7B alcanza 97.9% de Google Gemini 3.1 ProAdemás, supera a Gemini en pruebas del mundo real y de lenguas minoritarias. La traducción se realiza íntegramente en su propia máquina. Hay dos niveles de modelo que se descargan según sea necesario: Rápido (~1 GB, en menos de un segundo en CPU o GPU) y de Calidad (~4,3 GB, en menos de un segundo en GPU). Además, varias adiciones muy esperadas.

Novedades en la v2.0.0:

Transcribir + traducir — El menú emergente de Transcribe cuenta con un desplegable “Traducir a:”. Qwen3-ASR realiza la transcripción, Hunyuan MT2 realiza la traducción; ambos resultados se muestran uno al lado del otro. Funciona con archivos, el micrófono y el audio del sistema (grabación en bucle de llamadas de reuniones, pestañas del navegador, cualquier cosa que se reproduzca en los altavoces).
Teclado de voz multilingüe — El nuevo chip de traducción en la fila principal permite mostrar una cuadrícula de idiomas de 3 columnas. Elija uno o más destinos y el teclado escribirá la traducción. Modos de disposición: uno por línea, en línea.EN: … || PL: …), o solo el primer objetivo.
Traductor de subtítulos SRT / VTT — Mantiene los tiempos y los índices de indicación, admite modo bilingüe (línea de origen + traducción por cada indicación). Se expone a través de MCP para la automatización de agentes de IA.
Múltiples GPU por motor — Ajustes → Modelos cuenta con un selector de dispositivo independiente para cada motor. Ejecute la ASR en Vulkan 0 y la traducción en Vulkan 1, o asigne a Hunyuan MT2 7B al CPU en portátiles con poca VRAM.
El entrenamiento de voz personal se realiza en tiempo real. — Ajuste fino de LoRA con su propia voz, de extremo a extremo en su propia máquina. La tarjeta de entrenamiento de la ventana principal muestra de un vistazo el número total de muestras y los minutos grabados; “Iniciar entrenamiento” en la pestaña de Entrenamiento elige automáticamente NVIDIA CUDA o CPU, y luego exporta automáticamente el modelo entrenado a formato GGUF. Está incluido gratis con cada licencia de pago.
4 nuevas herramientas MCP — translate_text, translate_srt, list_compute_devices, set_compute_deviceEl número total de herramientas es ahora 19.
Un lenguaje honesto divide. — ASR: 30 idiomas seleccionables + detección automática + 22 dialectos chinos (52 en total). Traducción: 38 idiomas (33 principales + 5 minorías de la región china). 23 permiten la traducción bidireccional.

El binario para Linux tiene 161 MB, mientras que el instalador para Windows tiene 118 MB. Los mismos precios de lanzamiento: 49 dólares para uso personal y 149 dólares para uso empresarial. Las licencias existentes se transfieren; simplemente Descargar v2.0.0 Y los modelos de traducción aparecerán en Ajustes → Modelos.

Descargar v2.0.0 →

Lanzamiento 20 de mayo de 2026

v1.6.16: Ya está disponible el entrenamiento de voz personal.

El pipeline de entrenamiento ya está listo. El ajuste fino de LoRA con su propia voz ahora se ejecuta de forma integral en su equipo; la aplicación elige automáticamente NVIDIA CUDA or CPULuego exporta automáticamente el modelo entrenado a formato GGUF una vez finalizado. Cada corrección que realice en la interfaz gráfica se guarda automáticamente en su conjunto de datos de entrenamiento local; la tarjeta de entrenamiento de la ventana principal muestra de un vistazo el número total de muestras y los minutos empleados.

Bonus: La precisión del teclado de voz mejoró en todos los idiomas gracias a una actualización de llama.cpp (versión b9222) que corrigió el problema de colapso de los límites de los segmentos en clips largos. Incluido gratis con cada licencia de pago.

Ingeniería 15 de mayo de 2026

v1.6.0 — Tareas de transcripción asíncrona + mejora en SRT a nivel de palabra

Llegan dos nuevas herramientas MCP: start_transcription devuelve un ID de tarea al instante para que el agente pueda realizar otras tareas, y get_transcription_status Encuestas para finalizar. Un trabajo a la vez; el resultado se muestra al terminar. Los archivos largos ya no bloquean el bucle del agente.

Además, una serie de correcciones para la salida en formato SRT/VTT a nivel de palabras: ya no habrá espacios sueltos antes de las signos de puntuación, ni indicadores con punto solitario, ni cadenas de palabras clave o contexto que se filtren en el transcripción. Subtítulos más limpios, sin necesidad de limpieza manual.

Ingeniería 15 de mayo de 2026

v1.5.0: Se eliminó ONNX; el tiempo de ejecución ahora es exclusivamente llama.cpp + libmtmd

Reescritura completa del motor. Brethof Voice Pro ahora utiliza Qwen3-ASR de punta a punta en llama.cpp con pesos cuantizados en GGUF a través de libmtmd. ONNX Runtime ya no existe. Como resultado: una instalación más pequeña (~83 MB de binario, en comparación con más de 400 MB), un inicio más rápido y sin tener que lidiar con versiones diferentes de CUDA/DirectML para cada plataforma.

Vulkan detecta automáticamente tu GPU —NVIDIA, AMD o Intel Arc— y recurre a la CPU en caso de que no haya GPU disponible. Este mismo motor impulsa ahora todas las funciones relacionadas: ASR, teclado de voz, el servidor MCP y, desde la versión 2.0.0, la traducción.

Ingeniería 14 de mayo de 2026

v1.4.0 — Lanzamiento del servidor MCP + selector de dispositivos multi-GPU

El servidor del Protocolo de Contexto del Modelo se ha conectado. Cualquier agente de IA compatible con MCP — Claude Desktop, Claude Code, Cursor, Cline — puede realizar la transcripción a través de stdio (sin puerto, sin firewall). La misma versión incluye seleccionador de dispositivos multi-GPU así que puedes elegir qué GPU Vulkan ejecutará la ASR, además de la opción adicional Alineador Forzado Complemento para marcas de tiempo a nivel de palabra en cada transcripción.

Solo está disponible en la versión de pago: el servidor MCP se niega a iniciarse sin una licencia personal o empresarial. brethof-voice --mcp Es la invocación de una sola línea.

Hoja de ruta 16 de abril de 2026

Versión para macOS en desarrollo: primero con Apple Silicon

La pregunta más frecuente antes del lanzamiento fue “¿cuándo macOS?”. Respuesta: está en desarrollo activo. Primero llegará la versión nativa para Apple Silicon con aceleración Metal, seguida de la para Intel. La fecha objetivo es el tercer trimestre de 2026; además, iniciaremos una beta cerrada en el segundo trimestre. Aquí se explica qué se está desarrollando y cómo inscribirse.

Leer entrada →

Producto 16 de abril de 2026

Entrenamiento de modelo personal: ajuste fino de Brethof Voice Pro con su propia voz

El entrenamiento personal de voz está disponible en Voice Pro. Cada vez que corrige una palabra mal reconocida, el clip de audio junto con la corrección se guarda automáticamente en su conjunto de datos de entrenamiento local. Con un solo clic en la pestaña de Entrenamiento se puede ajustar un modelo LoRA según su acento; la aplicación elige automáticamente entre NVIDIA CUDA o CPU, y luego exporta el modelo entrenado a formato GGUF. Está incluido de forma gratuita con cada licencia de pago.

Leer entrada →

Anuncio 16 de abril de 2026

Brethof Voice Pro ya está disponible: conversión de voz a texto que permanece en tu equipo.

Tras meses de trabajo de ingeniería, Voice Pro v1.0 ya está disponible hoy para Windows y Linux. Incluye 30 idiomas de transcripción más 22 dialectos chinos, transcripción completamente sin conexión, dictado con teclas de acceso rápido en cualquier lugar, y un precio único sin necesidad de suscripción. A continuación, se detallan las características incluidas en esta versión inicial y lo que estamos trabajando a continuación.

Leer entrada →

Campeones 16 de abril de 2026

1,800 licencias gratuitas disponibles: el Programa Champions está abierto

El Programa Champions comienza hoy y durará hasta el 16 de mayo. Se ofrecen cincuenta licencias personales gratuitas por idioma admitido, lo que suma un total de 1,800 licencias, además de un descuento del 70% para todos aquellos participantes que no se clasifiquen entre los 50 primeros. Aquí le explicamos cómo funciona y por qué lo hacemos de esta manera.

Leer entrada →

Licencias 16 de abril de 2026

La licencia personal ahora cubre trabajos independientes y como freelancer.

Escuchamos las primeras opiniones de redactores, consultores y traductores que consideraban que la antigua cláusula de “uso exclusivo personal” era confusa. La licencia Personal, por 49 dólares, ahora cubre explícitamente el uso comercial individual y como freelancer. La licencia empresarial (149 dólares por puesto) está destinada a equipos. A continuación se detallan los cambios y sus motivos.

Leer entrada →

Producto 12 de abril de 2026

30 idiomas de transcripción, interfaz completamente traducida: no un texto masivo traducido por máquina.

Brethof Voice Pro ahora transcribe y se presenta en 30 idiomas además de 22 dialectos chinos: árabe, cantonés, chino, checo, danés, holandés, inglés, filipino, finlandés, francés, alemán, griego, hindi, húngaro, indonesio, italiano, japonés, coreano, macedonio, malayo, persa, polaco, portugués, rumano, ruso, español, sueco, tailandés, turco, vietnamita. Aquí se explica cómo la aplicación elige el idioma adecuado y qué significa realmente “traducido por completo”.

Leer entrada →

Ingeniería 8 de abril de 2026

Por qué pasamos de ONNX a GGUF: más rápido, más pequeño y más fácil de distribuir

El backend de ASR de Brethof Voice Pro funciona con llama.cpp y modelos Qwen cuantizados en formato GGUF, en lugar de ONNX Runtime. Como resultado, se obtiene una instalación más pequeña (un archivo exe de 83 MB frente a más de 400 MB), un inicio más rápido, y ya no es necesario lidiar con los controladores CUDA/DirectML en cada plataforma. A continuación, se presenta la historia técnica detrás de este cambio.

Leer entrada →

Principios 4 de abril de 2026

Por qué Brethof Voice Pro funciona al 100% sin conexión, y por qué eso no es solo una característica

Todos los principales productos de dictado envían tu voz a través del servidor de terceros. Consideramos que ese es el valor predeterminado incorrecto. Tu voz es la información más personal que generas: notas médicas, borradores legales, diarios privados, secretos laborales. Por eso Voice Pro no cuenta con modo en la nube, ni “telemetría opcional”, ni requiere cuenta para realizar transcripciones.

Leer entrada →

Reciba actualizaciones en su bandeja de entrada

Cree una cuenta para recibir notificaciones cuando publiquemos nuevos artículos y lancemos nuevas versiones.

Crear cuenta

Producto Actualizaciones

v2.0.0: Traducción sin conexión en 38 idiomas

v1.6.16: Ya está disponible el entrenamiento de voz personal.

v1.6.0 — Tareas de transcripción asíncrona + mejora en SRT a nivel de palabra

v1.5.0: Se eliminó ONNX; el tiempo de ejecución ahora es exclusivamente llama.cpp + libmtmd

v1.4.0 — Lanzamiento del servidor MCP + selector de dispositivos multi-GPU

Versión para macOS en desarrollo: primero con Apple Silicon

Entrenamiento de modelo personal: ajuste fino de Brethof Voice Pro con su propia voz

Brethof Voice Pro ya está disponible: conversión de voz a texto que permanece en tu equipo.

1,800 licencias gratuitas disponibles: el Programa Champions está abierto

La licencia personal ahora cubre trabajos independientes y como freelancer.

30 idiomas de transcripción, interfaz completamente traducida: no un texto masivo traducido por máquina.

Por qué pasamos de ONNX a GGUF: más rápido, más pequeño y más fácil de distribuir

Por qué Brethof Voice Pro funciona al 100% sin conexión, y por qué eso no es solo una característica

Reciba actualizaciones en su bandeja de entrada

Todo lo que construimos

Brethof Voice Pro

Brethof-Mind

Modelos 3D

Impresión 3D

Nova

Listas fantásticas

Guías

Flujos de trabajo de ComfyUI

Lista de niveles anti-dev

Acerca de Brethof AI