Anuncios de lanzamiento, novedades del Programa de Campeones, nuevas funciones y detalles técnicos del equipo de Brethof Voice Pro.
Brethof Voice Pro ya no es solo una herramienta de texto a voz. Llega la versión 2.0.0 traducción sin conexión proporcionado por Tencent Hunyuan MT2 — en FLORES-200 (XCOMET-XXL), el nivel 7B alcanza 97.9% de Google Gemini 3.1 ProAdemás, supera a Gemini en pruebas del mundo real y de lenguas minoritarias. La traducción se realiza íntegramente en su propia máquina. Hay dos niveles de modelo que se descargan según sea necesario: Rápido (~1 GB, en menos de un segundo en CPU o GPU) y de Calidad (~4,3 GB, en menos de un segundo en GPU). Además, varias adiciones muy esperadas.
Novedades en la v2.0.0:
EN: … || PL: …), o solo el primer objetivo.translate_text, translate_srt, list_compute_devices, set_compute_deviceEl número total de herramientas es ahora 19.El binario para Linux tiene 161 MB, mientras que el instalador para Windows tiene 118 MB. Los mismos precios de lanzamiento: 49 dólares para uso personal y 149 dólares para uso empresarial. Las licencias existentes se transfieren; simplemente Descargar v2.0.0 Y los modelos de traducción aparecerán en Ajustes → Modelos.
Descargar v2.0.0 →El pipeline de entrenamiento ya está listo. El ajuste fino de LoRA con su propia voz ahora se ejecuta de forma integral en su equipo; la aplicación elige automáticamente NVIDIA CUDA or CPULuego exporta automáticamente el modelo entrenado a formato GGUF una vez finalizado. Cada corrección que realice en la interfaz gráfica se guarda automáticamente en su conjunto de datos de entrenamiento local; la tarjeta de entrenamiento de la ventana principal muestra de un vistazo el número total de muestras y los minutos empleados.
Bonus: La precisión del teclado de voz mejoró en todos los idiomas gracias a una actualización de llama.cpp (versión b9222) que corrigió el problema de colapso de los límites de los segmentos en clips largos. Incluido gratis con cada licencia de pago.
Llegan dos nuevas herramientas MCP: start_transcription devuelve un ID de tarea al instante para que el agente pueda realizar otras tareas, y get_transcription_status Encuestas para finalizar. Un trabajo a la vez; el resultado se muestra al terminar. Los archivos largos ya no bloquean el bucle del agente.
Además, una serie de correcciones para la salida en formato SRT/VTT a nivel de palabras: ya no habrá espacios sueltos antes de las signos de puntuación, ni indicadores con punto solitario, ni cadenas de palabras clave o contexto que se filtren en el transcripción. Subtítulos más limpios, sin necesidad de limpieza manual.
Reescritura completa del motor. Brethof Voice Pro ahora utiliza Qwen3-ASR de punta a punta en llama.cpp con pesos cuantizados en GGUF a través de libmtmd. ONNX Runtime ya no existe. Como resultado: una instalación más pequeña (~83 MB de binario, en comparación con más de 400 MB), un inicio más rápido y sin tener que lidiar con versiones diferentes de CUDA/DirectML para cada plataforma.
Vulkan detecta automáticamente tu GPU —NVIDIA, AMD o Intel Arc— y recurre a la CPU en caso de que no haya GPU disponible. Este mismo motor impulsa ahora todas las funciones relacionadas: ASR, teclado de voz, el servidor MCP y, desde la versión 2.0.0, la traducción.
El servidor del Protocolo de Contexto del Modelo se ha conectado. Cualquier agente de IA compatible con MCP — Claude Desktop, Claude Code, Cursor, Cline — puede realizar la transcripción a través de stdio (sin puerto, sin firewall). La misma versión incluye seleccionador de dispositivos multi-GPU así que puedes elegir qué GPU Vulkan ejecutará la ASR, además de la opción adicional Alineador Forzado Complemento para marcas de tiempo a nivel de palabra en cada transcripción.
Solo está disponible en la versión de pago: el servidor MCP se niega a iniciarse sin una licencia personal o empresarial. brethof-voice --mcp Es la invocación de una sola línea.
La pregunta más frecuente antes del lanzamiento fue “¿cuándo macOS?”. Respuesta: está en desarrollo activo. Primero llegará la versión nativa para Apple Silicon con aceleración Metal, seguida de la para Intel. La fecha objetivo es el tercer trimestre de 2026; además, iniciaremos una beta cerrada en el segundo trimestre. Aquí se explica qué se está desarrollando y cómo inscribirse.
Leer entrada →El entrenamiento personal de voz está disponible en Voice Pro. Cada vez que corrige una palabra mal reconocida, el clip de audio junto con la corrección se guarda automáticamente en su conjunto de datos de entrenamiento local. Con un solo clic en la pestaña de Entrenamiento se puede ajustar un modelo LoRA según su acento; la aplicación elige automáticamente entre NVIDIA CUDA o CPU, y luego exporta el modelo entrenado a formato GGUF. Está incluido de forma gratuita con cada licencia de pago.
Leer entrada →Tras meses de trabajo de ingeniería, Voice Pro v1.0 ya está disponible hoy para Windows y Linux. Incluye 30 idiomas de transcripción más 22 dialectos chinos, transcripción completamente sin conexión, dictado con teclas de acceso rápido en cualquier lugar, y un precio único sin necesidad de suscripción. A continuación, se detallan las características incluidas en esta versión inicial y lo que estamos trabajando a continuación.
Leer entrada →El Programa Champions comienza hoy y durará hasta el 16 de mayo. Se ofrecen cincuenta licencias personales gratuitas por idioma admitido, lo que suma un total de 1,800 licencias, además de un descuento del 70% para todos aquellos participantes que no se clasifiquen entre los 50 primeros. Aquí le explicamos cómo funciona y por qué lo hacemos de esta manera.
Leer entrada →Escuchamos las primeras opiniones de redactores, consultores y traductores que consideraban que la antigua cláusula de “uso exclusivo personal” era confusa. La licencia Personal, por 49 dólares, ahora cubre explícitamente el uso comercial individual y como freelancer. La licencia empresarial (149 dólares por puesto) está destinada a equipos. A continuación se detallan los cambios y sus motivos.
Leer entrada →Brethof Voice Pro ahora transcribe y se presenta en 30 idiomas además de 22 dialectos chinos: árabe, cantonés, chino, checo, danés, holandés, inglés, filipino, finlandés, francés, alemán, griego, hindi, húngaro, indonesio, italiano, japonés, coreano, macedonio, malayo, persa, polaco, portugués, rumano, ruso, español, sueco, tailandés, turco, vietnamita. Aquí se explica cómo la aplicación elige el idioma adecuado y qué significa realmente “traducido por completo”.
Leer entrada →El backend de ASR de Brethof Voice Pro funciona con llama.cpp y modelos Qwen cuantizados en formato GGUF, en lugar de ONNX Runtime. Como resultado, se obtiene una instalación más pequeña (un archivo exe de 83 MB frente a más de 400 MB), un inicio más rápido, y ya no es necesario lidiar con los controladores CUDA/DirectML en cada plataforma. A continuación, se presenta la historia técnica detrás de este cambio.
Leer entrada →Todos los principales productos de dictado envían tu voz a través del servidor de terceros. Consideramos que ese es el valor predeterminado incorrecto. Tu voz es la información más personal que generas: notas médicas, borradores legales, diarios privados, secretos laborales. Por eso Voice Pro no cuenta con modo en la nube, ni “telemetría opcional”, ni requiere cuenta para realizar transcripciones.
Leer entrada →Cree una cuenta para recibir notificaciones cuando publiquemos nuevos artículos y lancemos nuevas versiones.
Crear cuentaSistema local de voz a texto que aprende tu voz. Licencia perpetua. Nuestro producto estrella.
PAID · modelo estrella
Memoria a largo plazo local para Claude Code: texto completo + vectores + gráficos, en SurrealDB. MIT.
GRATIS · código abierto
Modelos digitales listos para imprimir. Incluye formatos STL/3MF/OBJ. Acceso de por vida.
PAID · catálogo digital
Nuestros diseños impresos, enviados por toda Europa. Compre el producto físico, no el archivo.
PAID · objetos físicos
Servidor de IA Cyber-tiger. Explicación de la IA centrada en la privacidad, sin filtros corporativos.
CANAL · en vivo
Listas curadas en GitHub para IA, MCP, IA local, Linux para IA y más. Hechos, no actitudes.
GRATIS · seleccionado cuidadosamente
Guías detalladas para utilizar inteligencia artificial local en Linux, Windows y macOS. Configuraciones reales, sin contenido publicitario.
GRATIS · próximamente disponible
Gráficos de ComfyUI probados en producción: LTX chunked-loop, la pipeline Nova y más.
GRATIS · landing de flujos de trabajo
Curación negativa: prácticas y herramientas que desperdician tu tiempo, clasificadas. Se requieren comprobantes.
GRATIS · próximamente disponible
Quiénes somos, por qué construimos IA centrada en lo local y qué no haremos.