Atualizações — Brethof Voice Pro

Lançamento 21 de maio de 2026

v2.0.0 — Tradução off-line em 38 idiomas

O Brethof Voice Pro já não é apenas um sistema de conversão de voz em texto. A versão 2.0.0 foi lançada. tradução off-line desenvolvido pela Tencent Hunyuan MT2 — em FLORES-200 (XCOMET-XXL), o nível 7B é alcançado 97,9% do Google Gemini 3.1 ProAlém disso, supera o Gemini em testes do mundo real e de línguas minoritárias. A tradução é realizada inteiramente no seu dispositivo. Dois níveis de modelo, disponíveis para download conforme necessário: Rápido (~1 GB, em menos de um segundo em CPU ou GPU) e de Qualidade (~4,3 GB, em menos de um segundo em GPU). Além disso, várias adições muito esperadas.

O que há de novo na v2.0.0:

Transcrever + traduzir — O pop-up de Transcrição possui um menu suspenso “Traduzir para:”. O Qwen3-ASR faz a transcrição, enquanto o Hunyuan MT2 realiza a tradução; ambos exibem os resultados lado a lado. Funciona com arquivos, microfone e áudio do sistema (gravação de chamadas de reunião, abas do navegador, qualquer coisa que esteja sendo reproduzida nos seus alto-falantes).
Teclado de voz multilíngue — O novo chip de tradução na linha principal abre uma grade de idiomas com 3 colunas. Escolha um ou mais destinos, e o teclado digita a tradução. Modos de layout: um por linha, em linha.EN: … || PL: …), ou apenas o primeiro alvo.
Tradutor de legendas SRT / VTT — preserva os tempos e índices de indicação, suporta modo bilíngue (linha de origem + tradução por indicação). Disponibilizado por meio de MCP para automação de agentes de IA.
Múltiplas GPUs por motor — Em “Configurações → Modelos”, há um seletor de dispositivo independente para cada mecanismo. Execute a ASR no Vulkan 0 e a tradução no Vulkan 1, ou associe o Hunyuan MT2 7B à CPU em laptops com pouca VRAM.
O treinamento de voz personalizado é totalmente ao vivo — Ajuste fino de LoRA com sua própria voz, de ponta a ponta em seu computador. O cartão de treinamento na janela principal mostra, de imediato, o número total de amostras e minutos gravados; o botão “Iniciar treinamento” na aba Treinamento seleciona automaticamente NVIDIA CUDA ou CPU e, em seguida, exporta o modelo treinado para GGUF. Disponível gratuitamente com cada licença paga.
4 novas ferramentas MCP — translate_text, translate_srt, list_compute_devices, set_compute_deviceO número total de ferramentas agora é 19.
Uma linguagem honesta divide. — ASR: 30 idiomas selecionáveis + detecção automática + 22 dialetos chineses (52 no total). Tradução: 38 idiomas (33 principais + 5 minorias da região chinesa). 23 funcionam em ambas as direções.

O binário para Linux tem 161 MB, enquanto o instalador para Windows tem 118 MB. Os preços de lançamento são os mesmos: $49 para uso pessoal e $149 para uso empresarial. As licenças existentes continuam válidas — basta baixar v2.0.0 e os modelos de tradução aparecerão em Configurações → Modelos.

Baixar v2.0.0 →

Lançamento 20 de maio de 2026

v1.6.16 — O treinamento de voz pessoal está disponível agora

O pipeline de treinamento foi lançado. O ajuste fino do LoRA com sua própria voz agora é executado do início ao fim em seu dispositivo — o aplicativo seleciona automaticamente NVIDIA CUDA or CPUEm seguida, exporta automaticamente o modelo treinado para GGUF quando termina. Cada correção feita na interface gráfica é salva automaticamente no seu conjunto de dados de treinamento local; o painel de treinamento na janela principal mostra o número total de amostras e minutos de forma imediata.

Bônus: a precisão do teclado de voz melhorou em todos os idiomas graças a uma atualização do llama.cpp (versão b9222), que corrigiu o problema de colapso das fronteiras entre trechos em clipes longos. Disponível gratuitamente com cada licença paga.

Engenharia 15 de maio de 2026

v1.6.0 — Tarefas de transcrição assíncrona + aprimoramentos no SRT em nível de palavra

Dois novos ferramentas MCP foram lançados: start_transcription devolve um ID de tarefa instantaneamente para que o agente possa realizar outras tarefas, e get_transcription_status Pesquisas de conclusão. Um trabalho de cada vez, com o resultado exibido assim que concluído. Arquivos grandes não bloqueiam mais o ciclo do agente.

Além disso, há uma série de correções para a saída em formato SRT/VTT em nível de palavra: sem mais espaços remanescentes antes das pontuações, sem mais sinais de ponto isolado, sem mais strings de palavras-chave ou contexto vazando para o transcrita. Legendas mais limpas, sem necessidade de correção manual.

Engenharia 15 de maio de 2026

v1.5.0 — O ONNX foi removido; o tempo de execução agora é apenas com llama.cpp + libmtmd

Reescrita completa do motor. O Brethof Voice Pro agora executa o Qwen3-ASR de ponta a ponta em llama.cpp com pesos quantizados em GGUF por meio de libmtmdO ONNX Runtime foi removido. O resultado: instalação menor (~83 MB de binário, em comparação com mais de 400 MB), inicialização mais rápida e fim das dificuldades com os pacotes CUDA/DirectML específicos para cada plataforma.

O Vulkan identifica automaticamente sua GPU — NVIDIA, AMD ou Intel Arc —, recorrendo a um processador como alternativa quando nenhuma GPU está disponível. O mesmo mecanismo agora alimenta todos os recursos associados: ASR, teclado de voz, o servidor MCP e (agora na versão 2.0.0) a tradução.

Engenharia 14 de maio de 2026

v1.4.0 — Estreia do servidor MCP + seleção de dispositivos multi-GPU

O servidor do Model Context Protocol foi iniciado. Qualquer agente de IA compatível com MCP — Claude Desktop, Claude Code, Cursor, Cline — pode realizar a transcrição por meio de stdio (sem porta, sem firewall). A mesma versão também inclui selecionador de dispositivo multi-GPU assim você pode escolher qual GPU Vulkan será usada para a ASR, além da opção opcional Alinhador Forçado complemento para marcas de tempo em nível de palavra em cada transcrição.

Apenas na versão paga — o servidor MCP se recusa a ser iniciado sem uma licença Pessoal ou Empresarial. brethof-voice --mcp é a invocação de uma única linha.

Roadmap 16 de abril de 2026

Versão para macOS em desenvolvimento — primeiro com Apple Silicon

A pergunta mais frequente antes do lançamento foi “quando o macOS?”. Resposta: em desenvolvimento ativo. A versão nativa para Apple Silicon com aceleração Metal será lançada primeiro, seguida pela versão para Intel. O objetivo é o terceiro trimestre de 2026 — e estamos iniciando um beta fechado no segundo trimestre. Veja o que está sendo desenvolvido e como se inscrever.

Leia o post →

Produto 16 de abril de 2026

Treinamento de modelo personalizado — ajuste o Brethof Voice Pro de acordo com a sua própria voz

O treinamento de voz personalizado está disponível no Voice Pro. Toda vez que você corrige uma palavra mal reconhecida, o clipe de áudio + correção é salvo automaticamente em seu conjunto de dados de treinamento local. Um clique na aba de Treinamento permite ajustar um modelo LoRA de acordo com seu sotaque — o aplicativo escolhe automaticamente NVIDIA CUDA ou CPU e, em seguida, exporta o modelo treinado para GGUF. Disponível gratuitamente com qualquer licença paga.

Leia o post →

Anúncio 16 de abril de 2026

O Brethof Voice Pro já está disponível — conversão de voz em texto que permanece no seu dispositivo

Após meses de desenvolvimento, o Voice Pro v1.0 está disponível hoje para Windows e Linux. 30 idiomas de transcrição, além de 22 dialetos chineses, transcrição totalmente off-line, ditado por atalhos em qualquer lugar, e um preço único sem necessidade de assinatura. Veja o que foi incluído nesta versão inicial e no que estamos trabalhando agora.

Leia o post →

Campeões 16 de abril de 2026

1.800 licenças gratuitas disponíveis: o Champions Program está aberto

O Programa Champions começa hoje e vai até 16 de maio. Cinquenta licenças pessoais gratuitas por idioma suportado — no total, 1.800 —, além de desconto de 70% para todos os participantes que não ficarem entre os 50 primeiros. Veja como funciona e por que estamos fazendo isso dessa maneira.

Leia o post →

Licenciamento 16 de abril de 2026

A licença pessoal agora cobre negócios individuais e trabalho autônomo

Ouvimos os primeiros comentários de redatores, consultores e tradutores que consideraram a antiga cláusula “apenas para uso pessoal” confusa. A licença Personal, por 49 dólares, agora cobre explicitamente o uso comercial individual e como freelancer. A licença Business (149 dólares por licença) é destinada a equipes. Veja o que mudou e por quê.

Leia o post →

Produto 12 de abril de 2026

30 idiomas de transcrição, interface totalmente traduzida — sem aquela parede de texto resultante de tradução automática

O Brethof Voice Pro agora transcreve e se apresenta em 30 idiomas, além de 22 dialetos chineses: árabe, cantonês, chinês, tcheco, dinamarquês, holandês, inglês, filipino, finlandês, francês, alemão, grego, hindi, húngaro, indonésio, italiano, japonês, coreano, macedônio, malaio, persa, polonês, português, romeno, russo, espanhol, sueco, tailandês, turco e vietnamita. Veja como o aplicativo escolhe o idioma correto e o que realmente significa “tradução completa”.

Leia o post →

Engenharia 8 de abril de 2026

Por que mudamos de ONNX para GGUF — mais rápido, menor, mais fácil de distribuir

O backend de ASR do Brethof Voice Pro roda em llama.cpp com modelos Qwen quantificados em GGUF, em vez do ONNX Runtime. O resultado é um instalador menor (83 MB de exe contra mais de 400 MB), inicialização mais rápida e sem mais problemas com pacotes CUDA/DirectML em cada plataforma. Eis a história técnica por trás dessa mudança.

Leia o post →

Princípios 4 de abril de 2026

Por que o Brethof Voice Pro funciona 100% off-line — e por que isso não é apenas um recurso

Todo produto de ditado importante envia sua voz por meio do servidor de terceiros. Acreditamos que esse seja o padrão errado. Sua voz é o dado mais pessoal que você gera — notas médicas, rascunhos legais, diários privados, segredos profissionais. É por isso que o Voice Pro não possui modo em nuvem, nenhuma “telemetria opcional” e não exige cadastro para fazer transcrições.

Leia o post →

Receba atualizações em sua caixa de entrada

Crie uma conta para ser notificado quando publicarmos novos posts e enviarmos novas versões.

Criar Conta

Produto Atualizações

v2.0.0 — Tradução off-line em 38 idiomas

v1.6.16 — O treinamento de voz pessoal está disponível agora

v1.6.0 — Tarefas de transcrição assíncrona + aprimoramentos no SRT em nível de palavra

v1.5.0 — O ONNX foi removido; o tempo de execução agora é apenas com llama.cpp + libmtmd

v1.4.0 — Estreia do servidor MCP + seleção de dispositivos multi-GPU

Versão para macOS em desenvolvimento — primeiro com Apple Silicon

Treinamento de modelo personalizado — ajuste o Brethof Voice Pro de acordo com a sua própria voz

O Brethof Voice Pro já está disponível — conversão de voz em texto que permanece no seu dispositivo

1.800 licenças gratuitas disponíveis: o Champions Program está aberto

A licença pessoal agora cobre negócios individuais e trabalho autônomo

30 idiomas de transcrição, interface totalmente traduzida — sem aquela parede de texto resultante de tradução automática

Por que mudamos de ONNX para GGUF — mais rápido, menor, mais fácil de distribuir

Por que o Brethof Voice Pro funciona 100% off-line — e por que isso não é apenas um recurso

Receba atualizações em sua caixa de entrada

Tudo o que construímos

Brethof Voice Pro

Brethof-Mind

Modelos 3D

Impressão 3D

Nova

Listas incríveis

Guias

Fluxos de trabalho do ComfyUI

Lista de classificação anti-dev

Sobre o Brethof AI