Anúncios de lançamento, notícias sobre o Champions Program, novos recursos e informações sobre o trabalho técnico por trás dos bastidores da equipe do Brethof Voice Pro.
O Brethof Voice Pro já não é apenas um sistema de conversão de voz em texto. A versão 2.0.0 foi lançada. tradução off-line desenvolvido pela Tencent Hunyuan MT2 — em FLORES-200 (XCOMET-XXL), o nível 7B é alcançado 97,9% do Google Gemini 3.1 ProAlém disso, supera o Gemini em testes do mundo real e de línguas minoritárias. A tradução é realizada inteiramente no seu dispositivo. Dois níveis de modelo, disponíveis para download conforme necessário: Rápido (~1 GB, em menos de um segundo em CPU ou GPU) e de Qualidade (~4,3 GB, em menos de um segundo em GPU). Além disso, várias adições muito esperadas.
O que há de novo na v2.0.0:
EN: … || PL: …), ou apenas o primeiro alvo.translate_text, translate_srt, list_compute_devices, set_compute_deviceO número total de ferramentas agora é 19.O binário para Linux tem 161 MB, enquanto o instalador para Windows tem 118 MB. Os preços de lançamento são os mesmos: $49 para uso pessoal e $149 para uso empresarial. As licenças existentes continuam válidas — basta baixar v2.0.0 e os modelos de tradução aparecerão em Configurações → Modelos.
Baixar v2.0.0 →O pipeline de treinamento foi lançado. O ajuste fino do LoRA com sua própria voz agora é executado do início ao fim em seu dispositivo — o aplicativo seleciona automaticamente NVIDIA CUDA or CPUEm seguida, exporta automaticamente o modelo treinado para GGUF quando termina. Cada correção feita na interface gráfica é salva automaticamente no seu conjunto de dados de treinamento local; o painel de treinamento na janela principal mostra o número total de amostras e minutos de forma imediata.
Bônus: a precisão do teclado de voz melhorou em todos os idiomas graças a uma atualização do llama.cpp (versão b9222), que corrigiu o problema de colapso das fronteiras entre trechos em clipes longos. Disponível gratuitamente com cada licença paga.
Dois novos ferramentas MCP foram lançados: start_transcription devolve um ID de tarefa instantaneamente para que o agente possa realizar outras tarefas, e get_transcription_status Pesquisas de conclusão. Um trabalho de cada vez, com o resultado exibido assim que concluído. Arquivos grandes não bloqueiam mais o ciclo do agente.
Além disso, há uma série de correções para a saída em formato SRT/VTT em nível de palavra: sem mais espaços remanescentes antes das pontuações, sem mais sinais de ponto isolado, sem mais strings de palavras-chave ou contexto vazando para o transcrita. Legendas mais limpas, sem necessidade de correção manual.
Reescrita completa do motor. O Brethof Voice Pro agora executa o Qwen3-ASR de ponta a ponta em llama.cpp com pesos quantizados em GGUF por meio de libmtmdO ONNX Runtime foi removido. O resultado: instalação menor (~83 MB de binário, em comparação com mais de 400 MB), inicialização mais rápida e fim das dificuldades com os pacotes CUDA/DirectML específicos para cada plataforma.
O Vulkan identifica automaticamente sua GPU — NVIDIA, AMD ou Intel Arc —, recorrendo a um processador como alternativa quando nenhuma GPU está disponível. O mesmo mecanismo agora alimenta todos os recursos associados: ASR, teclado de voz, o servidor MCP e (agora na versão 2.0.0) a tradução.
O servidor do Model Context Protocol foi iniciado. Qualquer agente de IA compatível com MCP — Claude Desktop, Claude Code, Cursor, Cline — pode realizar a transcrição por meio de stdio (sem porta, sem firewall). A mesma versão também inclui selecionador de dispositivo multi-GPU assim você pode escolher qual GPU Vulkan será usada para a ASR, além da opção opcional Alinhador Forçado complemento para marcas de tempo em nível de palavra em cada transcrição.
Apenas na versão paga — o servidor MCP se recusa a ser iniciado sem uma licença Pessoal ou Empresarial. brethof-voice --mcp é a invocação de uma única linha.
A pergunta mais frequente antes do lançamento foi “quando o macOS?”. Resposta: em desenvolvimento ativo. A versão nativa para Apple Silicon com aceleração Metal será lançada primeiro, seguida pela versão para Intel. O objetivo é o terceiro trimestre de 2026 — e estamos iniciando um beta fechado no segundo trimestre. Veja o que está sendo desenvolvido e como se inscrever.
Leia o post →O treinamento de voz personalizado está disponível no Voice Pro. Toda vez que você corrige uma palavra mal reconhecida, o clipe de áudio + correção é salvo automaticamente em seu conjunto de dados de treinamento local. Um clique na aba de Treinamento permite ajustar um modelo LoRA de acordo com seu sotaque — o aplicativo escolhe automaticamente NVIDIA CUDA ou CPU e, em seguida, exporta o modelo treinado para GGUF. Disponível gratuitamente com qualquer licença paga.
Leia o post →Após meses de desenvolvimento, o Voice Pro v1.0 está disponível hoje para Windows e Linux. 30 idiomas de transcrição, além de 22 dialetos chineses, transcrição totalmente off-line, ditado por atalhos em qualquer lugar, e um preço único sem necessidade de assinatura. Veja o que foi incluído nesta versão inicial e no que estamos trabalhando agora.
Leia o post →O Programa Champions começa hoje e vai até 16 de maio. Cinquenta licenças pessoais gratuitas por idioma suportado — no total, 1.800 —, além de desconto de 70% para todos os participantes que não ficarem entre os 50 primeiros. Veja como funciona e por que estamos fazendo isso dessa maneira.
Leia o post →Ouvimos os primeiros comentários de redatores, consultores e tradutores que consideraram a antiga cláusula “apenas para uso pessoal” confusa. A licença Personal, por 49 dólares, agora cobre explicitamente o uso comercial individual e como freelancer. A licença Business (149 dólares por licença) é destinada a equipes. Veja o que mudou e por quê.
Leia o post →O Brethof Voice Pro agora transcreve e se apresenta em 30 idiomas, além de 22 dialetos chineses: árabe, cantonês, chinês, tcheco, dinamarquês, holandês, inglês, filipino, finlandês, francês, alemão, grego, hindi, húngaro, indonésio, italiano, japonês, coreano, macedônio, malaio, persa, polonês, português, romeno, russo, espanhol, sueco, tailandês, turco e vietnamita. Veja como o aplicativo escolhe o idioma correto e o que realmente significa “tradução completa”.
Leia o post →O backend de ASR do Brethof Voice Pro roda em llama.cpp com modelos Qwen quantificados em GGUF, em vez do ONNX Runtime. O resultado é um instalador menor (83 MB de exe contra mais de 400 MB), inicialização mais rápida e sem mais problemas com pacotes CUDA/DirectML em cada plataforma. Eis a história técnica por trás dessa mudança.
Leia o post →Todo produto de ditado importante envia sua voz por meio do servidor de terceiros. Acreditamos que esse seja o padrão errado. Sua voz é o dado mais pessoal que você gera — notas médicas, rascunhos legais, diários privados, segredos profissionais. É por isso que o Voice Pro não possui modo em nuvem, nenhuma “telemetria opcional” e não exige cadastro para fazer transcrições.
Leia o post →Crie uma conta para ser notificado quando publicarmos novos posts e enviarmos novas versões.
Criar ContaReconhecimento de fala local que aprende sua voz. Licença perpétua. Nosso produto principal.
PAGO · flagship
Memória de longo prazo local para o Claude Code — texto completo + vetores + grafos, em SurrealDB. MIT.
GRÁTIS · código aberto
Modelos digitais prontos para impressão. Inclui formatos STL/3MF/OBJ. Acesso vitalício.
PAGO · catálogo digital
Nossos designs impressos, enviados por toda a Europa. Compre o produto, não o arquivo.
PAGO · objetos físicos
Cyber-tiger: anfitrião de IA. IA explicada com foco na privacidade, sem o filtro corporativo.
CANAL · ao vivo
Listas selecionadas no GitHub para IA, MCP, IA local, Linux para IA e muito mais. Comprovantes, não impressões subjetivas.
GRÁTIS · selecionado com cuidado
Guias detalhados sobre como utilizar IA local em Linux, Windows e macOS. Configurações reais, sem marketing.
GRÁTIS · em breve
Gráficos do ComfyUI testados em produção — LTX chunked-loop, o pipeline Nova e muito mais.
GRÁTIS · página de fluxos de trabalho
Curadoria negativa: práticas e ferramentas que desperdiçam seu tempo, classificadas. Comprovantes necessários.
GRÁTIS · em breve
Quem somos, por que desenvolvemos IA com foco local e o que não faremos.