Brethof Voice Pro 팀의 출시 소식, Champions Program 관련 뉴스, 새로운 기능들, 그리고 개발 과정에 대한 정보입니다.
Brethof Voice Pro는 더 이상 단순한 음성-to-텍스트 변환 도구가 아닙니다. v2.0.0이 출시되었습니다. 오프라인 번역 Tencent의 기술로 구동됨 Hunyuan MT2 — FLORES-200 (XCOMET-XXL)에서 7B 등급은 다음 단계에 도달합니다. Google Gemini 3.1 Pro의 97.9%또한 실제 환경 및 소수 언어 테스트에서 Gemini를 능가합니다. 번역은 전적으로 사용자의 컴퓨터에서 이루어집니다. 요청 시 다운로드할 수 있는 두 가지 모델 등급이 있습니다: 빠른 버전(~1GB, CPU나 GPU를 사용할 경우 밀리초 내에 완료)과 고품질 버전(~4.3GB, GPU를 사용할 경우 밀리초 내에 완료). 그 외에도 오랫동안 기다려온 여러 추가 기능들도 포함되어 있습니다.
v2.0.0의 새로운 기능은 무엇인가요?
EN: … || PL: …), 또는 첫 번째 대상만.translate_text, translate_srt, list_compute_devices, set_compute_device현재 총 도구 수는 19개입니다.Linux 바이너리의 크기는 161 MB이며, Windows 설치 프로그램의 크기는 118 MB입니다. 가격은 동일하게 개인용은 49달러, 비즈니스용은 149달러입니다. 기존 라이선스는 그대로 유지됩니다 — 단지 v2.0.0 버전 다운로드 그리고 번역 모델들은 설정 → 모델들 메뉴에 표시됩니다.
v2.0.0 다운로드 →훈련 파이프라인이 배포되었습니다. 이제 자신의 목소리를 활용한 LoRA 미세조정이 사용자의 컴퓨터에서 엔드투엔드로 실행됩니다. 앱이 자동으로 적절한 방법을 선택합니다. NVIDIA CUDA or CPU그런 다음 훈련이 완료되면 학습된 모델을 GGUF 형식으로 자동으로 내보냅니다. GUI에서 수행하는 모든 수정 사항은 로컬 훈련 데이터셋에 자동으로 저장되며, 메인 창의 훈련 카드를 통해 총 샘플 수와 소요 시간을 한눈에 확인할 수 있습니다.
보너스: 긴 영상 클립의 블록 경계 문제를 수정한 llama.cpp 업그레이드(빌드 b9222) 덕분에 모든 언어에서의 보이스 키보드 정확도가 향상되었습니다. 모든 유료 라이선스에 포함되어 제공됩니다.
두 가지 새로운 MCP 도구가 출시되었습니다: start_transcription 에이전트가 다른 작업을 수행할 수 있도록 즉시 작업 ID를 반환하며, get_transcription_status 완료 여부를 확인합니다. 한 번에 하나의 작업만 처리하며, 완료되면 결과가 즉시 표시됩니다. 긴 파일도 더 이상 에이전트 루프를 방해하지 않습니다.
단어 단위의 SRT/VTT 출력 관련 여러 수정 사항도 포함되어 있습니다. 구두점 앞에 남는 불필요한 공백이 사라지고, 단독 점 기호도 더 이상 나타나지 않으며, 특정 단어나 문맥 문자열이 자막에 유출되는 현상도 없어집니다. 더 깔끔해진 자막으로, 수동으로 정리할 필요가 없습니다.
엔진을 완전히 재작성했습니다. Brethof Voice Pro는 이제 end-to-end 방식으로 Qwen3-ASR을 사용하여 작동합니다. llama.cpp GGUF-양자화된 가중치를 통해 libmtmdONNX Runtime이 사라졌습니다. 그 결과, 설치 크기가 줄어들었으며(400MB 이상에서 약 83MB의 바이너리로 감소), 콜드 스타트 속도가 빨라졌으며, 각 플랫폼별로 제공되는 CUDA/DirectML 버전들로 인한 문제도 더 이상 발생하지 않습니다.
Vulkan은 사용자의 GPU를 자동으로 인식합니다 — NVIDIA, AMD, Intel Arc 등이며, GPU가 없을 경우에는 CPU를 사용합니다. 이와 동일한 엔진이 ASR, 음성 키보드, MCP 서버, 그리고 (현재 v2.0.0 버전에서 지원되는) 번역 기능과 같은 모든 관련 기능들을 구동합니다.
Model Context Protocol 서버가 연결됩니다. 모든 MCP와 호환되는 AI 에이전트 — Claude Desktop, Claude Code, 커서, 클라인 — stdio를 통해 전사 기능을 구동할 수 있습니다(포트나 방화벽이 필요 없음). 동일한 버전에는 다음도 포함되어 있습니다. 멀티 GPU 장치 선택기 따라서 어떤 Vulkan GPU가 ASR을 처리할지, 그리고 선택 사항들도 골라 사용할 수 있습니다. 강제 정렬기 모든 음성 전사 내에 단어 단위의 타임스탬프를 추가하는 애드온.
유료 플랜 전용 — 개인용 또는 비즈니스 라이선스가 없으면 MCP 서버가 시작되지 않습니다. brethof-voice --mcp 이것이 바로 한 줄로 실행하는 방식입니다.
출시 전에 가장 많이 물어본 질문은 “macOS는 언제 나오나요?”였습니다. 답변: 현재 활발히 개발 중입니다. Metal 가속 기능을 갖춘 Apple Silicon 전용 버전이 먼저 출시되며, 그 다음에 Intel 버전이 나옵니다. 출시 목표는 2026년 3분기이며, 2분기에는 클로즈드 베타 테스트를 시작할 예정입니다. 현재 개발 중인 내용과 참가 신청 방법은 다음과 같습니다.
글 읽기 →Voice Pro에서는 개인 맞춤형 음성 훈련 기능이 제공됩니다. 잘못 인식된 단어를 수정할 때마다 해당 오디오 클립과 수정 내용이 자동으로 사용자의 로컬 훈련 데이터셋에 저장됩니다. ‘훈련’ 탭에서 한 번만 클릭하면 사용자의 억양에 맞게 LoRA 모델을 세밀하게 조정할 수 있으며, 앱은 자동으로 NVIDIA CUDA나 CPU를 선택한 뒤 훈련된 모델을 GGUF 형식으로 내보냅니다. 모든 유료 라이선스에 포함된 무료 기능입니다.
글 읽기 →수개월에 걸친 개발 끝에, Voice Pro v1.0이 오늘 Windows와 Linux용으로 출시됩니다. 30가지 음성 인식 언어와 22가지 중국어 방언을 지원하며, 완전한 오프라인 음성 인식 기능과 어디서나 사용 가능한 단축키 기반 듣기 입력 기능이 제공됩니다. 또한 구독료 없이 한 번만 결제하면 됩니다. 이번 출시 버전에 포함된 기능들과 향후 개발 계획은 다음과 같습니다.
글 읽기 →Champions Program은 오늘 시작하여 5월 16일까지 진행됩니다. 지원되는 각 언어당 50개의 무료 Personal 라이선스가 제공되어 총 1,800개가 지급되며, 상위 50위에 들지 못한 참가자들에게는 70%의 할인이 적용됩니다. 여기에 해당 프로그램의 운영 방식과 이러한 방식을 선택한 이유가 설명되어 있습니다.
글 읽기 →이전의 “개인용으로만 사용 가능”이라는 문구가 혼란스럽다고 생각한 작가, 컨설턴트, 번역가들의 초기 피드백을 들어보았습니다. 49달러에 제공되는 개인 라이선스는 이제 단독 사용이나 프리랜서의 상업적 용도도 명시적으로 포함합니다. 팀을 위한 비즈니스 라이선스의 가격은 149달러/사용자입니다. 아래는 변경된 내용과 그 이유입니다.
글 읽기 →Brethof Voice Pro는 현재 아랍어, 광동어, 중국어, 체코어, 덴마크어, 네덜란드어, 영어, 필리핀어, 핀란드어, 프랑스어, 독일어, 그리스어, 힌디어, 헝가리어, 인도네시아어, 이탈리아어, 일본어, 한국어, 마케도니아어, 말레이어, 페르시아어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 스페인어, 스웨덴어, 태국어, 터키어, 베트남어 등 30개 언어와 22개 중국 방언으로 텍스트를 전사하고 표시할 수 있습니다. 여기에 앱이 적절한 언어를 선택하는 방법과 “완전 번역”이 실제로 무엇을 의미하는지가 설명되어 있습니다.
글 읽기 →Brethof Voice Pro의 ASR 백엔드는 ONNX Runtime 대신 GGUF로 양자화된 Qwen 모델을 사용한 llama.cpp 위에서 작동합니다. 그 결과, 설치 파일의 크기가 줄어들고(83 MB의 exe 파일에 비해 400MB 이상), 콜드 스타트 속도도 빨라지며, 각 플랫폼에서 CUDA/DirectML 관련 문제를 겪지 않게 됩니다. 이러한 전환 배경에 있는 기술적 이유는 다음과 같습니다.
글 읽기 →모든 주요 듣기 입력 제품들은 사용자의 음성을 타인의 서버를 통해 전송합니다. 우리는 이것이 잘못된 기본 설정이라고 생각합니다. 사용자의 음성은 의료 기록, 법적 문서, 개인 일기, 업무 기밀 등 사용자가 생성하는 가장 개인적인 데이터입니다. 바로 이러한 이유로 Voice Pro에는 클라우드 모드도, “선택적 텔레메트리” 기능도, 녹음을 위한 계정 요구 사항도 없는 것입니다.
글 읽기 →사용자의 음성을 학습하는 로컬 음성 인식 기능. 영구 라이선스. 당사의 플래그십 제품입니다.
유료 · 플래그십
Claude Code를 위한 로컬 장기 메모리 — 전체 텍스트 + 벡터 + 그래프, SurrealDB 기반. MIT.
무료 · 오픈 소스
인쇄 준비가 완료된 디지털 모델. STL/3MF/OBJ 포함. 평생 접근 가능.
유료 · 디지털 카탈로그
저희의 인쇄된 디자인 제품들은 유럽 전역으로 배송됩니다. 파일이 아닌 실제 제품을 구매해 주십시오.
유료 · 실물 객체
사이버-타이거 AI 호스트. 기업의 필터 없이 개인정보 보호를 최우선으로 하는 AI를 설명합니다.
채널 · 라이브
AI, MCP, 로컬 AI, AI용 Linux 등을 위한 엄선된 GitHub 목록. 분위기가 아닌 실제 데이터입니다.
무료 · 엄선된 콘텐츠
Linux, Windows, macOS에서 로컬 AI를 사용하는 방법에 대한 상세 가이드. 마케팅용이 아닌 실제 설정 방법들입니다.
무료 · 곧 출시 예정
실제 생산 환경에서 검증된 ComfyUI 그래프 — LTX 청크드-루프, Nova 파이프라인 등.
무료 · 워크플로우 랜딩 페이지
부정적 큐레이션: 시간을 낭비하는 관행과 도구들, 순위별로 정리됨. 영수증 제출 필요.
무료 · 곧 출시 예정
우리는 누구이며, 왜 로컬 중심 AI를 구축하는지, 그리고 우리가 하지 않을 일에 대해