Brethof Voice Proチームによるリリース告知、Champions Programのニュース、新機能の紹介、そして開発の裏側をご紹介します。
Brethof Voice Proはもはや単なる音声入力ソフトではありません。v2.0.0がリリースされました。 オフライン翻訳 テンセントによって提供されています。 Hunyuan MT2 — FLORES-200(XCOMET-XXL)において、7Bレベルはここまで到達している Google Gemini 3.1 Proの97.9%また、実世界のテストやマイノリティ言語のテストにおいてGeminiを上回ります。翻訳処理はすべてユーザーのコンピュータで行われます。オンデマンドでダウンロード可能な2つのモデルタイプがあり、Fast版(約1GB、CPUまたはGPUを使用して数秒以内)とQuality版(約4.3GB、GPUを使用して数秒以内)です。さらに、長らく待たれていたいくつかの新機能も追加されています。
v2.0.0の新機能は何ですか?
EN: … || PL: …)、または最初のターゲットのみ。translate_text, translate_srt, list_compute_devices, set_compute_device現在、ツールの総数は19です。Linuxバイナリは161MB、Windowsインストーラーは118MBです。価格はどちらも同じで、個人向けが49ドル、ビジネス向けが149ドルです。既存のライセンスはそのまま有効です——ただし v2.0.0をダウンロードする これらの翻訳モデルは、「設定」→「モデル」に表示されます。
v2.0.0をダウンロードする →トレーニングパイプラインがリリースされました。ご自身の声を使ったLoRA微調整が、お使いのマシン上でエンドツーエンドで実行可能になりました。アプリが自動的に適切な設定を選択します。 NVIDIA CUDA or CPUそして処理が完了すると、訓練済みモデルを自動的にGGUF形式にエクスポートします。GUIで行うすべての修正内容は自動的にローカルの訓練データセットに保存され、メインウィンドウの訓練カードには合計サンプル数と経過時間が一目で表示されます。
ボーナス:llama.cppのバージョンアップ(ビルドb9222)により、長いクリップでのチャンク境界の問題が修正され、すべての言語におけるVoice-Keyboardの精度が向上しました。有料ライセンスをご購入いただくと無料で利用可能です。
新しい2つのMCPツールが登場しました: start_transcription エージェントが他の作業を行えるよう、即座にジョブIDを返す。 get_transcription_status 処理完了までの進捗を確認します。一度に1つのタスクを処理し、完了時に結果を即座に表示します。長いファイルでももはやエージェントのループの進行を妨げません。
さらに、単語レベルのSRT/VTT出力に関する一連の修正も加えられている。句読点の前に余分なスペースが残らず、単独のドット記号もなくなり、ホットワードや文脈文字列が字幕に混入することもない。よりクリーンな字幕で、手動での修正は不要だ。
エンジンを完全に書き直しました。Brethof Voice Proは現在、Qwen3-ASRをエンドツーエンドで利用して動作します。 llama.cpp GGUF量子化済みウェイトを使用して libmtmdONNX Runtimeはなくなりました。その結果、インストールサイズが小さくなり(400MB以上から約83MBのバイナリに)、クールスタートの速度も向上し、プラットフォームごとに異なるCUDA/DirectMLのパッケージを扱う必要もなくなりました。
Vulkanは自動的にユーザーのGPU——NVIDIA、AMD、Intel Arc——を検出し、GPUがない場合はCPUを代替として使用します。このエンジンが現在、ASR、ボイスキーボード、MCPサーバー、そして(v2.0.0では)翻訳といったあらゆる機能の背骨となっています。
Model Context Protocolサーバーが起動しました。MCPに対応するあらゆるAIエージェント—— Claude Desktop, Claude Code, カーソル, クライン — stdio経由でテキスト変換を実行可能(ポートもファイアウォールも不要)。同じリリースには マルチGPUデバイスセレクタ そうすれば、どのVulkan GPUでASRが動作するかを選択でき、さらにオプションも利用可能です。 強制整列ツール すべての転写に単語レベルのタイムスタンプを追加するアドオン。
有料プランのみ — 個人ライセンスまたはビジネスライセンスがなければMCPサーバーは起動しません。 brethof-voice --mcp これが一行での呼び出しです。
発売前に最も多く寄せられた質問は「macOSはいつ登場するのか?」でした。回答は、現在開発中です。まずMetalアクセラレーションを備えたApple Siliconネイティブバージョンがリリースされ、その後Intel版が続きます。リリース時期は2026年第3四半期を目指しており、第2四半期にはクローズドベータテストを開始します。現在開発中の内容と申し込み方法はこちらです。
記事を読む →Voice Proではパーソナルな声のトレーニングが可能です。誤って認識された単語を訂正するたびに、その音声クリップと訂正内容が自動的にローカルのトレーニングデータセットに保存されます。「トレーニング」タブでワンクリックするだけで、あなたのアクセントに合わせてLoRAを微調整できます。アプリは自動的にNVIDIA CUDAまたはCPUを選択し、トレーニング済みモデルをGGUF形式に自動エクスポートします。有料ライセンスを購入すれば無料で利用できます。
記事を読む →数ヶ月にわたる開発の末、Voice Pro v1.0が今日、WindowsおよびLinux向けにリリースされました。30言語のテキスト変換機能と22の中国語方言への対応、完全なオフラインでのテキスト変換、どこでもホットキーを使ってのディクテーション、そしてサブスクリプション不要の一回限りの料金体系が特徴です。ここでは、このバージョンに盛り込まれた機能と、今後取り組む予定の機能について説明します。
記事を読む →Champions Programは本日開始され、5月16日まで続きます。対応している各言語ごとに50個の無料Personalライセンスが提供され、合計で1,800個となります。さらに、トップ50に入らなかった出場者には70%の割引が適用されます。ここでその運用方法と、なぜこのような方式を採用しているのかを説明します。
記事を読む →「個人使用のみ」という従来の表現が分かりにくいと感じたライター、コンサルタント、翻訳者からの初期フィードバックを聞きました。49ドルで提供されるパーソナルライセンスでは、今後はソロやフリーランスによる商用利用も明確に許可されます。ビジネスライセンス(1台あたり149ドル)はチーム向けです。ここに変更点とその理由を示します。
記事を読む →Brethof Voice Proは、アラビア語、広東語、中国語、チェコ語、デンマーク語、オランダ語、英語、フィリピン語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ヒンディー語、ハンガリー語、インドネシア語、イタリア語、日本語、韓国語、マケドニア語、マレー語、ペルシャ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スペイン語、スウェーデン語、タイ語、トルコ語、ベトナム語といった30か国の言語に加え、22の中国語方言にも対応してテキストを翻訳・表示します。こちらでは、このアプリが適切な翻訳を選択する仕組みや、「完全翻訳」とは何を意味するのかを説明します。
記事を読む →Brethof Voice ProのASRバックエンドは、ONNX Runtimeの代わりにllama.cpp上でGGUF量子化されたQwenモデルを使用して動作します。その結果、インストールサイズが小さくなり(83 MBのexe対400MB以上)、クールスタートの速度も向上し、さらに各プラットフォームでCUDAやDirectMLのライブラリとの互換性問題に悩まされることもありません。こちらがこの切り替え背後にあるエンジニアリング上の経緯です。
記事を読む →ほとんどの音声入力ソフトウェアは、ユーザーの声を第三者のサーバーを経由して送信します。私たちはこれが適切なデフォルト設定ではないと考えています。ユーザーの声というのは、医療記録、法的文書、プライベートな日記、仕事上の秘密といった、最も個人的なデータです。だからこそ、Voice Proにはクラウドモードも「オプションのテレメトリ機能」もなく、音声を転写するためのアカウント登録も不要なのです。
記事を読む →あなたの声を学習するローカル音声認識。永久ライセンス。当社のフラッグシップ製品。
有料版・フラッグシップ
Claude Code用のローカル長期記憶——全文検索、ベクター検索、グラフ構造に対応。SurrealDB上。MITライセンス。
無料・オープンソース
印刷可能なデジタルモデル。STL/3MF/OBJ形式が含まれています。生涯アクセス権付き。
有料・デジタルカタログ
当社のプリントデザインはヨーロッパ全土に配送されています。ファイルではなく実物をご購入ください。
有料 · 実物
サイバータイガーAIホスト。企業の都合に左右されない、プライバシーを最優先としたAIの仕組みを解説します。
チャンネル · ライブ
AI、MCP、ローカルAI、Linux for AIなどに関する厳選されたGitHubリスト。雰囲気ではなく、確かな証拠を。
無料・厳選
Linux、Windows、macOSでのローカルAIに関する詳細なハウツーガイド。マーケティングではなく、実際の設定内容です。
無料 · 近日公開予定
実運用でテスト済みのComfyUIグラフ——LTXチャンクループ、Novaパイプラインなど。
無料 · ワークフローランディング
ネガティブキュレーション:時間を無駄にする手法とツールのランキング。証拠必須。
無料 · 近日公開予定
私たちが誰で、なぜローカルファーストのAIを構築するのか、そして何をしないのか。