製品 アップデート

Brethof Voice Proチームによるリリース告知、Champions Programのニュース、新機能の紹介、そして開発の裏側をご紹介します。

リリース 2026年5月21日

v2.0.0 — 38言語に対応するオフライン翻訳

Brethof Voice Proはもはや単なる音声入力ソフトではありません。v2.0.0がリリースされました。 オフライン翻訳 テンセントによって提供されています。 Hunyuan MT2 — FLORES-200(XCOMET-XXL)において、7Bレベルはここまで到達している Google Gemini 3.1 Proの97.9%また、実世界のテストやマイノリティ言語のテストにおいてGeminiを上回ります。翻訳処理はすべてユーザーのコンピュータで行われます。オンデマンドでダウンロード可能な2つのモデルタイプがあり、Fast版(約1GB、CPUまたはGPUを使用して数秒以内)とQuality版(約4.3GB、GPUを使用して数秒以内)です。さらに、長らく待たれていたいくつかの新機能も追加されています。

v2.0.0の新機能は何ですか?

  • 音声入力+翻訳 — Transcribeポップアップには「翻訳先:」というドロップダウンがあります。ASRが音声をテキストに変換し、MTが翻訳を行い、両方の結果が並んで表示されます。ファイル、マイク、システムオーディオ(会議通話のループバック録音、ブラウザタブ、スピーカーから出力されるあらゆる音声)に対応しています。
  • 多言語音声キーボード — メイン行にある新しい翻訳チップにより、3列の言語グリッドが表示されます。1つ以上の対象を選択すると、キーボードが翻訳文を入力します。レイアウトモード:1行ずつ、インラインEN: … || PL: …)、または最初のターゲットのみ。
  • SRT / VTT字幕翻訳ツール — タイミングとキューインデックスを保持し、バイリンガルモード(各キューに対して原文行と翻訳文)に対応。AIエージェントの自動化のためにMCPを通じて利用可能。
  • エンジンごとのマルチGPU — 設定 → モデルでは、各エンジンごとに独立したデバイス選択機能があります。Vulkan 0でASRを実行し、Vulkan 1で翻訳を行うか、VRAM容量が限られたノートパソコンではHunyuan MT2 7BをCPUに割り当てることができます。
  • パーソナルな声のトレーニングは完全にライブで行われます。 — 自分の声を使ったLoRA微調整が、自分のマシン上でエンドツーエンドで行えます。メインウィンドウのトレーニングカードには、取得されたサンプル数や時間が一目で表示されます。トレーニングタブの「トレーニングを開始」ボタンを押すと、NVIDIA CUDAまたはCPUが自動的に選択され、トレーニング済みモデルがGGUF形式で自動的にエクスポートされます。有料ライセンスを購入すれば無料で利用可能です。
  • 新しいMCPツール4種translate_text, translate_srt, list_compute_devices, set_compute_device現在、ツールの総数は19です。
  • 正直な言葉は分断する — ASR:30言語の選択可能+自動検出+22の中国語方言(合計52言語)。翻訳:38言語(主要33言語+中国地域の少数民族5言語)。23言語は双方向で対応。

Linuxバイナリは161MB、Windowsインストーラーは118MBです。価格はどちらも同じで、個人向けが49ドル、ビジネス向けが149ドルです。既存のライセンスはそのまま有効です——ただし v2.0.0をダウンロードする これらの翻訳モデルは、「設定」→「モデル」に表示されます。

v2.0.0をダウンロードする →
リリース 2026年5月20日

v1.6.16 — パーソナルボイストレーニングが利用可能に

トレーニングパイプラインがリリースされました。ご自身の声を使ったLoRA微調整が、お使いのマシン上でエンドツーエンドで実行可能になりました。アプリが自動的に適切な設定を選択します。 NVIDIA CUDA or CPUそして処理が完了すると、訓練済みモデルを自動的にGGUF形式にエクスポートします。GUIで行うすべての修正内容は自動的にローカルの訓練データセットに保存され、メインウィンドウの訓練カードには合計サンプル数と経過時間が一目で表示されます。

ボーナス:llama.cppのバージョンアップ(ビルドb9222)により、長いクリップでのチャンク境界の問題が修正され、すべての言語におけるVoice-Keyboardの精度が向上しました。有料ライセンスをご購入いただくと無料で利用可能です。

エンジニアリング 2026年5月15日

v1.6.0 — 非同期音声転写ジョブ + 単語レベルでのSRT最適化

新しい2つのMCPツールが登場しました: start_transcription エージェントが他の作業を行えるよう、即座にジョブIDを返す。 get_transcription_status 処理完了までの進捗を確認します。一度に1つのタスクを処理し、完了時に結果を即座に表示します。長いファイルでももはやエージェントのループの進行を妨げません。

さらに、単語レベルのSRT/VTT出力に関する一連の修正も加えられている。句読点の前に余分なスペースが残らず、単独のドット記号もなくなり、ホットワードや文脈文字列が字幕に混入することもない。よりクリーンな字幕で、手動での修正は不要だ。

エンジニアリング 2026年5月15日

v1.5.0 — ONNXを廃止し、実行環境は純粋なllama.cpp + libmtmdとなりました

エンジンを完全に書き直しました。Brethof Voice Proは現在、Qwen3-ASRをエンドツーエンドで利用して動作します。 llama.cpp GGUF量子化済みウェイトを使用して libmtmdONNX Runtimeはなくなりました。その結果、インストールサイズが小さくなり(400MB以上から約83MBのバイナリに)、クールスタートの速度も向上し、プラットフォームごとに異なるCUDA/DirectMLのパッケージを扱う必要もなくなりました。

Vulkanは自動的にユーザーのGPU——NVIDIA、AMD、Intel Arc——を検出し、GPUがない場合はCPUを代替として使用します。このエンジンが現在、ASR、ボイスキーボード、MCPサーバー、そして(v2.0.0では)翻訳といったあらゆる機能の背骨となっています。

エンジニアリング 2026年5月14日

v1.4.0 — MCPサーバー初登場+マルチGPUデバイス選択機能

Model Context Protocolサーバーが起動しました。MCPに対応するあらゆるAIエージェント—— Claude Desktop, Claude Code, カーソル, クライン — stdio経由でテキスト変換を実行可能(ポートもファイアウォールも不要)。同じリリースには マルチGPUデバイスセレクタ そうすれば、どのVulkan GPUでASRが動作するかを選択でき、さらにオプションも利用可能です。 強制整列ツール すべての転写に単語レベルのタイムスタンプを追加するアドオン。

有料プランのみ — 個人ライセンスまたはビジネスライセンスがなければMCPサーバーは起動しません。 brethof-voice --mcp これが一行での呼び出しです。

ロードマップ 2026年4月16日

開発中のmacOSバージョン — まずはApple Silicon対応

発売前に最も多く寄せられた質問は「macOSはいつ登場するのか?」でした。回答は、現在開発中です。まずMetalアクセラレーションを備えたApple Siliconネイティブバージョンがリリースされ、その後Intel版が続きます。リリース時期は2026年第3四半期を目指しており、第2四半期にはクローズドベータテストを開始します。現在開発中の内容と申し込み方法はこちらです。

記事を読む →
製品 2026年4月16日

パーソナルモデルトレーニング — 自分の声に合わせてBrethof Voice Proを微調整する

Voice Proではパーソナルな声のトレーニングが可能です。誤って認識された単語を訂正するたびに、その音声クリップと訂正内容が自動的にローカルのトレーニングデータセットに保存されます。「トレーニング」タブでワンクリックするだけで、あなたのアクセントに合わせてLoRAを微調整できます。アプリは自動的にNVIDIA CUDAまたはCPUを選択し、トレーニング済みモデルをGGUF形式に自動エクスポートします。有料ライセンスを購入すれば無料で利用できます。

記事を読む →
お知らせ 2026年4月16日

Brethof Voice Proがリリースされました——端末内で動作する音声入力文字変換ツールです。

数ヶ月にわたる開発の末、Voice Pro v1.0が今日、WindowsおよびLinux向けにリリースされました。30言語のテキスト変換機能と22の中国語方言への対応、完全なオフラインでのテキスト変換、どこでもホットキーを使ってのディクテーション、そしてサブスクリプション不要の一回限りの料金体系が特徴です。ここでは、このバージョンに盛り込まれた機能と、今後取り組む予定の機能について説明します。

記事を読む →
チャンピオンズ 2026年4月16日

1,800件の無料ライセンスが提供されます:Champions Programが開始されました

Champions Programは本日開始され、5月16日まで続きます。対応している各言語ごとに50個の無料Personalライセンスが提供され、合計で1,800個となります。さらに、トップ50に入らなかった出場者には70%の割引が適用されます。ここでその運用方法と、なぜこのような方式を採用しているのかを説明します。

記事を読む →
ライセンス 2026年4月16日

パーソナルライセンスは、現在、個人事業やフリーランスとしての活動にも適用されます。

「個人使用のみ」という従来の表現が分かりにくいと感じたライター、コンサルタント、翻訳者からの初期フィードバックを聞きました。49ドルで提供されるパーソナルライセンスでは、今後はソロやフリーランスによる商用利用も明確に許可されます。ビジネスライセンス(1台あたり149ドル)はチーム向けです。ここに変更点とその理由を示します。

記事を読む →
製品 2026年4月12日

30種類の音声認識言語に対応、完全に翻訳されたUI——機械翻訳による文字の羅列ではありません

Brethof Voice Proは、アラビア語、広東語、中国語、チェコ語、デンマーク語、オランダ語、英語、フィリピン語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ヒンディー語、ハンガリー語、インドネシア語、イタリア語、日本語、韓国語、マケドニア語、マレー語、ペルシャ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スペイン語、スウェーデン語、タイ語、トルコ語、ベトナム語といった30か国の言語に加え、22の中国語方言にも対応してテキストを翻訳・表示します。こちらでは、このアプリが適切な翻訳を選択する仕組みや、「完全翻訳」とは何を意味するのかを説明します。

記事を読む →
エンジニアリング 2026年4月8日

なぜONNXからGGUFに移行したのか——より高速で、サイズも小さく、導入も簡単

Brethof Voice ProのASRバックエンドは、ONNX Runtimeの代わりにllama.cpp上でGGUF量子化されたQwenモデルを使用して動作します。その結果、インストールサイズが小さくなり(83 MBのexe対400MB以上)、クールスタートの速度も向上し、さらに各プラットフォームでCUDAやDirectMLのライブラリとの互換性問題に悩まされることもありません。こちらがこの切り替え背後にあるエンジニアリング上の経緯です。

記事を読む →
原則 2026年4月4日

なぜBrethof Voice Proは100%オフラインで動作するのか、そしてそれが単なる機能に過ぎないわけではない理由

ほとんどの音声入力ソフトウェアは、ユーザーの声を第三者のサーバーを経由して送信します。私たちはこれが適切なデフォルト設定ではないと考えています。ユーザーの声というのは、医療記録、法的文書、プライベートな日記、仕事上の秘密といった、最も個人的なデータです。だからこそ、Voice Proにはクラウドモードも「オプションのテレメトリ機能」もなく、音声を転写するためのアカウント登録も不要なのです。

記事を読む →

メールで最新情報を受け取る

新しい投稿が公開されたり、新バージョンがリリースされたりした際に通知を受け取るためにアカウントを作成してください。

アカウントを作成する

私たちが作るすべて

🎤

Brethof Voice Pro

あなたの声を学習するローカル音声認識。永久ライセンス。当社のフラッグシップ製品。

有料版・フラッグシップ

🧠

Brethof Mind

Claude Code用のローカル長期記憶——全文検索、ベクター検索、グラフ構造に対応。SurrealDB上。MITライセンス。

無料・オープンソース

🛠

3Dモデル

印刷可能なデジタルモデル。STL/3MF/OBJ形式が含まれています。生涯アクセス権付き。

有料・デジタルカタログ

📦

3Dプリント

当社のプリントデザインはヨーロッパ全土に配送されています。ファイルではなく実物をご購入ください。

有料 · 実物

🎥

ノヴァ

サイバータイガーAIホスト。企業の都合に左右されない、プライバシーを最優先としたAIの仕組みを解説します。

チャンネル · ライブ

📚

素晴らしいリスト

AI、MCP、ローカルAI、Linux for AIなどに関する厳選されたGitHubリスト。雰囲気ではなく、確かな証拠を。

無料・厳選

📖

ガイド

Linux、Windows、macOSでのローカルAIに関する詳細なハウツーガイド。マーケティングではなく、実際の設定内容です。

無料 · 近日公開予定

🔮

ComfyUIのワークフロー

実運用でテスト済みのComfyUIグラフ——LTXチャンクループ、Novaパイプラインなど。

無料 · ワークフローランディング

🤯

アンチデベロッパー向けティアリスト

ネガティブキュレーション:時間を無駄にする手法とツールのランキング。証拠必須。

無料 · 近日公開予定

👋

Brethof AIについて

私たちが誰で、なぜローカルファーストのAIを構築するのか、そして何をしないのか。

外部:   YouTube · GitHub