新バージョン · v2.0.0

すべてが 1つのアプリ

音声をテキストに変換する 30か国語+22の中国語方言

翻訳する 38か国語に対応、完全なオフライン動作

タイムスタンプ 自分だけの字幕を作成しよう

MCPサーバー 自分のAIスタックを使ってそれと対話しましょう。

ノートパソコンでもローカルで動作します購読は不要です14日間の無料トライアル

Brethof Voice Pro — Main Screen
Brethof Voice Pro — Recording
🔒

完全なプライバシー保護

話したすべての言葉はユーザーのデバイス内で処理されます。音声、テキスト、メタデータは一切サーバーに送信されません。クラウドベースのバックエンドも、テレメトリ機能も、分析機能も、自動的なデータ送信も存在しません。

  • トランスクリプション中のネットワーク呼び出しは一切ありません。
  • 一度ダウンロードした後、ローカルに保存されるモデル
  • オープンソースのQwen3-ASRエンジン——完全に監査可能

GPUアクセラレーション

Brethof Voice Proは、llama.cppを活用したGGUF最適化エンジンを採用することで、驚くほど高速な推論を実現します。出荷時から3大GPUメーカーの製品すべてに対応しています。

  • NVIDIA — Vulkan加速(GTX 10シリーズ以降)
  • AMD — Vulkanアクセラレーション(RX 500シリーズ以降)
  • インテル — Vulkanアクセラレーション(Arc GPUおよび統合グラフィックス)
  • CPUフォールバック — GPUなしでも動作しますが、速度が遅くなります
🌐

オフライン音声転写 — 30言語+22の中国語方言

llama.cppを介してQwen3-ASRによって動作します。最高の精度を得るために特定の言語に固定することも、エンジンに自動検出させることもできます。すべての単語はユーザーのマシン上に残ります。

英語中国語広東語アラビア語 ドイツ語フランス語スペイン語ポルトガル語 イタリア語オランダ語ロシア語インドネシア語 韓国語タイ語ベトナム語日本語 トルコ語わかりません。マレー語スウェーデン語 デンマーク語フィンランド語ポーランド語チェコ語 フィリピン語ペルシア語ギリシャ語ルーマニア語 ハンガリー語マケドニア語

中国語または自動検出モードに設定した場合、安徽語、東北語、福建語、河南語、湖南語、山東語、四川語、吴語、閩南語など、22の中国の地域方言が自動的に認識されます。

💬

オフライン翻訳 — 38言語 v2.0.0の新機能

あらゆる音声転写データ、ボイスキーボード出力、プレーンテキスト、字幕ファイルも——すべてご自身のコンピュータ上で翻訳可能です。Hunyuan MT2によって駆動されます。 Tencent Hunyuan MT2FLORES-200(XCOMET-XXL)では、品質レベルが最高に達します。 Google Gemini 3.1 Proの97.9% コンパクトなFastタイプの精度は89.9%で、実際の使用環境下(WildMTBench)や少数言語の翻訳においてもGemini 3.1 Proを上回っています。

中国語英語フランス語ポルトガル語 スペイン語日本語トルコ語ロシア語 アラビア語韓国語タイ語イタリア語 ドイツ語ベトナム語マレー語インドネシア語 フィリピン語わかりません。中国語訳ポーランド語 チェコ語オランダ語クメール語ビルマ語 ペルシア語グジャラート語ウルドゥー語テルグ語 マラーティー語ヘブライ語ベンガル語タミル語 ウクライナ語広東語チベット語カザフ語 モンゴル語ウイグル語
  • 音声入力+翻訳 — Transcribeポップアップで対象言語を選択してください。ASRが音声をテキストに変換し、MTが翻訳を行い、両方の結果が並んで表示されます。
  • ボイスキーボード翻訳 — 話しかけ、3列の言語グリッドから対象を選び、キーボードで翻訳を入力する
  • 字幕翻訳ツール — 38言語すべてでのSRT/VTTファイルに、オプションとして両言語モード(各キューに原文+翻訳文)も対応
  • 2つのモデル階層 — CPUまたはGPUを使用した場合、高速モード(約1GB)で数秒以内、高品質モード(約4.3GB)でもGPUを使用すれば数秒以内です。
  • 独立したデバイス選択ツール — Vulkan 0でASRを実行し、Vulkan 1で翻訳を行うか、または両方ともCPUで処理する
📈

2つのモデルサイズ

ご自身のマシンに合った精度、速度、VRAMのバランスを選んでください。どちらも同じQwen3-ASRアーキテクチャを採用しており、「設定」→「モデル」からいつでも切り替えることができます。

  • 0.6B — 小型で高速で、統合GPUや4GB以上のVulkan対応グラフィックカードで動作します。ノートパソコン向けの推奨デフォルト設定です。
  • 17億 — アクセントがある音声やノイズの多い音声に対してもより高精度。6GB以上のVRAMで快適に動作。オープンソースASRの中では最先端の性能を誇る。

設定 → モデルから、必要に応じてオプションのアドオンをダウンロードできます。 強制整列ツール 単語レベルのタイムスタンプ用に(約540 MB) Hunyuan MT2 Fast (約1GB)または 品質 翻訳には(約4.3 GB)の容量が必要です。

🎵

AIノイズ低減

騒がしい環境で録音した場合に利用可能なDeepFilterによるノイズ抑制機能——デフォルトではオフで、ノイズポップアップから有効化できます。清潔なマイクで録音した場合にこの機能を無効にする方が品質が向上します(DeepFilterは短くてクリーンな音声を過度に処理してしまう可能性があるからです)。

  • 背景雑音、キーボードのクリック音、部屋の反響音を除去します。
  • 調整可能な減衰機能
  • 追加のハードウェアは不要です。
  • デフォルトではオフ——録音ごとに切り替えるか常時オンにする
🎓

パーソナルボイストレーニング

LoRAを使用して自分の声でモデルを微調整でき、処理はすべてユーザーのマシン上でエンドツーエンドで行われます。誤認識された単語を修正するたびに、{clip, correction}のペアがローカルのトレーニングデータセットに保存されます。メインウィンドウのトレーニングカードには、取得されたサンプル数と時間が一目で表示されます。そこをクリックしてデータセットブラウザを開き、トレーニングタブで「トレーニングを開始」を選択します。

  • あなたのアクセント、方言、話し方のリズムに合わせて調整できます。
  • 修正内容は自動的に保存されますので、引き続きアプリをご利用ください。
  • LoRAファインチューニング — 迅速で効率的、完全な再学習は不要
  • 自動選択 NVIDIA CUDA (cu128 PyTorch) または CPU バックエンド
  • トレーニングが完了すると、学習済みモデルを自動的にGGUF形式にエクスポートします。
  • あなたの音声データは決してお使いのコンピュータから外部に送信されません。
  • 有料ライセンスごとに無料で提供されます
⌨️

ボイスキーボードと直接テキスト挿入

ホットキーを押した状態で話すと、テキストがカーソルのある場所に表示されます。まるでキーボードのようです。ブラウザ、IDE、ターミナル、チャットアプリなど、テキストフィールドがキーボード入力を受け付けるあらゆる場所で利用可能です。

  • デフォルトのホットキー F9 — 設定可能、ホールド録音、またはオンオフ切り替え
  • ハンズフリー録音用のオプションとして、マウスの右ボタンで起動可能
  • リアルタイム翻訳チップ — ある言語で話すと、キーボードが翻訳文を入力します。3列のグリッドから1つ以上の対象言語を選択してください:1行に1つ、インラインで。EN: … || PL: …)、または最初のターゲットのみ。
  • あらゆるテキストフィールド、エディタ、ターミナル、チャットで利用可能
  • LinuxのX11およびWayland、Windowsのネイティブ入力
📚

ホットワードの文脈と用語

一つのフィールド、二つの用途。バイアスをかける ASR 固有名詞、ブランド名、専門用語に対しては、「VFIO」が「VEAF1」と誤訳されるのを防ぎます。同じフィールドが兼用されています。 翻訳用語辞書 — 「Brethof Voice」をピン留めして、すべての対象言語で「Brethof Voice」として維持します。

  • 設定で用語を追加します。1行に1つずつ。
  • 固有名詞や略語の認識精度を向上させます。
  • ブランド名や技術用語はそのまま翻訳に保持する
  • 再学習は不要で、推論時に直接適用されます。
🤖

AIエージェント用のMCPサーバー 有料プラン

GUIを実行するのと同じバイナリを、Model Context Protocolサーバーとしても動作させることができる。これにより、ASRやMTの機能をClaude Desktop、Claude Code、Cursor、Cline、またはMCP対応のあらゆるエージェントに提供する19のツールが利用可能になる。通信はstdioを使用し、ポートもファイアウォールもlocalhostへのバインディングも不要だ。エージェントがそのライフサイクルを管理する。

  • オーディオ/ビデオファイル、マイク録音、またはシステム音声を文字起こしする
  • テキスト、SRT、VTTを翻訳可能(二言語モード対応)
  • ASRまたはMTのコンピューティングデバイスを即座に切り替える
  • 個人用ボイスプロファイルを一覧表示し、切り替える
  • エージェントから任意のアプリ設定を読み取ったり書き込んだりできます。

実行する brethof-voice --mcp エージェントはstdioを介して接続します。有料ライセンスが必要で、試用ユーザーはサーバーを起動できません。

試してみる準備はできましたか?

14日間の無料トライアル。すべての機能が利用可能。クレジットカード不要。

私たちが作るすべて

🎤

Brethof Voice Pro

あなたの声を学習するローカル音声認識。永久ライセンス。当社のフラッグシップ製品。

有料版・フラッグシップ

🧠

Brethof Mind

Claude Code用のローカル長期記憶——全文検索、ベクター検索、グラフ構造に対応。SurrealDB上。MITライセンス。

無料・オープンソース

🛠

3Dモデル

印刷可能なデジタルモデル。STL/3MF/OBJ形式が含まれています。生涯アクセス権付き。

有料・デジタルカタログ

📦

3Dプリント

当社のプリントデザインはヨーロッパ全土に配送されています。ファイルではなく実物をご購入ください。

有料 · 実物

🎥

ノヴァ

サイバータイガーAIホスト。企業の都合に左右されない、プライバシーを最優先としたAIの仕組みを解説します。

チャンネル · ライブ

📚

素晴らしいリスト

AI、MCP、ローカルAI、Linux for AIなどに関する厳選されたGitHubリスト。雰囲気ではなく、確かな証拠を。

無料・厳選

📖

ガイド

Linux、Windows、macOSでのローカルAIに関する詳細なハウツーガイド。マーケティングではなく、実際の設定内容です。

無料 · 近日公開予定

🔮

ComfyUIのワークフロー

実運用でテスト済みのComfyUIグラフ——LTXチャンクループ、Novaパイプラインなど。

無料 · ワークフローランディング

🤯

アンチデベロッパー向けティアリスト

ネガティブキュレーション:時間を無駄にする手法とツールのランキング。証拠必須。

無料 · 近日公開予定

👋

Brethof AIについて

私たちが誰で、なぜローカルファーストのAIを構築するのか、そして何をしないのか。

外部:   YouTube · GitHub