端末内だけで動作する最先端のAI音声認識・翻訳機能。30言語で話せ、38言語に翻訳可能——クラウド不要、サブスクリプション不要、データ収集もありません。
クレジットカードは不要です。設定後はオフラインでも利用可能です。
GGUF最適化を施したQwen3-ASRエンジンによって駆動されるプロフェッショナルな音声認識機能。
話したすべての言葉はローカルで処理されます。サーバーには何も送信されません。あなたのデータは常にご自身のコンピュータ内に残ります。
Qwen3-ASRによって動作します。特定の言語を指定して固定するか、エンジンに自動検出させることも可能です。22の中国の地域方言が自動的に認識されます。
Tencent Hunyuan MT2は、FLORES-200(XCOMET-XXL)テストにおいてGoogle Gemini 3.1 Proに匹敵する翻訳品質を誇り、すべてユーザーの自分のコンピュータで動作します。音声録音データ、音声入力によるテキスト出力、またはSRT/VTT形式の字幕ファイルなど、あらゆるものを翻訳できます。
モデルは1回だけダウンロードしてください(ASR用は約1~3GB、翻訳用は任意で約1GBまたは約4.3GB)。設定後はインターネット接続は不要です。
ノートパソコンや統合GPUの場合は0.6B、アクセントがある音声やノイズの多い音声でより高い精度が必要な場合は1.7Bです。設定→モデルからいつでも切り替え可能です。
LoRAを使って自身のアクセントに合わせて微調整が可能——すべてお使いのマシン上でエンドツーエンドで処理されます。日常的な使用による修正内容は自動的に保存され、作業が完了するとGGUF形式に自動的にエクスポートされます。すべての有料ライセンスに無料で同梱されています。
永久ライセンス。月額料金もなく、利用制限もなく、トークンのカウントもありません。一度購入すれば、一生利用可能です。
騒がしい環境での録音における、オプションとしてDeepFilterによるノイズ抑制機能。デフォルトではオフです。必要な時はノイズポップアップから有効にしてください。
F9キーを押しながら話すと、テキストはカーソルのある場所に表示されます。また、オプションの翻訳チップを使用すれば翻訳済みのテキストが表示され、ある言語で話せば別の言語で入力できます。
どちらも同じQwen3-ASRアーキテクチャを採用しています。1つを選択し、設定→モデルからいつでも切り替えることができます。
ノートパソコンや統合GPUのデフォルト設定です。4GB以上のVulkan対応グラフィックカードであればどれでも動作します。コンパクトなサイズながらも優れた品質を誇ります。
アクセントがある音声やノイズの多い音声に対しても高い精度を発揮。6GB以上のVRAMで快適に動作。オープンソースASRの中では最先端の性能を誇る。
設定 → モデルから、必要に応じてオプションのアドオンをダウンロードできます。
強制整列ツール 単語レベルのタイムスタンプ用(約540 MB) Hunyuan MT2 Fast (約1GB)または 品質 翻訳には(約4.3 GB)の容量が必要です。
| 機能 | Brethof Voice Pro | ドラゴン | Google STT | Otter.ai | Whisper (OSS) |
|---|---|---|---|---|---|
| 100%ローカル処理 | ✓ | ✓ | ✗ | ✗ | ✓ |
| 永久ライセンス | ✓ | ~ | ✗ | ✗ | ✓ |
| ネイティブLinux対応 | ✓ | ✗ | ~ | ✗ | ✓ |
| Windowsネイティブ対応 | ✓ | ✓ | ~ | ✗ | ~ |
| 30種類のASR言語+自動検出 | ✓ | ✗ | ✓ | ~ | ✓ |
| オフライン翻訳(38言語) | ✓ | ✗ | ✗ | ✗ | ✗ |
| GPUアクセラレーション(NVIDIA + AMD + Intel) | ✓ | ✗ | N/A | N/A | ~ |
| パーソナルモデルの微調整(LoRA) | ✓ | ✓ | ✗ | ✗ | ✗ |
| AIエージェント用のMCPサーバー | ✓ | ✗ | ✗ | ✗ | ✗ |
| 内蔵のノイズリダクション機能 | ✓ | ✓ | ✓ | ✓ | ✗ |
| テキストの直接挿入 | ✓ | ✓ | ✗ | ✗ | ✗ |
| 洗練されたデスクトップGUI | ✓ | ✓ | ✗ | ✓ | ✗ |
| 一般的なコスト | $49 一度 | 350ドル/年以上 | 17ドル/月 | 17ドル/月 | 無料 |
月額料金はなく、利用制限もありません。1年間のアップデートが含まれた永久ライセンスです。
クレジットカードは不要です。トライアルを確認するためにメールアドレスのみが必要です。
永久ライセンス。パーソナルデバイス2台まで。1年間のアップデートが含まれます。
価格は税抜きです。アップデートには年間20ドルがかかります(任意)。
1台あたりの永久ライセンス。チームや組織での利用に適しています。1年間のアップデートが含まれます。
価格は税抜きです。アップデートには1席あたり年間20ドルがかかります(オプション)。
いいえ。Brethof Voice Proは、すべての処理をユーザーのデバイス上でローカルに行います。音声データやテキストデータは一切コンピュータから外部に送信されません。クラウド機能も、テレメトリ機能も、分析機能も存在しません。
どの最新のGPUでも利用可能です。NVIDIA、AMD、Intel ArcはすべてVulkanアクセラレーションを採用しています。CPUのみで動作させることもできますが、その場合はテキスト変換の速度が遅くなります。0.6Bモデルは統合グラフィックスや4GB以上のVulkan対応グラフィックカードでも問題なく動作します。
まずはそれから始めましょう。 0.6Bモデル — これが推奨されるデフォルト設定で、ほとんどのGPU上で優れた動作を示します(最新のマシンのCPU上でも利用可能)。アクセントがある音声やノイズの多い音声に対してより高い精度が必要な場合は、別のものに切り替えてください。 17億パラメータモデル (6GB以上のVRAMが必要です)。設定→モデルからいつでもサイズを変更でき、再ダウンロードする必要はありません。
はい。Brethof Voice ProはLinuxおよびWindowsの両方をネイティブにサポートしています。LinuxではX11およびWaylandで動作し、Windowsでは標準的なデスクトップアプリケーションとして実行されます。
ご利用のライセンスは永久制で、どのバージョンをお使いでもアプリは永遠に動作し続けます。年間20ドルのオプション払いによるアップデートパスを購入すれば、新機能やモデルの改良を利用できます。これを購入しなければ、現在のバージョンのままです。
はい — v2.0.0には個人向けの声のトレーニング機能が含まれており、すべてユーザーのマシン上でエンドツーエンドで処理されます。誤認識された単語を訂正するたびに、{clip, correction}のペアが自動的にローカルのトレーニングデータセットに保存されます。メインウィンドウのトレーニングカードには、取得されたサンプル数や時間が一目で表示されます。トレーニングタブの「トレーニングを開始」をクリックすると、自分のアクセントに合わせてLoRAを微調整できます。結果は自動的にGGUF形式でエクスポートされ、ワンクリックで利用可能になります。すべての有料ライセンスでは無料で提供され、ユーザーの声のデータは決してマシン外に送信されません。
あなたの声を学習するローカル音声認識。永久ライセンス。当社のフラッグシップ製品。
有料版・フラッグシップ
Claude Code用のローカル長期記憶——全文検索、ベクター検索、グラフ構造に対応。SurrealDB上。MITライセンス。
無料・オープンソース
印刷可能なデジタルモデル。STL/3MF/OBJ形式が含まれています。生涯アクセス権付き。
有料・デジタルカタログ
当社のプリントデザインはヨーロッパ全土に配送されています。ファイルではなく実物をご購入ください。
有料 · 実物
サイバータイガーAIホスト。企業の都合に左右されない、プライバシーを最優先としたAIの仕組みを解説します。
チャンネル · ライブ
AI、MCP、ローカルAI、Linux for AIなどに関する厳選されたGitHubリスト。雰囲気ではなく、確かな証拠を。
無料・厳選
Linux、Windows、macOSでのローカルAIに関する詳細なハウツーガイド。マーケティングではなく、実際の設定内容です。
無料 · 近日公開予定
実運用でテスト済みのComfyUIグラフ——LTXチャンクループ、Novaパイプラインなど。
無料 · ワークフローランディング
ネガティブキュレーション:時間を無駄にする手法とツールのランキング。証拠必須。
無料 · 近日公開予定
私たちが誰で、なぜローカルファーストのAIを構築するのか、そして何をしないのか。