製品ツアー — Brethof Voice Pro

メイン画面

あなたの指揮センター

メイン画面ですべての機能にアクセスできます。マイクを切り替えたり、速度と精度の最適なバランスを実現するために2つのテキスト変換モデル（0.6Bおよび1.7B）を使い分けたり、言語を変更したり、ファイルのテキスト変換や翻訳を行ったりできます。同時多言語翻訳機能により、音声出力をその場で翻訳することも可能です。ノイズ低減フィルターを設定したり、テキスト変換モデルを実行するデバイスを選択したりも、メニューを開かずに行えます。クイックアクセス用のホットワードボタンを使えば、その場でドメイン固有の用語を追加することも可能です。

最後に行われた音声認識結果は常に下部に表示され、個人学習用に保存している音声サンプルの数が記載されたトレーニングカードも一緒に表示されます。そのカードをクリックすると全てのサンプルリストを確認できます。ここから設定を開いたり、履歴を確認したり、最後の音声認識結果を修正したり、ワンクリックで録音を開始したりすることができます。ウィンドウを閉じるとアプリはシステムトレイに非表示になり、バックグラウンドで継続して動作し、ホットキーを押した瞬間にすぐに使用できる状態になります。

録音

Brethof Voice Pro — Recording in progress

押して、話して、完了です。

ホットキーを押すとアプリが録音を開始します。リアルタイムのタイマーには経過時間と残りの録音時間が表示されます。キーを離すか、切り替えモードで再び押すと、音声がテキストに変換され、フォーカスがあるウィンドウに直接入力されます。

ファイルを文字起こしする v2.0.0の新機能

Brethof Voice Pro — Transcribe and translate a file

どの言語のファイルでもテキストに変換可能

任意のオーディオやビデオファイルを文字起こしするか、文字起こししてから翻訳することも可能です。ファイルをドラッグ＆ドロップするか参照して選び、翻訳が必要な場合は目標言語を選択し、出力結果をプレーンテキストファイルまたはSRT字幕ファイルとして保存します。

マイクからの音声をテキストに変換してください v2.0.0の新機能

Brethof Voice Pro — Transcribe and translate the microphone

ライブで録音し、翻訳する

ライブのマイク入力を文字起こしするか、文字起こししてから翻訳することも可能です。録音した後、翻訳が必要な場合は対象言語を選択し、出力結果をプレーンテキストまたはSRT字幕ファイルとして保存できます。

システム音声の文字起こし v2.0.0の新機能

Brethof Voice Pro — Transcribe and translate system audio

スピーカーから流れる音声を録音する

スピーカーなど、PC上のあらゆる出力デバイスからの音声をテキストに変換することができます。会議通話やブラウザのタブ、その他のシステム音声を記録し、その結果をプレーンテキストファイルまたはSRT字幕ファイルとして保存できます。

多言語翻訳 v2.0.0の新機能

Brethof Voice Pro — Simultaneous multi-language translation

複数の言語に一度に翻訳する

同時多言語翻訳の場合、一度に翻訳したい対象言語を選択し、結果の表示方法も選べます。1行ずつ、横並び、または最初の対象言語のみといった形式です。

テキストと字幕の翻訳 v2.0.0の新機能

Brethof Voice Pro — Translate text and SRT files

テキストと字幕を翻訳する

任意のプレーンテキストやSRT字幕ファイルを別の言語に翻訳できます。こちらでもホットワードリストが適用されるため、ブランド名や専門用語は翻訳において一貫性を保ちます。

ホットワード

その言語の単語集を教えてあげてください。

「ホットワード」ダイアログを使えば、AIに優先的に処理すべき単語のリストを入力できます。人名、専門用語、ブランド名、またはあまり一般的でない語彙などが該当します。単語を入力してEnterキーを押すだけです。モデルは文字起こし時にこれらのヒントを利用して重要な用語を誤認識しないようにし、同じリストによって翻訳時もそれらの用語が一貫して扱われます。再学習は不要で、ホットワードは即座に効力を発揮します。

校正とトレーニング

Brethof Voice Pro — Correct Transcription

エラーを修正し、モデルを改善する

メイン画面の「Correct」ボタンをタップすると、「Correct Transcription」ダイアログが表示されます。ここには元の音声転写結果と、編集可能な修正欄が並んでいます。保存すると、修正されたテキストと対応するオーディオクリップが自動的にトレーニングデータに追加され、時間の経過とともにユーザーの声に対するモデルの精度を向上させるパーソナライズされたデータセットが構築されます。

トレーニングデータ

あなたの声、あなたのデータセット

「トレーニングデータ」ウィンドウには、記録したすべての音声サンプルが一覧表示されます。任意のサンプルを再生したり、その文字起こしを確認したり、もう不要なエントリを削除したりできます。これらのサンプルが、あなたの声に合わせてモデルを微調整する際に使用されるデータセットとなります。修正や記録を重ねるほど、モデルはあなたの声をより正確に理解できるようになります。

モデル訓練

自分のコンピュータ上でAIをカスタマイズしましょう

「トレーニング」タブでは、LoRAを用いてユーザー自身の声に合わせて音声認識モデルを微調整します。これにより、ユーザーのアクセントや語彙、話し方に適応させることができ、データは一切外部に送信されません。ワンクリックで処理が開始され、互換性のあるGPUがある場合はアプリが自動的にNVIDIA CUDAバックエンドを選択し、そうでない場合はCPUを使用します。トレーニングが終了すると、結果が統合されGGUF形式でエクスポートされるため、「設定」→「モデル」から自分専用のモデルに切り替えることができます。有料ライセンスを購入すれば、個人用の声のトレーニングは無料で利用可能です。

設定 → モデル v2.0.0の新機能

モデルとデバイス

「モデル」タブでは、アプリが使用するすべてのモデルを管理できます。オプションの「Forced Aligner」をダウンロードして単語レベルのタイムスタンプを有効にし、翻訳モデルをダウンロードして既定値を設定し、また、音声認識エンジンとは別に翻訳モデルが実行されるデバイスを選択します。音声認識はあるGPUで、翻訳は別のGPUで実行するか、どちらかをCPUに割り当てることも可能です。

音声設定

入力を完全に制御できる

「オーディオ」タブでは、アプリとの操作方法を設定します。ショートカット一覧から録音用のホットキーを選び、録音中はキーを押し続けるモードかオン/オフで切り替えるモードを選択するか、またはハンズフリー操作のためにマウスのサイドボタンを割り当てることもできます。

音量スライダーを使って入力ゲインを調整でき、特定のアプリケーションがデフォルトの入力方法を受け付けない場合にはテキスト挿入用のバックエンドを変更することも可能です。下部にある切り替えボタンで、DeepFilterによって駆動される内蔵のAIノイズ低減機能の有効化ができ、デフォルトでは無効になっています。また、背景ノイズの抑制強度を調整するための減衰スライダーも用意されています。

言語

30か国語＋22の中国語方言、ワンクリックで対応

「言語」タブでは、文字起こしエンジンがどの言語を認識するかを設定します。30種類の言語から選択したり、自動検出にしておいたり、中国語を選べば22の中国の地域的な方言も自動で認識できます。また、よく使用する言語をリストアップしてメイン画面のドロップダウンからすぐに切り替えられるようにすることも可能で、複数の言語で頻繁にテキスト入力を行う場合に最適です。

音声転写履歴

Brethof Voice Pro — Transcription History Window

あなたが話したすべての内容が検索可能です。

「履歴」タブでは、文字起こしの保存方法を設定できます。「セッション履歴」を有効にすると、アプリが終了すると消去されるログが記録され、一方「永続的履歴」に切り替えると、セッションを超えて文字起こしが保存されます。「文字起こし履歴」ウィンドウには、アプリが文字起こしした内容の日時付きログが表示され、いつでも履歴を消去するための「履歴を消去」ボタンも用意されています。すべての履歴はデバイス上にローカルで保存されます。

外見

あなただけのものにしましょう。

「外観」タブでは、ダークテーマとライトテーマの間で切り替えたり、インターフェースの言語を変更したりできます。テーマの変更は再起動後に適用されます。

アップデートとサポート

見てみる実際の使用例

あなたの指揮センター

押して、話して、完了です。

どの言語のファイルでもテキストに変換可能

ライブで録音し、翻訳する

スピーカーから流れる音声を録音する

複数の言語に一度に翻訳する

テキストと字幕を翻訳する

その言語の単語集を教えてあげてください。

エラーを修正し、モデルを改善する

あなたの声、あなたのデータセット

自分のコンピュータ上でAIをカスタマイズしましょう

モデルとデバイス

入力を完全に制御できる

30か国語＋22の中国語方言、ワンクリックで対応

あなたが話したすべての内容が検索可能です。

あなただけのものにしましょう。

最新情報を常にチェックしましょう。

自分で試してみる準備はできましたか？

私たちが作り出すすべてのもの

Brethof Voice Pro

Brethof Mind

3Dモデル

3Dプリント

ノヴァ

素晴らしいリストたち

ガイド

ComfyUIのワークフロー

アンチデヴ層別ランキング

Brethof AIについて

見てみる 実際の使用例

あなたの指揮センター

押して、話して、完了です。

どの言語のファイルでもテキストに変換可能

ライブで録音し、翻訳する

スピーカーから流れる音声を録音する

複数の言語に一度に翻訳する

テキストと字幕を翻訳する

その言語の単語集を教えてあげてください。

エラーを修正し、モデルを改善する

あなたの声、あなたのデータセット

自分のコンピュータ上でAIをカスタマイズしましょう

モデルとデバイス

入力を完全に制御できる

30か国語＋22の中国語方言、ワンクリックで対応

あなたが話したすべての内容が検索可能です。

あなただけのものにしましょう。

最新情報を常にチェックしましょう。

自分で試してみる準備はできましたか？

私たちが作り出すすべてのもの

Brethof Voice Pro

Brethof Mind

3Dモデル

3Dプリント

ノヴァ

素晴らしいリストたち

ガイド

ComfyUIのワークフロー

アンチデヴ層別ランキング

Brethof AIについて

見てみる実際の使用例