转录 30种语言 + 22种中文方言
翻译 38种语言,完全离线使用
时间戳 自行制作字幕
MCP服务器 通过你的AI技术栈与它进行对话
可在本地运行——甚至在笔记本电脑上也能使用•无需订阅•14天免费试用
您说出的每一个字都会在您的设备上进行处理。没有任何音频、文本或元数据会被传输到任何服务器。没有云后端,没有遥测功能,没有分析功能,也不会有数据回传。
Brethof Voice Pro采用经过GGUF优化的引擎以及llama.cpp,可实现极快的推理速度。它可直接支持三大主流GPU厂商的硬件。
由 llama.cpp 驱动,结合 Qwen3-ASR 实现翻译功能。可选择锁定特定语言以获得最高准确度,也可让引擎自动检测。所有文本处理均在您的设备上完成。
此外,当语言设置为中文或自动检测时,还会自动识别22种中文方言(安徽话、东北话、福建话、河南话、湖南话、山东话、四川话、吴语、闽南语等)。
可对任何转录内容、语音键盘输出、纯文本或字幕文件进行翻译——全部在您的设备上完成。由……提供支持 腾讯Hunyuan MT2在FLORES-200(XCOMET-XXL)中,质量等级可达到 97.9%的Google Gemini 3.1 Pro 其紧凑型Fast版本的准确率为89.9%,在真实场景测试(WildMTBench)以及小语种翻译方面均优于Gemini 3.1 Pro。
根据您的机器性能,选择适合的准确度、速度和显存平衡方案。这两种版本都采用相同的Qwen3-ASR架构;您可以通过“设置”→“模型”随时进行切换。
可通过“设置”→“模型”按需下载可选插件: 强制对齐工具 (约540 MB)用于单词级时间戳。 Hunyuan MT2快速版 (约1GB)或 质量 翻译所需空间约为(4.3 GB)。
针对在嘈杂环境中录制的音频,可选用DeepFilter噪声抑制功能——默认为关闭状态,可通过“噪声”弹出菜单启用。对于干净的环境下录制的音频片段,关闭该功能反而有助于提升音质(DeepFilter可能会过度处理较短且干净的音频)。
使用LoRA根据您自己的声音对模型进行微调——整个过程在您的设备上端到端完成。每次您纠正被错误识别的单词时,对应的{clip, correction}对都会被保存到您的本地训练数据集中。主窗口中的训练卡片可让您一目了然地查看总样本数及录制时长——点击该卡片即可打开数据集浏览器,然后在“训练”选项卡中选择“开始训练”。
按住热键并说话,文字就会出现在光标所在的位置——就像使用键盘一样。该功能适用于浏览器、集成开发环境、终端、聊天应用以及任何能够接收键盘输入的文本字段。
EN: … || PL: …),或者仅选择第一个目标。一个领域,两种用途。加以偏向处理 ASR技术 针对专有名词、品牌名称及专业术语——可避免“VFIO”被误译为“VEAF1”。同一字段同时用于 翻译术语词典 — 将“Brethof Voice”固定为在所有目标语言中均显示为“Brethof Voice”。
用于运行GUI的同一二进制文件也可作为模型上下文协议服务器使用——共有19种工具可通过该服务器为Claude Desktop、Claude Code、Cursor、Cline或任何支持MCP的代理提供ASR和MT功能。数据传输采用标准输入输出方式:无需端口、无需防火墙,也不需要进行本地主机绑定。代理负责掌控整个生命周期。
运行 brethof-voice --mcp 该代理通过标准输入输出进行连接。需要购买付费许可证——试用用户无法启动服务器。
本地语音转文字功能,可学习您的语音。永久许可。我们的旗舰产品。
付费版·旗舰版
Claude Code的本地长期记忆——全文+向量+图,基于SurrealDB。MIT协议。
免费 · 开源
可直接打印的数字模型,包含STL/3MF/OBJ格式。终身可用。
已支付·数字目录
我们的印刷设计已销往整个欧洲。请购买实物,而非文件。
付费 · 实体物品
Cyber-tiger AI主机。摒弃企业层面的过滤,为您解读以隐私为首要原则的AI技术。
频道 · 直播
精选GitHub列表,涵盖AI、MCP、本地AI、AI用Linux等。注重实际成果,而非氛围感。
免费 · 精选内容
针对Linux、Windows和macOS系统的本地AI详细操作指南。提供真实配置,而非营销内容。
免费 · 即将推出
经过实际生产环境验证的ComfyUI工作流——LTX分块循环、Nova管线等。
免费 · 工作流落地页
负面筛选:浪费你时间的各种方法与工具,已按重要性排序。需提供相关凭证。
免费 · 即将推出
我们是谁,为何要打造以本地化为核心的AI技术,以及我们不会做什么。