Chuyển tự 30 ngôn ngữ + 22 phương ngữ tiếng Trung
Dịch sang tiếng Việt 38 ngôn ngữ, hoạt động hoàn toàn ngoại tuyến
Thời gian biểu tạo phụ đề riêng của bạn
Máy chủ MCP Nói chuyện với nó thông qua bộ công cụ AI của bạn
Chạy nội bộ — ngay cả trên máy tính xách tay•Không cần đăng ký gói dịch vụ•Thử nghiệm miễn phí 14 ngày
Mọi từ ngữ bạn nói đều được xử lý trên thiết bị của bạn. Không có âm thanh, văn bản hay dữ liệu siêu dữ liệu nào được gửi đến bất kỳ máy chủ nào. Không có hệ thống backend trên nền tảng đám mây, không có việc thu thập dữ liệu từ xa, không có phân tích dữ liệu, và cũng không có chức năng gửi thông tin về nhà máy sản xuất.
Brethof Voice Pro sử dụng động cơ được tối ưu hóa cho định dạng GGUF cùng llama.cpp để mang lại tốc độ xử lý vô cùng nhanh. Sản phẩm hỗ trợ ngay lập tức tất cả ba nhà sản xuất GPU lớn.
Được vận hành bởi Qwen3-ASR thông qua llama.cpp. Hãy chọn ngôn ngữ cụ thể để đạt độ chính xác tối ưu, hoặc để công cụ tự nhận diện ngôn ngữ. Mọi từ ngữ đều được lưu trên máy của bạn.
Cùng với 22 phương ngữ địa phương tiếng Trung (Anhui, Đông Bắc, Phúc Kiến, Hà Nam, Hồ Nam, Sơn Đông, Tứ Xuyên, Ngô, Mân Nam, v.v.) sẽ được nhận diện tự động khi ngôn ngữ được thiết lập thành tiếng Trung hoặc chế độ nhận diện tự động.
Dịch bất kỳ đoạn ghi âm, nội dung được nhập từ bàn phím giọng nói, văn bản thông thường, hay tệp phụ đề — toàn bộ đều được thực hiện trên máy của bạn. Được vận hành bởi Tencent Hunyuan MT2Trong FLORES-200 (XCOMET-XXL), cấp độ chất lượng đạt mức 97,9% của Google Gemini 3.1 Pro Phiên bản Fast gọn nhẹ đạt 89,9%, và nó vượt trội hơn Gemini 3.1 Pro trong các bài kiểm tra thực tế (WildMTBench) cũng như việc dịch các ngôn ngữ thiểu số.
Hãy chọn mức cân bằng giữa độ chính xác, tốc độ và lượng VRAM phù hợp với máy của bạn. Cả hai đều sử dụng cùng kiến trúc Qwen3-ASR; bạn có thể thay đổi chúng bất cứ lúc nào thông qua mục Settings → Models.
Có thể tải các phần mở rộng tùy chọn theo yêu cầu từ Mục Cài đặt → Các mô hình: Công cụ căn chỉnh cưỡng bức (~540 MB) dành cho thời điểm ghi nhận ở cấp độ từ. Hunyuan MT2 Fast (~1 GB) hoặc Chất lượng (Khoảng 4,3 GB) dành cho việc dịch.
Tính năng ức chế nhiễu DeepFilter có thể được sử dụng cho các bản ghi âm được thực hiện trong môi trường ồn ào – mặc định là tắt, có thể kích hoạt từ menu xuất hiện khi chọn tùy chọn nhiễu. Việc bỏ qua tính năng này đối với các đoạn ghi âm sạch thực ra lại giúp cải thiện chất lượng (vì DeepFilter có thể xử lý quá mức các đoạn âm thanh ngắn và sạch).
Hãy điều chỉnh mô hình bằng giọng nói của riêng bạn thông qua công cụ LoRA — quá trình xử lý diễn ra hoàn toàn trên máy của bạn. Mỗi lần bạn sửa một từ bị nhận diện sai, cặp dữ liệu {clip, correction} sẽ được lưu vào tập dữ liệu huấn luyện cục bộ của bạn. Tab huấn luyện trong cửa sổ chính hiển thị ngay tổng số mẫu và thời gian ghi lại — hãy nhấp vào đó để mở trình duyệt tập dữ liệu, sau đó chọn “Bắt đầu huấn luyện” trong tab Huấn luyện.
Giữ phím tắt, nói lên nội dung, và văn bản sẽ xuất hiện ở vị trí con trỏ đang ở — giống như trên bàn phím. Có thể sử dụng được trên các trình duyệt, môi trường lập trình, terminal, ứng dụng chat, bất cứ nơi nào có trường nhập văn bản chấp nhận đầu vào từ bàn phím.
EN: … || PL: …), hoặc chỉ mục tiêu đầu tiên.Một thiết bị, hai công dụng. Tạo độ lệch cho ASR Đối với các danh từ riêng, tên thương hiệu và thuật ngữ chuyên môn — giúp tránh việc “VFIO” bị dịch sai thành “VEAF1”. Cùng một trường này cũng đóng vai trò là Từ điển thuật ngữ dịch thuật — Gắn nhãn “Brethof Voice” để nó vẫn giữ nguyên tên “Brethof Voice” trong mọi ngôn ngữ đích.
Cùng một tệp nhị phân dùng để chạy giao diện người dùng cũng có thể hoạt động như một máy chủ Protocol Model Context — 19 công cụ hỗ trợ chức năng ASR và MT cho Claude Desktop, Claude Code, Cursor, Cline, hoặc bất kỳ agent tương thích với MCP nào. Phương thức truyền dữ liệu sử dụng stdio: không cần cổng, không cần tường lửa, cũng không cần kết nối với localhost. Agent chịu trách nhiệm quản lý toàn bộ vòng đời của ứng dụng.
Chạy brethof-voice --mcp Và agent sẽ kết nối thông qua stdio. Cần có giấy phép trả phí — người dùng thử nghiệm không thể khởi động máy chủ.
Thử nghiệm miễn phí 14 ngày. Mọi tính năng đều được sử dụng. Không cần thẻ tín dụng.
Chức năng chuyển đổi giọng nói thành văn bản tại chỗ, có khả năng học giọng nói của bạn. Giấy phép sử dụng vĩnh viễn. Sản phẩm nổi bật nhất của chúng tôi.
CÓ PHÍ · flagship
Bộ nhớ dài hạn cục bộ cho Claude Code — tìm kiếm toàn văn + vector + đồ thị, trên SurrealDB. MIT.
MIỄN PHÍ · mã nguồn mở
Các mô hình kỹ thuật số sẵn sàng in ấn. Bao gồm định dạng STL/3MF/OBJ. Truy cập trọn đời.
CÓ PHÍ · danh mục kỹ thuật số
Các thiết kế in ấn của chúng tôi được vận chuyển khắp châu Âu. Hãy mua sản phẩm, không phải tệp tin.
CÓ PHÍ · vật thể vật lý
Máy chủ AI Cyber-tiger. Giải thích về AI lấy quyền riêng tư làm trọng tâm một cách trực diện, không qua bộ lọc của các tập đoàn.
KÊNH · trực tiếp
Các danh sách được chọn lọc trên GitHub dành cho AI, MCP, AI cục bộ, Linux cho AI, và nhiều hơn nữa. Bằng chứng thực tế, không chỉ là cảm giác.
MIỄN PHÍ · được tuyển chọn kỹ lưỡng
Hướng dẫn chi tiết về cách triển khai AI tại chỗ trên Linux, Windows, macOS. Các cấu hình thực tế, không phải nội dung quảng cáo.
MIỄN PHÍ · sắp ra mắt
Các biểu đồ ComfyUI đã được kiểm thử trong sản xuất — LTX chunked-loop, pipeline Nova, và nhiều hơn nữa.
MIỄN PHÍ · trang đích quy trình làm việc
Chỉnh sửa tiêu cực: các phương pháp và công cụ lãng phí thời gian của bạn, được xếp hạng. Cần có bằng chứng.
MIỄN PHÍ · sắp ra mắt
Chúng tôi là ai, lý do xây dựng AI ưu tiên tính địa phương, và những điều chúng tôi không làm.