Chức năng ghi âm và dịch thuật bằng trí tuệ nhân tạo tiên tiến, hoạt động hoàn toàn trên thiết bị của bạn. Có thể nói được 30 ngôn ngữ và dịch sang 38 ngôn ngữ khác — không cần dùng đám mây, không cần đăng ký, không thu thập dữ liệu.
Không cần thẻ tín dụng. Có thể sử dụng ngoại tuyến sau khi cài đặt.
Chức năng chuyển giọng nói thành văn bản chuyên nghiệp, được trang bị bộ xử lý Qwen3-ASR kèm tối ưu hóa GGUF.
Mọi từ bạn nói đều được xử lý ngay trên thiết bị của bạn. Không có gì được gửi đến máy chủ cả. Dữ liệu của bạn sẽ luôn ở lại trên máy của bạn.
Được vận hành bởi Qwen3-ASR. Bạn có thể chọn ngôn ngữ cụ thể hoặc để công cụ tự nhận diện. 22 phương ngữ tiếng Trung sẽ được nhận diện tự động.
Tencent Hunyuan MT2 — chất lượng dịch thuật tương đương với Google Gemini 3.1 Pro trên bài kiểm tra FLORES-200 (XCOMET-XXL), hoạt động hoàn toàn trên máy của bạn. Có thể dùng để dịch bất kỳ nội dung ghi âm, kết quả nhập liệu bằng giọng nói, hay tệp phụ đề SRT/VTT nào.
Tải mô hình một lần (khoảng 1–3 GB đối với công cụ ASR; tùy chọn khoảng 1 hoặc 4,3 GB đối với công cụ dịch thuật). Sau khi thiết lập xong thì không cần kết nối Internet nữa.
0,6 tỷ mô hình dành cho máy tính xách tay và GPU tích hợp, 1,7 tỷ mô hình để đạt độ chính xác cao hơn với âm thanh có dấu phụ hoặc nhiễu. Bạn có thể thay đổi mô hình bất cứ lúc nào thông qua mục Cài đặt → Các mô hình.
Tùy chỉnh giọng nói theo phong cách riêng của bạn bằng LoRA — xử lý toàn bộ quy trình ngay trên máy của bạn. Tự động lưu các điều chỉnh từ việc sử dụng hàng ngày, và tự động xuất thành tập tin GGUF khi hoàn tất. Miễn phí kèm theo mọi giấy phép trả phí.
Giấy phép vĩnh viễn. Không phí hàng tháng, không giới hạn sử dụng, không đếm số lần sử dụng. Mua một lần, truy cập trọn đời.
Tính năng ức chế nhiễu DeepFilter có thể được sử dụng cho các bản ghi âm trong môi trường ồn ào. Tính năng này tắt theo mặc định – hãy kích hoạt nó từ menu xuất hiện khi cần thiết.
Giữ phím F9, nói lên nội dung muốn dịch, văn bản sẽ xuất hiện tại vị trí con trỏ đang ở. Các loại chip dịch tự chọn sẽ gõ ra văn bản đã được dịch thay thế — nói bằng một ngôn ngữ, gõ bằng ngôn ngữ khác.
Cả hai đều sử dụng cùng một kiến trúc Qwen3-ASR. Hãy chọn một trong số chúng, sau đó có thể thay đổi bất kỳ lúc nào thông qua mục Cài đặt → Mô hình.
Giá trị mặc định dành cho máy tính xách tay và GPU tích hợp. Hoạt động trên bất kỳ card đồ họa Vulkan nào có dung lượng trên 4 GB. Chất lượng xuất sắc so với kích thước của nó.
Độ chính xác cao hơn với các tập tin âm thanh có dấu nhấn nguyên âm hoặc nhiễu. Hoạt động tốt trên VRAM 6 GB+. Là giải pháp ASR mở tiên tiến nhất hiện nay.
Có thể tải các phần mở rộng tùy chọn theo yêu cầu từ Mục Cài đặt → Các mô hình:
Công cụ căn chỉnh cưỡng bức (~540 MB) dành cho thời điểm ghi nhận ở cấp độ từ · Hunyuan MT2 Fast (~1 GB) hoặc Chất lượng (Khoảng 4,3 GB) dành cho việc dịch.
| Tính năng | Brethof Voice Pro | Rồng | Google STT | Otter.ai | Whisper (OSS) |
|---|---|---|---|---|---|
| Xử lý hoàn toàn tại chỗ | ✓ | ✓ | ✗ | ✗ | ✓ |
| Giấy phép vĩnh viễn | ✓ | ~ | ✗ | ✗ | ✓ |
| Hỗ trợ Linux nguyên bản | ✓ | ✗ | ~ | ✗ | ✓ |
| Hỗ trợ Windows bản gốc | ✓ | ✓ | ~ | ✗ | ~ |
| 30 ngôn ngữ ASR + tự nhận diện | ✓ | ✗ | ✓ | ~ | ✓ |
| Dịch ngoại tuyến (38 ngôn ngữ) | ✓ | ✗ | ✗ | ✗ | ✗ |
| Tăng tốc bằng GPU (NVIDIA + AMD + Intel) | ✓ | ✗ | Không có nội dung cần dịch. | Không có nội dung cần dịch. | ~ |
| Điều chỉnh tinh chỉnh mô hình cá nhân (LoRA) | ✓ | ✓ | ✗ | ✗ | ✗ |
| Máy chủ MCP dành cho các tác nhân AI | ✓ | ✗ | ✗ | ✗ | ✗ |
| Chức năng giảm nhiễu tích hợp | ✓ | ✓ | ✓ | ✓ | ✗ |
| Chèn văn bản trực tiếp | ✓ | ✓ | ✗ | ✗ | ✗ |
| Giao diện người dùng máy tính được tối ưu hóa | ✓ | ✓ | ✗ | ✓ | ✗ |
| Chi phí thông thường | $49 một lần | 350 đô la+/năm | 17 đô la/m tháng | 17 đô la/m tháng | Miễn phí |
Không phí hàng tháng. Không giới hạn việc sử dụng. Giấy phép vĩnh viễn kèm theo 1 năm cập nhật.
Không cần thẻ tín dụng. Chỉ cần gửi email để xác minh phiên bản dùng thử.
Giấy phép vĩnh viễn. 2 thiết bị cá nhân. Bao gồm cập nhật trong 1 năm.
Giá chưa bao gồm thuế. Phí cập nhật năm nào là 20 đô la (tùy chọn).
Giấy phép vĩnh viễn theo mỗi máy. Dành cho các nhóm và tổ chức. Có bản cập nhật trong 1 năm.
Giá chưa bao gồm thuế. Phí cập nhật (tùy chọn) là 20 đô la/mỗi chỗ ngồi/năm.
Không. Brethof Voice Pro xử lý mọi thứ ngay trên thiết bị của bạn. Không có dữ liệu âm thanh hay văn bản nào rời khỏi máy tính của bạn cả. Không có thành phần dựa trên đám mây, không có việc thu thập dữ liệu từ xa, và cũng không có chức năng phân tích dữ liệu.
Bất kỳ GPU hiện đại nào cũng có thể sử dụng được. Các dòng NVIDIA, AMD và Intel Arc đều tận dụng công nghệ tăng tốc Vulkan. Bạn cũng có thể chạy ứng dụng chỉ trên CPU, mặc dù tốc độ chuyển đổi văn bản sẽ chậm hơn. Mô hình 0.6B hoạt động tốt trên các card đồ họa tích hợp hoặc bất kỳ card có dung lượng VRAM 4 GB trở lên và hỗ trợ Vulkan.
Bắt đầu với Mô hình 0.6B — Đây là tùy chọn mặc định được khuyến nghị và hoạt động rất tốt trên hầu hết các GPU (và thậm chí cả trên CPU của những máy tính hiện đại). Nếu bạn cần độ chính xác cao hơn với các tập tin âm thanh có dấu phụ hoặc nhiễu, hãy chuyển sang Mô hình 1,7 tỷ (Cần ít nhất 6 GB VRAM). Bạn có thể thay đổi kích thước bất cứ lúc nào thông qua mục Cài đặt → Mô hình mà không cần tải lại.
Vâng. Brethof Voice Pro hỗ trợ cả Linux lẫn Windows một cách tự nhiên. Trên Linux, nó hoạt động tốt với cả X11 và Wayland. Trên Windows, nó chạy như một ứng dụng máy tính để bàn thông thường.
Giấy phép sử dụng của bạn là vĩnh viễn — ứng dụng sẽ tiếp tục hoạt động mãi với bất kỳ phiên bản nào mà bạn đang có. Gói cập nhật có giá 20 đô la mỗi năm cho phép bạn truy cập vào các tính năng mới và những cải tiến về mô hình. Nếu không mua gói này, bạn sẽ chỉ sử dụng phiên bản hiện tại của ứng dụng.
Vâng — chức năng luyện giọng cá nhân có sẵn trong phiên bản v2.0.0 và được xử lý hoàn toàn trên máy của bạn. Mỗi lần bạn sửa một từ bị nhận diện sai, cặp dữ liệu {clip, correction} sẽ tự động được lưu vào tập dữ liệu huấn luyện cục bộ của bạn. Thẻ huấn luyện trên giao diện chính hiển thị ngay tổng số mẫu và thời gian ghi âm — hãy nhấp vào “Bắt đầu huấn luyện” trong tab Huấn luyện để tinh chỉnh mô hình LoRA phù hợp với giọng nói của bạn. Kết quả sẽ được xuất tự động dưới định dạng GGUF và bạn có thể chuyển sang sử dụng nó chỉ với một cú nhấp chuột. Dịch vụ này miễn phí đi kèm mọi giấy phép trả phí, và dữ liệu giọng nói của bạn sẽ không bao giờ rời khỏi máy của bạn.
Thử nghiệm miễn phí 14 ngày. Không cần thẻ tín dụng. Không cần dịch vụ đám mây. Không đánh đổi gì cả.
Chức năng chuyển đổi giọng nói thành văn bản tại chỗ, có khả năng học giọng nói của bạn. Giấy phép sử dụng vĩnh viễn. Sản phẩm nổi bật nhất của chúng tôi.
CÓ PHÍ · flagship
Bộ nhớ dài hạn cục bộ cho Claude Code — tìm kiếm toàn văn + vector + đồ thị, trên SurrealDB. MIT.
MIỄN PHÍ · mã nguồn mở
Các mô hình kỹ thuật số sẵn sàng in ấn. Bao gồm định dạng STL/3MF/OBJ. Truy cập trọn đời.
CÓ PHÍ · danh mục kỹ thuật số
Các thiết kế in ấn của chúng tôi được vận chuyển khắp châu Âu. Hãy mua sản phẩm, không phải tệp tin.
CÓ PHÍ · vật thể vật lý
Máy chủ AI Cyber-tiger. Giải thích về AI lấy quyền riêng tư làm trọng tâm một cách trực diện, không qua bộ lọc của các tập đoàn.
KÊNH · trực tiếp
Các danh sách được chọn lọc trên GitHub dành cho AI, MCP, AI cục bộ, Linux cho AI, và nhiều hơn nữa. Bằng chứng thực tế, không chỉ là cảm giác.
MIỄN PHÍ · được tuyển chọn kỹ lưỡng
Hướng dẫn chi tiết về cách triển khai AI tại chỗ trên Linux, Windows, macOS. Các cấu hình thực tế, không phải nội dung quảng cáo.
MIỄN PHÍ · sắp ra mắt
Các biểu đồ ComfyUI đã được kiểm thử trong sản xuất — LTX chunked-loop, pipeline Nova, và nhiều hơn nữa.
MIỄN PHÍ · trang đích quy trình làm việc
Chỉnh sửa tiêu cực: các phương pháp và công cụ lãng phí thời gian của bạn, được xếp hạng. Cần có bằng chứng.
MIỄN PHÍ · sắp ra mắt
Chúng tôi là ai, lý do xây dựng AI ưu tiên tính địa phương, và những điều chúng tôi không làm.