Cập nhật — Brethof Voice Pro

Phát hành Ngày 21 tháng 5 năm 2026

v2.0.0 — Dịch ngoại tuyến bằng 38 ngôn ngữ

Brethof Voice Pro không còn chỉ là công cụ chuyển giọng nói thành văn bản nữa. Phiên bản 2.0.0 đã được phát hành. dịch ngoại tuyến được vận hành bởi Tencent Hunyuan MT2 — trên FLORES-200 (XCOMET-XXL), cấp độ 7B đạt được 97,9% của Google Gemini 3.1 ProNó còn vượt trội hơn Gemini trong các bài kiểm tra thực tế và các ngôn ngữ thiểu số. Quá trình dịch diễn ra hoàn toàn trên máy của bạn. Có hai cấp độ mô hình, được tải xuống theo yêu cầu: Loại nhanh (~1 GB, xử lý xong trong vòng vài phần giây trên CPU hoặc GPU) và loại chất lượng cao (~4,3 GB, xử lý xong trong vòng vài phần giây trên GPU). Ngoài ra còn có một số tính năng được mong đợi từ lâu.

Những điều mới trong phiên bản 2.0.0:

Ghi âm và dịch — Cửa sổ pop-up Transcribe có trường thả xuống “Dịch sang:”. Qwen3-ASR dùng để ghi âm, Hunyuan MT2 dùng để dịch; cả hai đều hiển thị kết quả song song nhau. Có thể sử dụng với các tập tin, micrô, và âm thanh hệ thống (âm thanh từ các cuộc gọi họp, tab trình duyệt, bất cứ thứ gì đang phát ra từ loa của bạn).
Bàn phím giọng nói đa ngôn ngữ — Vi mạch dịch thuật mới ở hàng chính tạo ra một bảng ngôn ngữ gồm 3 cột. Chọn một hoặc nhiều ngôn ngữ đích, bàn phím sẽ gõ ra kết quả dịch. Các chế độ bố trí: một dòng một ngôn ngữ, chèn ngay trong văn bản.EN: … || PL: …), hoặc chỉ mục tiêu đầu tiên.
Chương trình dịch phụ đề SRT / VTT — Giữ nguyên thời điểm phát và các chỉ số gợi ý, hỗ trợ chế độ song ngữ (dòng nguồn + bản dịch cho mỗi gợi ý). Được cung cấp thông qua MCP để tự động hóa các tác vụ của trí tuệ nhân tạo.
Nhiều GPU trên mỗi engine — Mục Cài đặt → Mô hình có bộ chọn thiết bị riêng biệt cho từng công cụ xử lý. Hãy chạy chức năng ASR trên Vulkan 0 và chức năng dịch thuật trên Vulkan 1, hoặc gán Hunyuan MT2 7B cho CPU trên những chiếc máy tính xách tay có lượng VRAM hạn chế.
Huấn luyện giọng nói cá nhân được thực hiện hoàn toàn trực tiếp. — Tinh chỉnh LoRA dựa trên giọng nói của riêng bạn, toàn bộ quy trình diễn ra ngay trên máy tính của bạn. Trên khung cửa sổ chính, tab Huấn luyện hiển thị tổng số mẫu và thời gian ghi âm một cách nhanh chóng; tùy chọn “Bắt đầu huấn luyện” trong tab Huấn luyện sẽ tự động chọn NVIDIA CUDA hoặc CPU, sau đó tự động xuất mô hình đã được huấn luyện sang định dạng GGUF. Tính năng này được cung cấp miễn phí kèm theo mọi giấy phép trả phí.
4 công cụ MCP mới — translate_text, translate_srt, list_compute_devices, set_compute_deviceTổng số công cụ hiện tại là 19.
Ngôn ngữ chân thực tạo nên sự phân chia — ASR: 30 ngôn ngữ có thể chọn + tự nhận diện ngôn ngữ + 22 phương ngữ tiếng Trung (tổng cộng 52 ngôn ngữ). Dịch thuật: 38 ngôn ngữ (33 ngôn ngữ chính + 5 ngôn ngữ của các dân tộc thiểu số khu vực Trung Quốc). Có 23 cặp ngôn ngữ hỗ trợ dịch hai chiều.

Tập tin nhị phân của Linux có kích thước 161 MB, trình cài đặt của Windows là 118 MB. Giá bán vẫn giữ nguyên: 49 đô la cho phiên bản cá nhân, 149 đô la cho phiên bản doanh nghiệp. Các giấy phép hiện có vẫn được áp dụng — chỉ cần Tải về phiên bản 2.0.0 Các mô hình dịch sẽ xuất hiện trong mục Settings → Models.

Tải v2.0.0 →

Phát hành Ngày 20 tháng 5 năm 2026

v1.6.16 — Chức năng luyện giọng cá nhân đã có sẵn

Quy trình huấn luyện đã được phát hành. Việc tinh chỉnh LoRA bằng giọng nói của riêng bạn giờ đây có thể được thực hiện hoàn toàn trên máy của bạn — ứng dụng sẽ tự động chọn NVIDIA CUDA or CPUSau đó, nó sẽ tự động xuất mô hình đã được huấn luyện thành định dạng GGUF khi hoàn tất. Mọi thay đổi bạn thực hiện trong giao diện người dùng đều được lưu tự động vào bộ dữ liệu huấn luyện cục bộ của bạn; bảng thông tin huấn luyện ở cửa sổ chính cho phép bạn xem tổng số mẫu và thời gian huấn luyện một cách nhanh chóng.

Ưu đãi: Độ chính xác của bàn phím giọng nói được cải thiện trên tất cả các ngôn ngữ nhờ bản cập nhật llama.cpp (bản b9222), vốn đã khắc phục lỗi liên quan đến ranh giới đoạn dữ liệu trong các đoạn clip dài. Được cung cấp miễn phí kèm theo mọi giấy phép trả phí.

Kỹ thuật Ngày 15 tháng 5 năm 2026

v1.6.0 — Các công việc chuyển đổi phi tuyến tính + chỉnh sửa SRT ở cấp độ từ

Hai công cụ MCP mới đã được ra mắt: start_transcription trả về ID công việc ngay lập tức để nhân viên có thể thực hiện các công việc khác, và get_transcription_status Khảo sát để hoàn thành công việc. Thực hiện một nhiệm vụ mỗi lần, kết quả sẽ được hiển thị ngay khi hoàn thành. Các tập tin dài không còn làm tắc nghẽn vòng lặp xử lý của trình điều khiển nữa.

Cùng với một loạt các cải tiến dành cho đầu ra SRT/VTT ở cấp độ từ ngữ: không còn khoảng trắng thừa trước dấu chấm phẩy, không còn các ký hiệu dấu chấm đơn lẻ, không còn tình trạng các từ khóa quan trọng hoặc chuỗi văn bản ngữ cảnh lọt vào bản ghi âm. Phụ đề sẽ sạch sẽ hơn, không cần phải chỉnh sửa thủ công nữa.

Kỹ thuật Ngày 15 tháng 5 năm 2026

v1.5.0 — Loại bỏ ONNX, thời gian chạy giờ đây chỉ sử dụng llama.cpp + libmtmd mà thôi

Viết lại toàn bộ engine. Brethof Voice Pro hiện sử dụng Qwen3-ASR để xử lý mọi công việc từ đầu đến cuối. llama.cpp thông qua các trọng số được định lượng dạng GGUF libmtmdONNX Runtime đã bị loại bỏ. Kết quả là kích thước tập tin cài đặt giảm (tập tin nhị phân chỉ còn khoảng 83 MB, so với hơn 400 MB trước đây), thời gian khởi động nhanh hơn, và không còn phải đối mặt với các vấn đề liên quan đến phiên bản CUDA/DirectML dành cho từng nền tảng nữa.

Vulkan sẽ tự động nhận diện GPU của bạn — dù đó là NVIDIA, AMD hay Intel Arc — và sử dụng CPU làm giải pháp thay thế khi không có GPU. Cùng một nền tảng này hiện đang cung cấp nguồn lực cho tất cả các tính năng khác: ASR, bàn phím giọng nói, máy chủ MCP, và tính năng dịch thuật (đã có trong phiên bản 2.0.0).

Kỹ thuật Ngày 14 tháng 5 năm 2026

v1.4.0 — Ra mắt server MCP + công cụ chọn thiết bị đa GPU

Server của Protocol Môi trường Mô hình đã khởi động. Bất kỳ agent AI nào tương thích với MCP — Claude Desktop, Claude Code, Con trỏ, Cline — có thể xử lý việc chuyển đổi văn bản sang dạng âm thanh thông qua stdio (không cần cổng kết nối, không cần tường lửa). Phiên bản này cũng đi kèm với bộ chọn thiết bị multi-GPU vì vậy bạn có thể chọn GPU Vulkan nào sẽ được dùng để xử lý ASR, cùng với các tùy chọn khác. Công cụ căn chỉnh cưỡng bức Phần mở rộng để thêm thời điểm ghi âm ở cấp độ từ trong mỗi bản chuyển dịch.

Chỉ dành cho gói trả phí — máy chủ MCP từ chối khởi động nếu không có giấy phép cá nhân hoặc doanh nghiệp. brethof-voice --mcp Đó chính là cách gọi một dòng.

Kế hoạch phát triển 16 tháng 4 năm 2026

Phiên bản macOS đang được phát triển — Đầu tiên dành cho Apple Silicon

Câu hỏi được đặt nhiều nhất trước khi phát hành là “khi nào có macOS?”. Câu trả lời: đang trong quá trình phát triển. Phiên bản dành riêng cho Apple Silicon với tốc độ xử lý được tăng cường nhờ Metal sẽ được phát hành trước, tiếp theo là phiên bản dành cho Intel. Dự kiến phát hành vào quý 3 năm 2026 — chúng tôi sẽ mở chương trình beta đóng vào quý 2. Đây là những gì đang được phát triển và cách để đăng ký tham gia.

Đọc bài viết →

Sản phẩm 16 tháng 4 năm 2026

Đào tạo mô hình cá nhân — điều chỉnh Brethof Voice Pro cho phù hợp với giọng nói của riêng bạn

Chức năng luyện giọng cá nhân có sẵn ngay trong Voice Pro. Mỗi lần bạn sửa một từ bị nhận diện sai, đoạn âm thanh kèm lời sửa đổi sẽ được lưu tự động vào bộ dữ liệu luyện tập cá nhân của bạn. Chỉ cần nhấp một lần vào tab Luyện tập là có thể điều chỉnh mô hình LoRA phù hợp với giọng nói của bạn – ứng dụng sẽ tự động chọn NVIDIA CUDA hoặc CPU, sau đó xuất mô hình đã được luyện tập sang định dạng GGUF. Tính năng này được cung cấp miễn phí kèm theo mọi giấy phép trả phí.

Đọc bài viết →

Thông báo 16 tháng 4 năm 2026

Brethof Voice Pro đã có mặt trên thị trường — công cụ chuyển giọng nói thành văn bản hoạt động ngay trên máy của bạn

Sau nhiều tháng nghiên cứu phát triển, phiên bản Voice Pro v1.0 cuối cùng cũng được phát hành hôm nay cho hệ điều hành Windows và Linux. Phần mềm hỗ trợ 30 ngôn ngữ dịch thuật cùng 22 phương ngữ tiếng Trung, chức năng ghi âm hoàn toàn ngoại tuyến, khả năng gõ văn bản bằng phím tắt ở bất kỳ đâu, và mức giá chỉ trả một lần mà không cần đăng ký thuê bao. Dưới đây là những tính năng có trong phiên bản ra mắt cùng những dự án chúng tôi đang tiếp tục phát triển.

Đọc bài viết →

Những nhà vô địch 16 tháng 4 năm 2026

Có 1.800 giấy phép miễn phí để nhận: Chương trình Champions đã mở cửa.

Chương trình Champions bắt đầu từ hôm nay và kéo dài đến ngày 16 tháng 5. Có 50 giấy phép cá nhân miễn phí cho mỗi ngôn ngữ được hỗ trợ – tổng cộng 1.800 giấy phép – cùng mức chiết khấu 70% dành cho tất cả những người tham gia vòng loại không nằm trong top 50. Dưới đây là cách thức hoạt động của chương trình và lý do chúng tôi chọn cách tiếp cận này.

Đọc bài viết →

Cấp phép 16 tháng 4 năm 2026

Giấy phép cá nhân hiện đã bao gồm cả hoạt động kinh doanh độc lập và công việc tự do.

Chúng tôi đã lắng nghe phản hồi từ các nhà viết, chuyên gia tư vấn và dịch giả, những người cho rằng điều khoản “chỉ dành cho mục đích sử dụng cá nhân” cũ gây hiểu lầm. Giấy phép Personal với giá 49 đô la giờ đây đã nêu rõ rằng nó cho phép sử dụng trong mục đích thương mại, dù là cá nhân hay làm việc tự do. Giấy phép dành cho doanh nghiệp (149 đô la/máy) được dành cho các nhóm. Dưới đây là những thay đổi và lý do đằng sau chúng.

Đọc bài viết →

Sản phẩm 12 tháng 4 năm 2026

30 ngôn ngữ dịch thuật, giao diện được dịch đầy đủ — không phải đoạn văn bản được dịch tự động.

Brethof Voice Pro hiện có thể chuyển đổi giọng nói thành văn bản và hiển thị kết quả bằng 30 ngôn ngữ cùng 22 phương ngữ tiếng Trung: Ả Rập, Quảng Đông, Tiếng Trung, Séc, Đan Mạch, Hà Lan, Anh, Filipino, Phần Lan, Pháp, Đức, Hy Lạp, Hindi, Hungary, Indonesia, Ý, Nhật Bản, Hàn Quốc, Macedonia, Malay, Ba Tư, Ba Lan, Bồ Đào Nha, Romania, Nga, Tây Ban Nha, Thụy Điển, Thái Lan, Thổ Nhĩ Kỳ, Việt Nam. Dưới đây là cách ứng dụng chọn ngôn ngữ phù hợp và ý nghĩa thực sự của việc “dịch hoàn toàn”.

Đọc bài viết →

Kỹ thuật 8 tháng 4 năm 2026

Tại sao chúng tôi chuyển từ ONNX sang GGUF — nhanh hơn, nhỏ gọn hơn, dễ triển khai hơn

Phần mềm xử lý giọng nói của Brethof Voice Pro sử dụng llama.cpp cùng các mô hình Qwen được biến đổi dạng GGUF thay vì ONNX Runtime. Kết quả là kích thước tập tin cài đặt nhỏ hơn (83 MB so với hơn 400 MB), thời gian khởi động nhanh hơn, và không còn phải đối mặt với các vấn đề liên quan đến CUDA/DirectML trên mọi nền tảng nữa. Dưới đây là câu chuyện kỹ thuật đằng sau sự thay đổi này.

Đọc bài viết →

Nguyên tắc 4 tháng 4 năm 2026

Tại sao Brethof Voice Pro có thể hoạt động hoàn toàn ngoại tuyến — và tại sao đó không chỉ là một tính năng thông thường

Mọi sản phẩm ghi chép giọng nói phổ biến đều gửi dữ liệu giọng nói của người dùng qua máy chủ của bên thứ ba. Chúng tôi cho rằng đó là thiết lập mặc định sai lầm. Giọng nói chính là dữ liệu cá nhân quan trọng nhất mà chúng ta tạo ra – gồm hồ sơ y tế, bản thảo pháp lý, nhật ký riêng tư, và bí mật công việc. Đó chính là lý do tại sao Voice Pro không có chế độ cloud, không có tính năng theo dõi dữ liệu “tùy chọn”, và cũng không yêu cầu tạo tài khoản để thực hiện việc ghi chép giọng nói.

Đọc bài viết →

Nhận cập nhật qua hộp thư đến của bạn

Tạo tài khoản để nhận thông báo khi chúng tôi đăng bài mới và phát hành các phiên bản mới.

Tạo tài khoản

Sản phẩm Cập nhật

v2.0.0 — Dịch ngoại tuyến bằng 38 ngôn ngữ

v1.6.16 — Chức năng luyện giọng cá nhân đã có sẵn

v1.6.0 — Các công việc chuyển đổi phi tuyến tính + chỉnh sửa SRT ở cấp độ từ

v1.5.0 — Loại bỏ ONNX, thời gian chạy giờ đây chỉ sử dụng llama.cpp + libmtmd mà thôi

v1.4.0 — Ra mắt server MCP + công cụ chọn thiết bị đa GPU

Phiên bản macOS đang được phát triển — Đầu tiên dành cho Apple Silicon

Đào tạo mô hình cá nhân — điều chỉnh Brethof Voice Pro cho phù hợp với giọng nói của riêng bạn

Brethof Voice Pro đã có mặt trên thị trường — công cụ chuyển giọng nói thành văn bản hoạt động ngay trên máy của bạn

Có 1.800 giấy phép miễn phí để nhận: Chương trình Champions đã mở cửa.

Giấy phép cá nhân hiện đã bao gồm cả hoạt động kinh doanh độc lập và công việc tự do.

30 ngôn ngữ dịch thuật, giao diện được dịch đầy đủ — không phải đoạn văn bản được dịch tự động.

Tại sao chúng tôi chuyển từ ONNX sang GGUF — nhanh hơn, nhỏ gọn hơn, dễ triển khai hơn

Tại sao Brethof Voice Pro có thể hoạt động hoàn toàn ngoại tuyến — và tại sao đó không chỉ là một tính năng thông thường

Nhận cập nhật qua hộp thư đến của bạn

Mọi thứ chúng tôi tạo ra

Brethof Voice Pro

Brethof Mind

Mô hình 3D

In 3D

Nova

Các danh sách tuyệt vời

Hướng dẫn

Các quy trình làm việc của ComfyUI

Danh sách xếp hạng các công cụ chống vi phạm bản quyền

Về Brethof AI