Các thông báo về việc ra mắt sản phẩm, tin tức liên quan đến Chương trình Nhà vô địch, những tính năng mới, cùng những hậu trường kỹ thuật từ đội ngũ phát triển Brethof Voice Pro.
Brethof Voice Pro không còn chỉ là công cụ chuyển giọng nói thành văn bản nữa. Phiên bản 2.0.0 đã được phát hành. dịch ngoại tuyến được vận hành bởi Tencent Hunyuan MT2 — trên FLORES-200 (XCOMET-XXL), cấp độ 7B đạt được 97,9% của Google Gemini 3.1 ProNó còn vượt trội hơn Gemini trong các bài kiểm tra thực tế và các ngôn ngữ thiểu số. Quá trình dịch diễn ra hoàn toàn trên máy của bạn. Có hai cấp độ mô hình, được tải xuống theo yêu cầu: Loại nhanh (~1 GB, xử lý xong trong vòng vài phần giây trên CPU hoặc GPU) và loại chất lượng cao (~4,3 GB, xử lý xong trong vòng vài phần giây trên GPU). Ngoài ra còn có một số tính năng được mong đợi từ lâu.
Những điều mới trong phiên bản 2.0.0:
EN: … || PL: …), hoặc chỉ mục tiêu đầu tiên.translate_text, translate_srt, list_compute_devices, set_compute_deviceTổng số công cụ hiện tại là 19.Tập tin nhị phân của Linux có kích thước 161 MB, trình cài đặt của Windows là 118 MB. Giá bán vẫn giữ nguyên: 49 đô la cho phiên bản cá nhân, 149 đô la cho phiên bản doanh nghiệp. Các giấy phép hiện có vẫn được áp dụng — chỉ cần Tải về phiên bản 2.0.0 Các mô hình dịch sẽ xuất hiện trong mục Settings → Models.
Tải v2.0.0 →Quy trình huấn luyện đã được phát hành. Việc tinh chỉnh LoRA bằng giọng nói của riêng bạn giờ đây có thể được thực hiện hoàn toàn trên máy của bạn — ứng dụng sẽ tự động chọn NVIDIA CUDA or CPUSau đó, nó sẽ tự động xuất mô hình đã được huấn luyện thành định dạng GGUF khi hoàn tất. Mọi thay đổi bạn thực hiện trong giao diện người dùng đều được lưu tự động vào bộ dữ liệu huấn luyện cục bộ của bạn; bảng thông tin huấn luyện ở cửa sổ chính cho phép bạn xem tổng số mẫu và thời gian huấn luyện một cách nhanh chóng.
Ưu đãi: Độ chính xác của bàn phím giọng nói được cải thiện trên tất cả các ngôn ngữ nhờ bản cập nhật llama.cpp (bản b9222), vốn đã khắc phục lỗi liên quan đến ranh giới đoạn dữ liệu trong các đoạn clip dài. Được cung cấp miễn phí kèm theo mọi giấy phép trả phí.
Hai công cụ MCP mới đã được ra mắt: start_transcription trả về ID công việc ngay lập tức để nhân viên có thể thực hiện các công việc khác, và get_transcription_status Khảo sát để hoàn thành công việc. Thực hiện một nhiệm vụ mỗi lần, kết quả sẽ được hiển thị ngay khi hoàn thành. Các tập tin dài không còn làm tắc nghẽn vòng lặp xử lý của trình điều khiển nữa.
Cùng với một loạt các cải tiến dành cho đầu ra SRT/VTT ở cấp độ từ ngữ: không còn khoảng trắng thừa trước dấu chấm phẩy, không còn các ký hiệu dấu chấm đơn lẻ, không còn tình trạng các từ khóa quan trọng hoặc chuỗi văn bản ngữ cảnh lọt vào bản ghi âm. Phụ đề sẽ sạch sẽ hơn, không cần phải chỉnh sửa thủ công nữa.
Viết lại toàn bộ engine. Brethof Voice Pro hiện sử dụng Qwen3-ASR để xử lý mọi công việc từ đầu đến cuối. llama.cpp thông qua các trọng số được định lượng dạng GGUF libmtmdONNX Runtime đã bị loại bỏ. Kết quả là kích thước tập tin cài đặt giảm (tập tin nhị phân chỉ còn khoảng 83 MB, so với hơn 400 MB trước đây), thời gian khởi động nhanh hơn, và không còn phải đối mặt với các vấn đề liên quan đến phiên bản CUDA/DirectML dành cho từng nền tảng nữa.
Vulkan sẽ tự động nhận diện GPU của bạn — dù đó là NVIDIA, AMD hay Intel Arc — và sử dụng CPU làm giải pháp thay thế khi không có GPU. Cùng một nền tảng này hiện đang cung cấp nguồn lực cho tất cả các tính năng khác: ASR, bàn phím giọng nói, máy chủ MCP, và tính năng dịch thuật (đã có trong phiên bản 2.0.0).
Server của Protocol Môi trường Mô hình đã khởi động. Bất kỳ agent AI nào tương thích với MCP — Claude Desktop, Claude Code, Con trỏ, Cline — có thể xử lý việc chuyển đổi văn bản sang dạng âm thanh thông qua stdio (không cần cổng kết nối, không cần tường lửa). Phiên bản này cũng đi kèm với bộ chọn thiết bị multi-GPU vì vậy bạn có thể chọn GPU Vulkan nào sẽ được dùng để xử lý ASR, cùng với các tùy chọn khác. Công cụ căn chỉnh cưỡng bức Phần mở rộng để thêm thời điểm ghi âm ở cấp độ từ trong mỗi bản chuyển dịch.
Chỉ dành cho gói trả phí — máy chủ MCP từ chối khởi động nếu không có giấy phép cá nhân hoặc doanh nghiệp. brethof-voice --mcp Đó chính là cách gọi một dòng.
Câu hỏi được đặt nhiều nhất trước khi phát hành là “khi nào có macOS?”. Câu trả lời: đang trong quá trình phát triển. Phiên bản dành riêng cho Apple Silicon với tốc độ xử lý được tăng cường nhờ Metal sẽ được phát hành trước, tiếp theo là phiên bản dành cho Intel. Dự kiến phát hành vào quý 3 năm 2026 — chúng tôi sẽ mở chương trình beta đóng vào quý 2. Đây là những gì đang được phát triển và cách để đăng ký tham gia.
Đọc bài viết →Chức năng luyện giọng cá nhân có sẵn ngay trong Voice Pro. Mỗi lần bạn sửa một từ bị nhận diện sai, đoạn âm thanh kèm lời sửa đổi sẽ được lưu tự động vào bộ dữ liệu luyện tập cá nhân của bạn. Chỉ cần nhấp một lần vào tab Luyện tập là có thể điều chỉnh mô hình LoRA phù hợp với giọng nói của bạn – ứng dụng sẽ tự động chọn NVIDIA CUDA hoặc CPU, sau đó xuất mô hình đã được luyện tập sang định dạng GGUF. Tính năng này được cung cấp miễn phí kèm theo mọi giấy phép trả phí.
Đọc bài viết →Sau nhiều tháng nghiên cứu phát triển, phiên bản Voice Pro v1.0 cuối cùng cũng được phát hành hôm nay cho hệ điều hành Windows và Linux. Phần mềm hỗ trợ 30 ngôn ngữ dịch thuật cùng 22 phương ngữ tiếng Trung, chức năng ghi âm hoàn toàn ngoại tuyến, khả năng gõ văn bản bằng phím tắt ở bất kỳ đâu, và mức giá chỉ trả một lần mà không cần đăng ký thuê bao. Dưới đây là những tính năng có trong phiên bản ra mắt cùng những dự án chúng tôi đang tiếp tục phát triển.
Đọc bài viết →Chương trình Champions bắt đầu từ hôm nay và kéo dài đến ngày 16 tháng 5. Có 50 giấy phép cá nhân miễn phí cho mỗi ngôn ngữ được hỗ trợ – tổng cộng 1.800 giấy phép – cùng mức chiết khấu 70% dành cho tất cả những người tham gia vòng loại không nằm trong top 50. Dưới đây là cách thức hoạt động của chương trình và lý do chúng tôi chọn cách tiếp cận này.
Đọc bài viết →Chúng tôi đã lắng nghe phản hồi từ các nhà viết, chuyên gia tư vấn và dịch giả, những người cho rằng điều khoản “chỉ dành cho mục đích sử dụng cá nhân” cũ gây hiểu lầm. Giấy phép Personal với giá 49 đô la giờ đây đã nêu rõ rằng nó cho phép sử dụng trong mục đích thương mại, dù là cá nhân hay làm việc tự do. Giấy phép dành cho doanh nghiệp (149 đô la/máy) được dành cho các nhóm. Dưới đây là những thay đổi và lý do đằng sau chúng.
Đọc bài viết →Brethof Voice Pro hiện có thể chuyển đổi giọng nói thành văn bản và hiển thị kết quả bằng 30 ngôn ngữ cùng 22 phương ngữ tiếng Trung: Ả Rập, Quảng Đông, Tiếng Trung, Séc, Đan Mạch, Hà Lan, Anh, Filipino, Phần Lan, Pháp, Đức, Hy Lạp, Hindi, Hungary, Indonesia, Ý, Nhật Bản, Hàn Quốc, Macedonia, Malay, Ba Tư, Ba Lan, Bồ Đào Nha, Romania, Nga, Tây Ban Nha, Thụy Điển, Thái Lan, Thổ Nhĩ Kỳ, Việt Nam. Dưới đây là cách ứng dụng chọn ngôn ngữ phù hợp và ý nghĩa thực sự của việc “dịch hoàn toàn”.
Đọc bài viết →Phần mềm xử lý giọng nói của Brethof Voice Pro sử dụng llama.cpp cùng các mô hình Qwen được biến đổi dạng GGUF thay vì ONNX Runtime. Kết quả là kích thước tập tin cài đặt nhỏ hơn (83 MB so với hơn 400 MB), thời gian khởi động nhanh hơn, và không còn phải đối mặt với các vấn đề liên quan đến CUDA/DirectML trên mọi nền tảng nữa. Dưới đây là câu chuyện kỹ thuật đằng sau sự thay đổi này.
Đọc bài viết →Mọi sản phẩm ghi chép giọng nói phổ biến đều gửi dữ liệu giọng nói của người dùng qua máy chủ của bên thứ ba. Chúng tôi cho rằng đó là thiết lập mặc định sai lầm. Giọng nói chính là dữ liệu cá nhân quan trọng nhất mà chúng ta tạo ra – gồm hồ sơ y tế, bản thảo pháp lý, nhật ký riêng tư, và bí mật công việc. Đó chính là lý do tại sao Voice Pro không có chế độ cloud, không có tính năng theo dõi dữ liệu “tùy chọn”, và cũng không yêu cầu tạo tài khoản để thực hiện việc ghi chép giọng nói.
Đọc bài viết →Tạo tài khoản để nhận thông báo khi chúng tôi đăng bài mới và phát hành các phiên bản mới.
Tạo tài khoảnChức năng chuyển đổi giọng nói thành văn bản tại chỗ, có khả năng học giọng nói của bạn. Giấy phép sử dụng vĩnh viễn. Sản phẩm nổi bật nhất của chúng tôi.
CÓ PHÍ · flagship
Bộ nhớ dài hạn cục bộ cho Claude Code — tìm kiếm toàn văn + vector + đồ thị, trên SurrealDB. MIT.
MIỄN PHÍ · mã nguồn mở
Các mô hình kỹ thuật số sẵn sàng in ấn. Bao gồm định dạng STL/3MF/OBJ. Truy cập trọn đời.
CÓ PHÍ · danh mục kỹ thuật số
Các thiết kế in ấn của chúng tôi được vận chuyển khắp châu Âu. Hãy mua sản phẩm, không phải tệp tin.
CÓ PHÍ · vật thể vật lý
Máy chủ AI Cyber-tiger. Giải thích về AI lấy quyền riêng tư làm trọng tâm một cách trực diện, không qua bộ lọc của các tập đoàn.
KÊNH · trực tiếp
Các danh sách được chọn lọc trên GitHub dành cho AI, MCP, AI cục bộ, Linux cho AI, và nhiều hơn nữa. Bằng chứng thực tế, không chỉ là cảm giác.
MIỄN PHÍ · được tuyển chọn kỹ lưỡng
Hướng dẫn chi tiết về cách triển khai AI tại chỗ trên Linux, Windows, macOS. Các cấu hình thực tế, không phải nội dung quảng cáo.
MIỄN PHÍ · sắp ra mắt
Các biểu đồ ComfyUI đã được kiểm thử trong sản xuất — LTX chunked-loop, pipeline Nova, và nhiều hơn nữa.
MIỄN PHÍ · trang đích quy trình làm việc
Chỉnh sửa tiêu cực: các phương pháp và công cụ lãng phí thời gian của bạn, được xếp hạng. Cần có bằng chứng.
MIỄN PHÍ · sắp ra mắt
Chúng tôi là ai, lý do xây dựng AI ưu tiên tính địa phương, và những điều chúng tôi không làm.