اخبار مربوط به راهاندازی، خبرهای مربوط به برنامه قهرمانان، ویژگیهای جدید، و اطلاعات فنی پشت صحنه از سوی تیم Brethof Voice Pro.
Brethof Voice Pro دیگر صرفاً یک ابزار تبدیل صدا به متن نیست؛ نسخه ۲.۰.۰ منتشر شده است. ترجمه آفلاین توسط Tencent پشتیبانی میشود. Hunyuan MT2 — در FLORES-200 (XCOMET-XXL)، سطح 7B به آنجا میرسد ۹۷.۹٪ از Google Gemini 3.1 Proو این مدل در تستهای دنیای واقعی و زبانهای اقلیت، از Gemini پیشی میگیرد. فرآیند ترجمه کاملاً روی دستگاه شما انجام میشود. دو سطح مدل وجود دارد که به صورت درخواستی دانلود میشوند: سریع (حدود ۱ گیگابایت، کمتر از یک ثانیه روی CPU یا GPU) و با کیفیت (حدود ۴.۳ گیگابایت، کمتر از یک ثانیه روی GPU). علاوه بر این، چندین افزودنی مورد انتظار نیز وجود دارد.
چه چیزهایی در نسخه ۲.۰.۰ جدید است:
EN: … || PL: …)، یا فقط هدف اول.translate_text, translate_srt, list_compute_devices, set_compute_deviceتعداد کل ابزارها اکنون ۱۹ عدد است.فایل باینری لینوکس ۱۶۱ مگابایت و فایل نصب ویندوز ۱۱۸ مگابایت است. قیمتهای عرضه یکسان است: ۴۹ دلار برای نسخه شخصی و ۱۴۹ دلار برای نسخه تجاری. مجوزهای موجود ادامهدار هستند — فقط دانلود نسخه 2.0.0 و مدلهای ترجمه در بخش Settings → Models نمایان خواهند شد.
دانلود نسخه 2.0.0 →چرخه آموزشی منتشر شد. تنظیم دقیق LoRA برای صدای خودتان اکنون بهطور کامل روی دستگاه شما اجرا میشود — اپلیکیشن بهطور خودکار انتخاب میکند. CUDA از NVIDIA or پردازنده مرکزیسپس پس از اتمام کار، مدل آموزشدیده را به صورت خودکار به فرمت GGUF صادر میکند. هر تغییری که در رابط کاربری اعمال کنید، به طور خودکار در مجموعه دادههای آموزشی محلی شما ذخیره میشود؛ کارت آموزش در پنجره اصلی، تعداد کل نمونهها و زمان صرف شده را به سرعت نشان میدهد.
پاداش: دقت صفحهکلید صوتی در تمام زبانها به لطف بهروزرسانی llama.cpp (نسخه b9222) که مشکل فروپاشی مرز بخشها در ویدیوهای بلند را برطرف کرده است، بهبود یافته است. این ویژگی بهطور رایگان همراه با هر مجوز پولی ارائه میشود.
دو ابزار جدید MCP معرفی شدند: start_transcription بلافاصله شماره کار را برمیگرداند تا نماینده بتواند کارهای دیگری انجام دهد، و get_transcription_status نظرسنجیها برای تکمیل انجام میشوند؛ هر کار به تنهایی، و نتیجه پس از اتمام درج میگردد. فایلهای بزرگ دیگر مانع چرخه عملیاتی ابزار نمیشوند.
همچنین مجموعهای از اصلاحات برای خروجی SRT/VTT در سطح کلمات: دیگر فاصلههای اضافی قبل از علائم نگارشی وجود ندارد، دیگر نشانههای تکنقطهای وجود ندارد، و دیگر رشتههای کلمات/زمینه مرتبط به متن ثبتشده نفوذ نمیکنند. زیرنویسهای تمیزتری که نیازی به پاکسازی دستی ندارند.
نوشتن مجدد کامل موتور. Brethof Voice Pro اکنون Qwen3-ASR را به صورت کامل از ابتدا تا انتها اجرا میکند. llama.cpp با وزنهای کوانتیزهشده GGUF از طریق libmtmdONNX Runtime دیگر وجود ندارد. پیامدها عبارتند از: اندازهی کمتر برنامهی نصبشده (فایل باینری حدود ۸۳ مگابایت، در مقایسه با بیش از ۴۰۰ مگابایت)، زمان شروع سریعتر، و دیگر نیازی به سر و کار داشتن با فایلهای CUDA/DirectML مخصوص هر پلتفرم.
Vulkan به طور خودکار GPU شما را — چه NVIDIA، چه AMD، یا Intel Arc — شناسایی میکند و در صورت عدم وجود GPU، از CPU به عنوان جایگزین استفاده میکند. همین موتور اکنون تمام ویژگیهای مرتبط را پشتیبانی میکند: ASR، صفحهکلید صوتی، سرور MCP، و همچنین ترجمه (که از نسخه ۲.۰.۰ در دسترس است).
سرور پروتکل زمینه مدل فعال شد. هر عامل هوش مصنوعی سازگار با MCP — Claude Desktop, Claude Code, نشانگر موس, کلاین — میتواند فرآیند ترجمه را از طریق stdio انجام دهد (بدون نیاز به پورت یا فایروال). همین نسخه شامل… انتخابکننده دستگاه چندGPU بنابراین میتوانید تعیین کنید کدام GPU Vulkan برای پردازش ASR استفاده میشود، همراه با گزینههای اختیاری. تطبیق اجباری افزونهای برای اضافه کردن زمانبندی در سطح کلمات در هر ترجمه صوتی.
فقط در سطح پریمیوم: سرور MCP بدون داشتن مجوز شخصی یا تجاری اجازه راهاندازی نمیشود. brethof-voice --mcp این همان فراخوانی یکخطی است.
پرسش رایج قبل از عرضه این سیستم این بود که «مکاواس چه زمانی منتشر میشود؟» پاسخ: در حال توسعه فعال است. ابتدا نسخه مخصوص تراشههای Apple Silicon با استفاده از سرعتبخش Metal منتشر خواهد شد و سپس نسخه مبتنی بر Intel. هدف، فصل سوم سال ۲۰۲۶ است — و ما در فصل دوم یک بتا بسته را راهاندازی خواهیم کرد. در ادامه اطلاعاتی درباره آنچه در حال ساخت است و نحوه ثبتنام ارائه شده است.
متن را بخوانید →آموزش صدای شخصی در Voice Pro به صورت زنده انجام میشود. هر بار که یک کلمه را که به درستی تشخیص داده نشده بود، اصلاح میکنید، فایل صوتی مربوطه همراه با اصلاحات به طور خودکار در مجموعه داده آموزشی شما ذخیره میشود. کافی است یک بار روی تب آموزش کلیک کنید تا یک مدل LoRA بر اساس لهجه شما تنظیم شود؛ اپلیکیشن به طور خودکار از NVIDIA CUDA یا CPU استفاده میکند و سپس مدل آموزش داده شده را به فرمت GGUF صادر میکند. این قابلیت به همراه هر مجوز پولی در دسترس است.
متن را بخوانید →پس از ماهها کار مهندسی، نسخه 1.0 از Brethof Voice Pro امروز برای سیستمعاملهای Windows و Linux منتشر شد. این نرمافزار دارای ۳۰ زبان ترجمه صوتی و ۲۲ گویش چینی، قابلیت ترجمه صوتی کاملاً آفلاین، امکان دیکته با استفاده از کلیدهای میانبر در هر جا، و قیمتی یکباره بدون نیاز به اشتراک است. در ادامه مواردی که باعث گنجانده شدن آن در نسخه اولیه شدند و پروژههایی که در حال کار بر روی آنها هستیم، آورده شده است.
متن را بخوانید →برنامه Champions امروز آغاز میشود و تا ۱۶ مه ادامه خواهد داشت. پنجاه مجوز شخصی رایگان برای هر زبان پشتیبانیشده – در مجموع ۱٬۸۰۰ مجوز – به همراه تخفیف ۷۰ درصدی برای تمام شرکتکنندگانی که جزو ۵۰ نفر برتر قرار نمیگیرند. در ادامه نحوه عملکرد این برنامه و دلایل انجام آن به این شکل توضیح داده شده است.
متن را بخوانید →ما نظرات اولیه نویسندگان، مشاوران و مترجمان را بررسی کردیم؛ آنها معتقد بودند که عبارت قدیمی «فقط برای استفاده شخصی» گیجکننده است. مجوز شخصی با قیمت ۴۹ دلار اکنون به طور صریح شامل استفاده تجاری توسط افراد تنها و فریلنسرها میشود. مجوز تجاری (۱۴۹ دلار برای هر نفر) برای تیمها در نظر گرفته شده است. در ادامه تغییرات و دلایل آنها آمده است.
متن را بخوانید →Brethof Voice Pro اکنون متنها را به ۳۰ زبان و همچنین ۲۲ گویش چینی ترجمه و نمایش میدهد: عربی، کانتونی، چینی، چکی، دانمارکی، هلندی، انگلیسی، فیلیپینی، فنلاندی، فرانسوی، آلمانی، یونانی، هندی، مجاری، اندونزیایی، ایتالیایی، ژاپنی، کرهای، مقدونی، مالایی، فارسی، لهستانی، پرتغالی، رومانیایی، روسی، اسپانیایی، سوئدی، تایلندی، ترکی، ویتنامی. در ادامه نحوه انتخاب مناسبترین زبان توسط این اپلیکیشن و معنای واقعی «ترجمه کامل» توضیح داده شده است.
متن را بخوانید →پشته ASR محصول Brethof Voice Pro بر روی llama.cpp و با استفاده از مدلهای Qwen کوانتیزهشده به فرمت GGUF کار میکند، نه بر روی ONNX Runtime. در نتیجه، اندازه فایل نصب شده کوچکتر است (83 مگابایت برای فایل exe در مقابل بیش از 400 مگابایت)، زمان راهاندازی سریعتر میشود، و دیگر نیازی به سروکار گرفتن با فایلهای CUDA/DirectML در هر پلتفرمی نیست. در ادامه داستان مهندسی پشت این تغییر آورده شده است.
متن را بخوانید →تمامی برنامههای اصلی دیکته، صدای کاربر را از طریق سرورهای شخص ثالث ارسال میکنند. ما معتقدیم که این تنظیم پیشفرض اشتباهی است. صدای شما شخصیترین دادههایی است که تولید میکنید؛ چه یادداشتهای پزشکی، چه پیشنویسهای حقوقی، چه یادداشتهای خصوصی و چه اسرار کاری. به همین دلیل است که Brethof Voice Pro فاقد حالت ابری، «تئلمتری اختیاری» و نیاز به حساب کاربری برای ترجمه صداست.
متن را بخوانید →یک حساب کاربری ایجاد کنید تا هنگام انتشار پستهای جدید و ارسال نسخههای جدید، مطلع شوید.
حساب ایجاد کنیدسیستم تبدیل گفتار به متن محلی که صدای شما را یاد میگیرد؛ مجوز دائمی. محصول پرچمدار ما.
پرداختی · مدل پرچمدار
حافظه بلندمدت محلی برای Claude Code — متن کامل + بردار + گراف، روی SurrealDB. MIT.
رایگان · منبع باز
مدلهای دیجیتال آماده چاپ. شامل فرمتهای STL/3MF/OBJ. دسترسی مادامالعمر.
پرداخت شده · کاتالوگ دیجیتال
طرحهای چاپی ما به سراسر اروپا ارسال میشوند. محصول را خریداری کنید، نه فایل آن را.
پرداختی · اشیاء فیزیکی
میزبان هوش مصنوعی Cyber-tiger. توضیح هوش مصنوعی با اولویت حریم خصوصی، بدون فیلتر شرکتی.
کانال · پخش زنده
فهرستهای گزینششده در GitHub برای هوش مصنوعی، MCP، هوش مصنوعی محلی، لینوکس برای هوش مصنوعی و موارد دیگر. مستندات واقعی، نه فقط ادعا.
رایگان · انتخابشده
راهنماهای جامع برای استفاده از هوش مصنوعی محلی در لینوکس، ویندوز و macOS؛ پیکربندیهای واقعی، نه تبلیغات.
رایگان · به زودی
نمودارهای ComfyUI که در شرایط واقعی آزمایش شدهاند — LTX chunked-loop، خط تولید Nova، و موارد دیگر.
رایگان · صفحه فرود فرآیندهای کاری
منفیگزینی: روشها و ابزارهایی که وقت شما را هدر میدهند، رتبهبندی شدهاند. رسید لازم است.
رایگان · به زودی
ما چه کسانی هستیم، چرا هوش مصنوعی محلیساز را توسعه میدهیم، و چه کارهایی را انجام نخواهیم داد.