محصول به‌روزرسانی‌ها

اخبار مربوط به راه‌اندازی، خبرهای مربوط به برنامه قهرمانان، ویژگی‌های جدید، و اطلاعات فنی پشت صحنه از سوی تیم Brethof Voice Pro.

منتشر کردن ۲۱ مه ۲۰۲۶

ویرایش ۲.۰.۰ — ترجمه آفلاین به ۳۸ زبان

Brethof Voice Pro دیگر صرفاً یک ابزار تبدیل صدا به متن نیست؛ نسخه ۲.۰.۰ منتشر شده است. ترجمه آفلاین توسط Tencent پشتیبانی می‌شود. Hunyuan MT2 — در FLORES-200 (XCOMET-XXL)، سطح 7B به آنجا می‌رسد ۹۷.۹٪ از Google Gemini 3.1 Proو این مدل در تست‌های دنیای واقعی و زبان‌های اقلیت، از Gemini پیشی می‌گیرد. فرآیند ترجمه کاملاً روی دستگاه شما انجام می‌شود. دو سطح مدل وجود دارد که به صورت درخواستی دانلود می‌شوند: سریع (حدود ۱ گیگابایت، کمتر از یک ثانیه روی CPU یا GPU) و با کیفیت (حدود ۴.۳ گیگابایت، کمتر از یک ثانیه روی GPU). علاوه بر این، چندین افزودنی مورد انتظار نیز وجود دارد.

چه چیزهایی در نسخه ۲.۰.۰ جدید است:

  • رونویسی + ترجمه — پنجره‌ی نمایشی Transcribe دارای یک فهرست کشویی با عنوان «ترجمه به:» است. Qwen3-ASR متن را ترجمه می‌کند و Hunyuan MT2 نیز آن را ترجمه می‌کند؛ هر دو نتایج در کنار یکدیگر نمایش داده می‌شوند. این ابزار بر روی فایل‌ها، میکروفون و صدای سیستم (ضبط حلقه‌ای تماس‌های جلسات، تب‌های مرورگر، هر چیزی که از بلندگوهای شما پخش می‌شود) کار می‌کند.
  • کیبورد صوتی چندزبانه — تراشه ترجمه جدید موجود در ردیف اصلی، یک شبکه زبانی سه‌ستونی را فراهم می‌کند. یک یا چند زبان مقصد را انتخاب کنید و صفحه‌کلید ترجمه را تایپ خواهد کرد. حالت‌های چیدمان: یکی در هر خط، درون‌خطی.EN: … || PL: …)، یا فقط هدف اول.
  • مترجم زیرنویس SRT / VTT — زمان‌بندی‌ها و شاخص‌های راهنما را حفظ می‌کند؛ از حالت دوزبانه پشتیبانی می‌کند (خط منبع و ترجمه برای هر راهنما). از طریق MCP برای خودکارسازی عملیات‌های نماینده‌های هوش مصنوعی در دسترس است.
  • چند GPU برای هر موتور — در بخش Settings → Models، برای هر موتور یک ابزار جداگانه برای انتخاب دستگاه وجود دارد. پردازش ASR را روی Vulkan 0 و پردازش ترجمه را روی Vulkan 1 انجام دهید؛ یا در لپ‌تاپ‌هایی که حافظه VRAM محدودی دارند، Hunyuan MT2 7B را به CPU متصل کنید.
  • آموزش صدای شخصی به طور کامل به صورت زنده انجام می‌شود. — تنظیم دقیق LoRA بر اساس صدای خودتان، به‌صورت کامل روی دستگاه شما. کارت آموزش در پنجره اصلی، تعداد کل نمونه‌ها و دقایق ضبط‌شده را به‌سرعت نشان می‌دهد؛ گزینه «شروع آموزش» در تب آموزش، به‌طور خودکار از NVIDIA CUDA یا CPU استفاده کرده و سپس مدل آموزش‌دیده را به فرمت GGUF صادر می‌کند. این قابلیت همراه با هر لایسنس پولی در دسترس است.
  • ۴ ابزار جدید MCPtranslate_text, translate_srt, list_compute_devices, set_compute_deviceتعداد کل ابزارها اکنون ۱۹ عدد است.
  • زبان صادقانه، چیزها را جدا می‌کند. — ASR: ۳۰ زبان قابل انتخاب + تشخیص خودکار + ۲۲ گویش چینی (مجموعاً ۵۲ زبان). ترجمه: ۳۸ زبان (۳۳ زبان اصلی + ۵ زبان اقلیت مناطق چینی). ۲۳ زبان در هر دو جهت قابل استفاده هستند.

فایل باینری لینوکس ۱۶۱ مگابایت و فایل نصب ویندوز ۱۱۸ مگابایت است. قیمت‌های عرضه یکسان است: ۴۹ دلار برای نسخه شخصی و ۱۴۹ دلار برای نسخه تجاری. مجوزهای موجود ادامه‌دار هستند — فقط دانلود نسخه 2.0.0 و مدل‌های ترجمه در بخش Settings → Models نمایان خواهند شد.

دانلود نسخه 2.0.0 →
منتشر کردن ۲۰ مه ۲۰۲۶

ورژن ۱.۶.۱۶ — آموزش صدای شخصی اکنون در دسترس است

چرخه آموزشی منتشر شد. تنظیم دقیق LoRA برای صدای خودتان اکنون به‌طور کامل روی دستگاه شما اجرا می‌شود — اپلیکیشن به‌طور خودکار انتخاب می‌کند. CUDA از NVIDIA or پردازنده مرکزیسپس پس از اتمام کار، مدل آموزش‌دیده را به صورت خودکار به فرمت GGUF صادر می‌کند. هر تغییری که در رابط کاربری اعمال کنید، به طور خودکار در مجموعه داده‌های آموزشی محلی شما ذخیره می‌شود؛ کارت آموزش در پنجره اصلی، تعداد کل نمونه‌ها و زمان صرف شده را به سرعت نشان می‌دهد.

پاداش: دقت صفحه‌کلید صوتی در تمام زبان‌ها به لطف به‌روزرسانی llama.cpp (نسخه b9222) که مشکل فروپاشی مرز بخش‌ها در ویدیوهای بلند را برطرف کرده است، بهبود یافته است. این ویژگی به‌طور رایگان همراه با هر مجوز پولی ارائه می‌شود.

مهندسی ۱۵ مه ۲۰۲۶

ورژن ۱.۶.۰ — کارهای ترجمه ناسینکرون با بهبود در سطح کلمات در فرمت SRT

دو ابزار جدید MCP معرفی شدند: start_transcription بلافاصله شماره کار را برمی‌گرداند تا نماینده بتواند کارهای دیگری انجام دهد، و get_transcription_status نظرسنجی‌ها برای تکمیل انجام می‌شوند؛ هر کار به تنهایی، و نتیجه پس از اتمام درج می‌گردد. فایل‌های بزرگ دیگر مانع چرخه عملیاتی ابزار نمی‌شوند.

همچنین مجموعه‌ای از اصلاحات برای خروجی SRT/VTT در سطح کلمات: دیگر فاصله‌های اضافی قبل از علائم نگارشی وجود ندارد، دیگر نشانه‌های تک‌نقطه‌ای وجود ندارد، و دیگر رشته‌های کلمات/زمینه مرتبط به متن ثبت‌شده نفوذ نمی‌کنند. زیرنویس‌های تمیزتری که نیازی به پاکسازی دستی ندارند.

مهندسی ۱۵ مه ۲۰۲۶

ورژن ۱.۵.۰ — پشتیبانی از ONNX حذف شد؛ زمان اجرا اکنون صرفاً از llama.cpp + libmtmd تشکیل شده است.

نوشتن مجدد کامل موتور. Brethof Voice Pro اکنون Qwen3-ASR را به صورت کامل از ابتدا تا انتها اجرا می‌کند. llama.cpp با وزن‌های کوانتیزه‌شده GGUF از طریق libmtmdONNX Runtime دیگر وجود ندارد. پیامدها عبارتند از: اندازه‌ی کمتر برنامه‌ی نصب‌شده (فایل باینری حدود ۸۳ مگابایت، در مقایسه با بیش از ۴۰۰ مگابایت)، زمان شروع سریع‌تر، و دیگر نیازی به سر و کار داشتن با فایل‌های CUDA/DirectML مخصوص هر پلتفرم.

Vulkan به طور خودکار GPU شما را — چه NVIDIA، چه AMD، یا Intel Arc — شناسایی می‌کند و در صورت عدم وجود GPU، از CPU به عنوان جایگزین استفاده می‌کند. همین موتور اکنون تمام ویژگی‌های مرتبط را پشتیبانی می‌کند: ASR، صفحه‌کلید صوتی، سرور MCP، و همچنین ترجمه (که از نسخه ۲.۰.۰ در دسترس است).

مهندسی ۱۴ مه ۲۰۲۶

ورژن ۱.۴.۰ — معرفی اولین سرور MCP + ابزار انتخاب دستگاه‌های چند-GPU

سرور پروتکل زمینه مدل فعال شد. هر عامل هوش مصنوعی سازگار با MCP — Claude Desktop, Claude Code, نشانگر موس, کلاین — می‌تواند فرآیند ترجمه را از طریق stdio انجام دهد (بدون نیاز به پورت یا فایروال). همین نسخه شامل… انتخاب‌کننده دستگاه چند‌GPU بنابراین می‌توانید تعیین کنید کدام GPU Vulkan برای پردازش ASR استفاده می‌شود، همراه با گزینه‌های اختیاری. تطبیق اجباری افزونه‌ای برای اضافه کردن زمان‌بندی در سطح کلمات در هر ترجمه صوتی.

فقط در سطح پریمیوم: سرور MCP بدون داشتن مجوز شخصی یا تجاری اجازه راه‌اندازی نمی‌شود. brethof-voice --mcp این همان فراخوانی یک‌خطی است.

نقشه راه ۱۶ آوریل ۲۰۲۶

نسخه macOS در حال توسعه است — ابتدا بر روی Apple Silicon.

پرسش رایج قبل از عرضه این سیستم این بود که «مک‌او‌اس چه زمانی منتشر می‌شود؟» پاسخ: در حال توسعه فعال است. ابتدا نسخه مخصوص تراشه‌های Apple Silicon با استفاده از سرعت‌بخش Metal منتشر خواهد شد و سپس نسخه مبتنی بر Intel. هدف، فصل سوم سال ۲۰۲۶ است — و ما در فصل دوم یک بتا بسته را راه‌اندازی خواهیم کرد. در ادامه اطلاعاتی درباره آنچه در حال ساخت است و نحوه ثبت‌نام ارائه شده است.

متن را بخوانید →
محصول ۱۶ آوریل ۲۰۲۶

آموزش مدل شخصی — تنظیم دقیق Brethof Voice Pro بر اساس صدای خودتان

آموزش صدای شخصی در Voice Pro به صورت زنده انجام می‌شود. هر بار که یک کلمه را که به درستی تشخیص داده نشده بود، اصلاح می‌کنید، فایل صوتی مربوطه همراه با اصلاحات به طور خودکار در مجموعه داده آموزشی شما ذخیره می‌شود. کافی است یک بار روی تب آموزش کلیک کنید تا یک مدل LoRA بر اساس لهجه شما تنظیم شود؛ اپلیکیشن به طور خودکار از NVIDIA CUDA یا CPU استفاده می‌کند و سپس مدل آموزش داده شده را به فرمت GGUF صادر می‌کند. این قابلیت به همراه هر مجوز پولی در دسترس است.

متن را بخوانید →
اعلامیه ۱۶ آوریل ۲۰۲۶

Brethof Voice Pro اکنون در دسترس است؛ ابزار تبدیل صدا به متن که در دستگاه شما باقی می‌ماند.

پس از ماه‌ها کار مهندسی، نسخه 1.0 از Brethof Voice Pro امروز برای سیستم‌عامل‌های Windows و Linux منتشر شد. این نرم‌افزار دارای ۳۰ زبان ترجمه صوتی و ۲۲ گویش چینی، قابلیت ترجمه صوتی کاملاً آفلاین، امکان دیکته با استفاده از کلیدهای میانبر در هر جا، و قیمتی یکباره بدون نیاز به اشتراک است. در ادامه مواردی که باعث گنجانده شدن آن در نسخه اولیه شدند و پروژه‌هایی که در حال کار بر روی آن‌ها هستیم، آورده شده است.

متن را بخوانید →
قهرمانان ۱۶ آوریل ۲۰۲۶

۱٬۸۰۰ مجوز رایگان در دسترس هستند: برنامه قهرمانان باز است.

برنامه Champions امروز آغاز می‌شود و تا ۱۶ مه ادامه خواهد داشت. پنجاه مجوز شخصی رایگان برای هر زبان پشتیبانی‌شده – در مجموع ۱٬۸۰۰ مجوز – به همراه تخفیف ۷۰ درصدی برای تمام شرکت‌کنندگانی که جزو ۵۰ نفر برتر قرار نمی‌گیرند. در ادامه نحوه عملکرد این برنامه و دلایل انجام آن به این شکل توضیح داده شده است.

متن را بخوانید →
مجوزدهی ۱۶ آوریل ۲۰۲۶

مجوز شخصی اکنون کارهای تک‌نفره و فریلنسری را نیز پوشش می‌دهد.

ما نظرات اولیه نویسندگان، مشاوران و مترجمان را بررسی کردیم؛ آن‌ها معتقد بودند که عبارت قدیمی «فقط برای استفاده شخصی» گیج‌کننده است. مجوز شخصی با قیمت ۴۹ دلار اکنون به طور صریح شامل استفاده تجاری توسط افراد تنها و فریلنسرها می‌شود. مجوز تجاری (۱۴۹ دلار برای هر نفر) برای تیم‌ها در نظر گرفته شده است. در ادامه تغییرات و دلایل آن‌ها آمده است.

متن را بخوانید →
محصول ۱۲ آوریل ۲۰۲۶

۳۰ زبان ترجمه متن، رابط کاربری کاملاً ترجمه‌شده — نه یک صفحه پر از متن ترجمه‌شده توسط ماشین.

Brethof Voice Pro اکنون متن‌ها را به ۳۰ زبان و همچنین ۲۲ گویش چینی ترجمه و نمایش می‌دهد: عربی، کانتونی، چینی، چکی، دانمارکی، هلندی، انگلیسی، فیلیپینی، فنلاندی، فرانسوی، آلمانی، یونانی، هندی، مجاری، اندونزیایی، ایتالیایی، ژاپنی، کره‌ای، مقدونی، مالایی، فارسی، لهستانی، پرتغالی، رومانیایی، روسی، اسپانیایی، سوئدی، تایلندی، ترکی، ویتنامی. در ادامه نحوه انتخاب مناسب‌ترین زبان توسط این اپلیکیشن و معنای واقعی «ترجمه کامل» توضیح داده شده است.

متن را بخوانید →
مهندسی ۸ آوریل ۲۰۲۶

چرا از ONNX به GGUF رفتیم — سریع‌تر، کوچک‌تر و آسان‌تر برای تحویل

پشته ASR محصول Brethof Voice Pro بر روی llama.cpp و با استفاده از مدل‌های Qwen کوانتیزه‌شده به فرمت GGUF کار می‌کند، نه بر روی ONNX Runtime. در نتیجه، اندازه فایل نصب شده کوچکتر است (83 مگابایت برای فایل exe در مقابل بیش از 400 مگابایت)، زمان راه‌اندازی سریع‌تر می‌شود، و دیگر نیازی به سروکار گرفتن با فایل‌های CUDA/DirectML در هر پلتفرمی نیست. در ادامه داستان مهندسی پشت این تغییر آورده شده است.

متن را بخوانید →
اصول ۴ آوریل ۲۰۲۶

چرا Brethof Voice Pro به طور کامل آفلاین کار می‌کند — و چرا این تنها یک ویژگی نیست

تمامی برنامه‌های اصلی دیکته، صدای کاربر را از طریق سرورهای شخص ثالث ارسال می‌کنند. ما معتقدیم که این تنظیم پیش‌فرض اشتباهی است. صدای شما شخصی‌ترین داده‌هایی است که تولید می‌کنید؛ چه یادداشت‌های پزشکی، چه پیش‌نویس‌های حقوقی، چه یادداشت‌های خصوصی و چه اسرار کاری. به همین دلیل است که Brethof Voice Pro فاقد حالت ابری، «تئلمتری اختیاری» و نیاز به حساب کاربری برای ترجمه صداست.

متن را بخوانید →

به‌روزرسانی‌ها را در صندوق ورودی خود دریافت کنید.

یک حساب کاربری ایجاد کنید تا هنگام انتشار پست‌های جدید و ارسال نسخه‌های جدید، مطلع شوید.

حساب ایجاد کنید

هر آنچه که ما ساخته‌ایم

🎤

برثوف Voice Pro

سیستم تبدیل گفتار به متن محلی که صدای شما را یاد می‌گیرد؛ مجوز دائمی. محصول پرچمدار ما.

پرداختی · مدل پرچمدار

🧠

Brethof-Mind

حافظه بلندمدت محلی برای Claude Code — متن کامل + بردار + گراف، روی SurrealDB. MIT.

رایگان · منبع باز

🛠

مدل‌های سه‌بعدی

مدل‌های دیجیتال آماده چاپ. شامل فرمت‌های STL/3MF/OBJ. دسترسی مادام‌العمر.

پرداخت شده · کاتالوگ دیجیتال

📦

چاپ سه‌بعدی

طرح‌های چاپی ما به سراسر اروپا ارسال می‌شوند. محصول را خریداری کنید، نه فایل آن را.

پرداختی · اشیاء فیزیکی

🎥

نووا

میزبان هوش مصنوعی Cyber-tiger. توضیح هوش مصنوعی با اولویت حریم خصوصی، بدون فیلتر شرکتی.

کانال · پخش زنده

📚

فهرست‌های فوق‌العاده

فهرست‌های گزینش‌شده در GitHub برای هوش مصنوعی، MCP، هوش مصنوعی محلی، لینوکس برای هوش مصنوعی و موارد دیگر. مستندات واقعی، نه فقط ادعا.

رایگان · انتخاب‌شده

📖

راهنماها

راهنماهای جامع برای استفاده از هوش مصنوعی محلی در لینوکس، ویندوز و macOS؛ پیکربندی‌های واقعی، نه تبلیغات.

رایگان · به زودی

🔮

فرآیندهای کاری ComfyUI

نمودارهای ComfyUI که در شرایط واقعی آزمایش شده‌اند — LTX chunked-loop، خط تولید Nova، و موارد دیگر.

رایگان · صفحه فرود فرآیندهای کاری

🤯

لیست رتبه‌بندی ضد-Dev

منفی‌گزینی: روش‌ها و ابزارهایی که وقت شما را هدر می‌دهند، رتبه‌بندی شده‌اند. رسید لازم است.

رایگان · به زودی

👋

درباره Brethof AI

ما چه کسانی هستیم، چرا هوش مصنوعی محلی‌ساز را توسعه می‌دهیم، و چه کارهایی را انجام نخواهیم داد.

خارجی:   یوتیوب · GitHub