يأتي تدريب الصوت الشخصي مع Brethof Voice Pro. يمكنك ضبط نموذج التعرف على صوتك بشكل دقيق محليًا بنقرة واحدة فقط — بدون سطر أوامر وبدون الحاجة إلى السحابة. إليك كيف يعمل ذلك.
كيف يعمل؟
في كل مرة تصحح فيها كلمة تم التعرف عليها بشكل خاطئ، يقوم التطبيق بحفظ المقطع الصوتي وتصحيحك في مجموعة بيانات تدريب محلية. يعرض كارت التدريب في النافذة الرئيسية عدد العينات والدقائق التي تم تسجيلها — انقر عليه لتصفحها أو تشغيلها أو حذف السجلات. عندما تكون جاهزًا، يقوم تبويب التدريب بضبط مُعدّل LoRA لصوتك بشكل دقيق.
يختار النظام الخلفية الخاصة به تلقائيًا: أي NVIDIA CUDA البناء (cu128 PyTorch، يتم تثبيته تلقائيًا في بيئة معزولة مخزنة في الذاكرة عند التشغيل الأول) عند وجود كارت شاشة متوافق، وإلا فإن وحدة المعالجة المركزية خيار الاسترداد: عند اكتمال التدريب، يتم دمج نموذج LoRA مع النموذج الأساسي وتصديره إلى صيغة GGUF حتى يتمكن برنامج llama.cpp من تحميله — يمكنك التبديل إلى النموذج الخاص بك من خلال قسم Settings → Models. أما عملية تحويل صيغة PyTorch إلى GGUF التي كانت تعيق ذلك فقد تم إنجازها الآن وتعمل بشكل كامل من البداية إلى النهاية.
ما ستحصل عليه
- جمع البيانات داخل التطبيق. تتحول التصحيحات تلقائيًا إلى بيانات تدريب — فقط استمر في استخدام التطبيق.
- ضبط دقيق لـ LoRA بنقرة واحدة. يمكن التدريب على وحدة المعالجة الرسومية الخاصة بك (NVIDIA CUDA) أو وحدة المعالجة المركزية. شريط تقدم، وليس ملف سجل.
- تصدير تلقائي لصيغة GGUF. يتم دمج النموذج المدرب وتحويله لك تلقائيًا — بدون أي خطوات يدوية.
- إصدارات النموذج. احتفظ بالنموذج الأصلي إلى جانب النموذج المعدل خصيصًا، وقم بالتبديل بينهما في الإعدادات.
- كلمات رئيسية للمفردات. أضف الأسماء والاختصارات ومصطلحات المنتجات في مربع حوار الكلمات الرئيسية — يتم تطبيقها فورًا دون الحاجة إلى إعادة تدريب.
من يهتم بذلك؟
- المتحدثون غير الأصليون. يحقق نمط النطق الثقيل دقة أساسية جيدة حاليًا، لكن التعديل الدقيق باستخدام صوت المستخدم نفسه هو ما يرفع دقته إلى ما فوق 95%.
- المستخدمون في المجالات الطبية والقانونية والتقنية. أسماء الأدوية، واقتباسات الأحكام القضائية، ومعرفات قواعد الكود — كلها تستفيد بشكل كبير من مفردات مخصصة.
- المستخدمون الذين يعانون من صعوبات في الكلام. يُعد التعديل الدقيق للكلام المصاب بضعف النطق أو غير الطبيعي من أهم استخدامات التدريب المحلي من حيث القيمة، ولا توفر خدمات السحابة التجارية هذه الميزة.
- اللغات ذات الموارد المحدودة. النماذج الأساسية جيدة في اللغات الشائعة وأقل كفاءة في اللغات الأقل شيوعًا. يمكن سد هذه الفجوة بسرعة عبر التعديل التفصيلي باستخدام بضع ساعات من الصوت الخاص بك.
ما الذي لا يتغير؟
- يتم تنفيذ التدريب محليًا. عينات الصوت لا تغادر جهازك أبدًا. هذه هي الفكرة بأكملها.
- النموذج الذي تم تعديله خصيصًا لك هو ملكك. نحن لا نقوم بتحميله، ولا ندمجه في نموذج “مشترك”. إنه موجود على قرصك الخاص.
- مجاني مع أي ترخيص مدفوع. ليس تحديثًا منفصلاً. إذا كنت تمتلك النسخة الشخصية أو النسخة المخصصة للأعمال حاليًا، فستحصل على واجهة التدريب ضمن التحديث الذي يتم إرساله.
التوافر
متاح الآن — يأتي برنامج تدريب الصوت الشخصي مضمنًا في الإصدار الحالي ويعمل بشكل كامل على أنظمة Linux وWindows. مجاني مع أي ترخيص مدفوع؛ بيانات صوتك لا تغادر جهازك أبدًا.
هل لديك حالة استخدام محددة للتعديل الدقيق — مفردات متخصصة، لهجات غير عادية، أو نطق غير تقليدي؟ أخبرنا حتى نواصل تحسينه. [email protected].