अपडेट्स — Brethof Voice Pro

रिलीज़ 21 मई, 2026

v2.0.0 — 38 भाषाओं में ऑफलाइन अनुवाद

Brethof Voice Pro अब केवल वॉयस-टू-टेक्स्ट सुविधा तक ही सीमित नहीं है। इसका वर्जन 2.0.0 जारी कर दिया गया है। ऑफलाइन अनुवाद Tencent द्वारा संचालित। Hunyuan MT2 — FLORES-200 (XCOMET-XXL) पर 7B स्तर तक पहुँच जाता है Google Gemini 3.1 Pro का 97.9%यह वास्तविक-दुनिया एवं अल्पसंख्यक-भाषा संबंधी परीक्षणों में Gemini से बेहतर प्रदर्शन करता है। अनुवाद पूरी तरह से आपके कंप्यूटर पर ही होता है। मांग के अनुसार दो प्रकार के मॉडल उपलब्ध हैं: फास्ट (~1 जीबी, CPU या GPU पर सेकंड के भीतर) एवं क्वालिटी (~4.3 जीबी, GPU पर सेकंड के भीतर)। इसके अलावा कई लंबे समय से प्रतीक्षित सुविधाएँ भी उपल

v2.0.0 में क्या नया है:

ट्रांसक्राइब + अनुवाद — Transcribe पॉपअप में “Translate to:” नामक ड्रॉपडाउन विकल्प है। ASR टेक्स्ट को रूपांतरित करता है, जबकि MT भी टेक्स्ट को रूपांतरित करता है; दोनों का परिणाम एक साथ दिखाया जाता है। यह फ़ाइलों, माइक्रोफ़ोन, एवं सिस्टम ऑडियो (मीटिंग कॉलों का लूपबैक रिकॉर्डिंग, ब्राउज़र टैब, आपके स्पीकरों से आने व
बहुभाषी वॉइस कीबोर्ड — मुख्य पंक्ति पर स्थित नया अनुवाद चिप 3-कॉलम वाला भाषा ग्रिड प्रदान करता है। एक या अधिक लक्ष्य चुनें, और कीबोर्ड अनुवाद टाइप करेगा। लेआउट मोड: प्रति पंक्ति एक, इनलाइन।EN: … || PL: …), या केवल पहला लक्ष्य।
SRT / VTT उपशीर्षक अनुवादक — समयावधियों एवं क्यू इंडेक्सों को संरक्षित रखता है; द्विभाषी मोड का समर्थन करता है (प्रत्येक क्यू के लिए स्रोत पंक्ति + अनुवाद)। AI-एजेंट स्वचालन हेतु MCP के माध्यम से उपलब्ध है।
प्रत्येक इंजन में मल्टी-जीपीयू — “Settings → Models” में प्रत्येक इंजन के लिए एक स्वतंत्र डिवाइस चुनने हेतु विकल्प मौजूद है। Vulkan 0 पर ASR चलाएं एवं Vulkan 1 पर अनुवाद करें; या VRAM सीमित लैपटॉपों में Hunyuan MT2 7B को CPU पर ही उपयोग में लाएं।
व्यक्तिगत वॉइस प्रशिक्षण पूरी तरह से लाइव है। — अपनी ही आवाज़ पर LoRA फाइन-ट्यूनिंग, अपने ही कंप्यूटर पर एंड-टू-एंड प्रक्रिया। मुख्य विंडो में दिए गए ट्रेनिंग कार्ड से तुरंत ही कुल नमूनों एवं रिकॉर्ड किए गए मिनटों की जानकारी मिल जाती है; “ट्रेनिंग शुरू करें” विकल्प स्वचालित रूप से NVIDIA CUDA या CPU का चयन करता है, फिर प्रशिक्षित मॉडल को GGUF फॉर्मेट में एक्सपोर्ट कर देता है। हर भुगतान की गई ल
4 नए MCP उपकरण — translate_text, translate_srt, list_compute_devices, set_compute_deviceअब कुल उपकरणों की संख्या 19 है।
ईमानदार भाषा विभाजन करती है — ASR: 30 चुनने योग्य भाषाएँ + स्वचालित पहचान + 22 चीनी बोलीयाँ (कुल 52)। अनुवाद: 38 भाषाएँ (33 मुख्य भाषाएँ + 5 चीनी क्षेत्रों की अल्पसंख्यक भाषाएँ)। 23 भाषाओं में दोनों दिशाओं में अनुवाद संभव है।

Linux बाइनरी 161 MB है, जबकि Windows इंस्टॉलर 118 MB है। दोनों की लॉन्च कीमतें समान हैं: व्यक्तिगत उपयोग हेतु $49, व्यावसायिक उपयोग हेतु $149। मौजूदा लाइसेंस भी लागू रहते हैं — बस v2.0.0 डाउनलोड करें और अनुवाद मॉडल “Settings → Models” में दिखाई देंगे।

v2.0.0 डाउनलोड करें →

रिलीज़ 20 मई, 2026

v1.6.16 — व्यक्तिगत वॉइस प्रशिक्षण अब उपलब्ध है

ट्रेनिंग पाइपलाइन जारी कर दी गई है। अब आपकी अपनी आवाज़ पर LoRA फाइन-ट्यूनिंग आपके कंप्यूटर पर ही एंड-टू-एंड चलेगी — ऐप स्वचालित रूप से चुन लेता है। NVIDIA CUDA or CPUप्रशिक्षण पूरा होने के बाद प्रशिक्षित मॉडल को स्वचालित रूप से GGUF फॉर्मेट में निर्यात कर दिया जाता है। GUI में की गई हर संशोधन स्वचालित रूप से आपके स्थानीय प्रशिक्षण डेटासेट में सहेज दी जाती है; मुख्य विंडो में दिए गए प्रशिक्षण कार्ड में कुल नमूनों एवं समय की

बोनस: llama.cpp के अपग्रेड (बिल्ड b9222) के कारण सभी भाषाओं में वॉयस-कीबोर्ड की सटीकता में सुधार हुआ है; इस अपग्रेड ने लंबे वीडियो फुटेजों में आने वाली समस्याओं को दूर किया। हर पेड लाइसेंस के साथ यह सुविधा मुफ्त में उपलब्ध है।

इंजीनियरिंग 15 मई, 2026

v1.6.0 — एसिंक्रोनस ट्रांसक्रिप्शन जॉब्स + शब्द-स्तरीय SRT सुधार

दो नए MCP उपकरण आए हैं: start_transcription तुरंत एक जॉब आईडी प्रदान करता है ताकि एजेंट अन्य कार्य कर सके, और get_transcription_status पूर्णता हेतु सर्वेक्षण। एक समय में केवल एक ही कार्य; कार्य पूरा होने पर परिणाम सीधे ही प्रदर्शित होता है। लंबी फ़ाइलें अब एजेंट लूप को रोकती नहीं हैं।

शब्द-स्तरीय SRT/VTT आउटपुट में सुधारों की एक श्रृंखला भी शामिल है: विराम चिह्नों से पहले अब कोई अतिरिक्त स्पेस नहीं, कोई एकल-बिंदु चिह्न नहीं, और ट्रांसक्रिप्ट में कोई हॉटवर्ड/कंटेक्स्ट स्ट्रिंगें नहीं घुस पाएंगी। अधिक स्पष्ट उपशीर्षक, बिना किसी म

इंजीनियरिंग 15 मई, 2026

v1.5.0 — ONNX को हटा दिया गया, अब रनटाइम केवल llama.cpp + libmtmd है।

पूरे इंजन को पुनः लिखा गया है। अब Brethof Voice Pro, Qwen3-ASR का उपयोग करके एंड-टू-एंड प्रसंस्करण करता है। llama.cpp GGUF-क्वांटाइज्ड वेट्स के माध्यम से libmtmdONNX Runtime अब मौजूद नहीं है। परिणामस्वरूप: छोटा इंस्टॉल आकार (~83 MB बाइनरी, 400+ MB से कम), तेज़ कोल्ड-स्टार्ट, एवं प्रत्येक प्लेटफॉर्म पर CUDA/DirectML वील्स से होने वाली समस्याओं का अंत।

Vulkan स्वचालित रूप से आपका GPU — NVIDIA, AMD, या Intel Arc — चुन लेता है; यदि कोई GPU उपलब्ध न हो तो CPU का उपयोग किया जाता है। यही इंजन अब सभी संबंधित सुविधाओं को संचालित करता है: ASR, वॉयस कीबोर्ड, MCP सर्वर, एवं (अब v2.0.0 में) अनुवाद।

इंजीनियरिंग 14 मई, 2026

v1.4.0 — MCP सर्वर का पहला प्रकाशन + मल्टी-GPU डिवाइस चयनकर्ता

Model Context Protocol सर्वर लैंड हो गया। कोई भी MCP-सुसंगत AI एजेंट — Claude Desktop, Claude Code, कर्सर, क्लाइन — stdio के माध्यम से ट्रांसक्रिप्शन चला सकता है (कोई पोर्ट, कोई फायरवॉल नहीं)। इसी रिलीज में यह भी शामिल है। मल्टी-GPU डिवाइस सिलेक्टर इस प्रकार आप यह चुन सकते हैं कि कौन-सा Vulkan GPU ASR चलाएगा, साथ ही वैकल्पिक विकल्प भी। जबरन संरेखक प्रत्येक ट्रांसक्रिप्शन में शब्द-स्तरीय समय-टैग जोड़ने हेतु एड-ऑन।

केवल पेड टियर ही — पर्सनल या बिजनेस लाइसेंस के बिना MCP सर्वर शुरू नहीं होता। brethof-voice --mcp यह एक-लाइन का आह्वान है।

रोडमैप 16 अप्रैल, 2026

macOS संस्करण विकासाधीन है — पहले Apple Silicon के लिए।

लॉन्च से पहले सबसे अधिक पूछा गया सवाल था “मैकओएस कब आएगा?” उत्तर: इसका निर्माण चल रहा है। सबसे पहले मेटल एक्सेलरेशन के साथ एप्पल सिलिकॉन आधारित संस्करण आएगा, उसके बाद इंटेल आधारित संस्करण। लक्ष्य वर्ष 2026 की तीसरी तिमाही है — और हम दूसरी तिमाही में ही एक क्लोज्ड बीटा संस्करण शुरू कर रहे हैं। यहाँ बताया गया है कि क्या

पोस्ट पढ़ें →

उत्पाद 16 अप्रैल, 2026

व्यक्तिगत मॉडल प्रशिक्षण — अपनी आवाज़ के अनुसार Brethof Voice Pro को संशोधित करें

Voice Pro में व्यक्तिगत वॉइस प्रशिक्षण सुविधा उपलब्ध है। जब भी आप किसी गलत पहचाने गए शब्द को सही करते हैं, तो उस ऑडियो क्लिप एवं सुधार को स्वचालित रूप से आपके स्थानीय प्रशिक्षण डेटासेट में सहेज दिया जाता है। “Training” टैब पर एक क्लिक से ही आपके लहजे के अनुसार LoRA मॉडल को संशोधित किया जा सकता है — ऐप स्वचालित रूप से NVIDIA CUDA या CPU का उपयोग करता है, फिर प्रशिक्षित मॉडल को GGUF फॉर्मेट में निर्यात कर �

पोस्ट पढ़ें →

घोषणा 16 अप्रैल, 2026

Brethof Voice Pro अब उपलब्ध है — ऐसा वॉइस-टू-टेक्स्ट टूल जो आपके कंप्यूटर पर ही रहता है।

कई महीनों के इंजीनियरिंग प्रयासों के बाद, Voice Pro v1.0 आज Windows एवं Linux के लिए उपलब्ध है। 30 ट्रांसक्रिप्शन भाषाओं के साथ-साथ 22 चीनी बोलियाँ, पूरी तरह ऑफलाइन ट्रांसक्रिप्शन, कहीं भी हॉटकी के माध्यम से डिक्टेशन, एवं बिना किसी सब्सक्रिप्शन के एकमुश्त शुल्क – ये ही वे विशेषताएँ हैं जिनके कारण यह संस्करण लॉन्च हुआ। आगे हम किन चीजों पर काम कर रहे हैं, यह भी बताय

पोस्ट पढ़ें →

चैंपियन्स 16 अप्रैल, 2026

1,800 मुफ्त लाइसेंस उपलब्ध हैं: चैंपियन्स प्रोग्राम शुरू हो गया है

चैंपियन्स प्रोग्राम आज से शुरू होकर 16 मई तक चलेगा। प्रत्येक समर्थित भाषा के लिए 50 मुफ्त पर्सनल लाइसेंस – कुल 1,800 – दिए जाएंगे, साथ ही शीर्ष 50 में न आने वाले प्रत्येक प्रतिभागी को 70% की छूट भी दी जाएगी। यहाँ बताया गया है कि यह कैसे काम करता है एवं हम ऐसा क्यों कर रहे हैं।

पोस्ट पढ़ें →

लाइसेंसिंग 16 अप्रैल, 2026

अब व्यक्तिगत लाइसेंस सोलो व्यवसाय एवं फ्रीलांस कार्यों को भी कवर करता है।

हमने लेखकों, सलाहकारों एवं अनुवादकों की प्रारंभिक प्रतिक्रियाओं को सुना; उनका मानना था कि पुराना “केवल व्यक्तिगत उपयोग हेतु” वाला निर्देश भ्रामक था। 49 डॉलर में उपलब्ध पर्सनल लाइसेंस अब स्पष्ट रूप से एकल एवं फ्रीलांस व्यावसायिक उपयोग को कवर करता है। बिजनेस लाइसेंस (प्रति सीट 149 डॉलर) टीमों के लिए है। यहाँ बताया ग�

पोस्ट पढ़ें →

उत्पाद 12 अप्रैल, 2026

30 ट्रांसक्रिप्शन भाषाएँ, पूरी तरह से अनुवादित यूआई — केवल मशीन-अनुवादित पाठ नहीं

Brethof Voice Pro अब 30 भाषाओं एवं 22 चीनी बोलियों में पाठ लिखकर प्रस्तुत करता है: अरबी, कैंटोनीज़, चीनी, चेक, डेनिश, डच, अंग्रेज़ी, फिलिपिनो, फिनिश, फ्रांसीसी, जर्मन, यूनानी, हिंदी, हंगेरियाई, इंडोनेशियाई, इतालवी, जापानी, कोरियाई, मैसेडोनियाई, मलय, फारसी, पोलिश, पुर्तगाली, रोमानियाई, रूसी, स्पेनिश, स्वीडिश, थाई, तुर्की, वियतनामी। यहाँ बताया गया है कि ऐप सही भाषा का चयन कैसे करता है एवं “पूर्ण रूप से अनुवादित” का वास्तव में क्या अर्थ है।

पोस्ट पढ़ें →

इंजीनियरिंग 8 अप्रैल, 2026

हमने ONNX से GGUF की ओर क्यों स्थानांतरण किया — अधिक तेज़, छोटा, एवं आसानी से उपलब्ध।

Brethof Voice Pro का ASR बैकएंड ONNX Runtime के बजाय llama.cpp पर, GGUF-क्वांटाइज्ड Qwen मॉडलों के साथ काम करता है। इसके परिणामस्वरूप आकार में कमी आती है (83 MB का exe बनाम 400+ MB), कोल्ड-स्टार्ट समय में तेजी आती है, एवं हर प्लेटफॉर्म पर CUDA/DirectML वाले व्हील्स से जूझने की आवश्यकता नहीं रहती। यहाँ इस बदलाव के पीछे की इंजीनियरिंग कहानी दी गई है।

पोस्ट पढ़ें →

सिद्धांत 4 अप्रैल, 2026

ब्रेथोफ वॉइस प्रो 100% ऑफलाइन क्यों काम करता है — और यह केवल एक सुविधा क्यों नहीं है

हर प्रमुख डिक्टेशन उत्पाद आपकी आवाज़ को किसी अन्य के सर्वर के माध्यम से भेजता है। हमारे विचार में यह गलत डिफ़ॉल्ट है। आपकी आवाज़ वह सबसे व्यक्तिगत डेटा है जो आप उत्पन्न करते हैं — चिकित्सा नोट, कानूनी दस्तावेज़, निजी डायरियाँ, कार्य संबंधी गुप्त जानकारियाँ। इसीलिए Voice Pro में कोई क्लाउड मोड नहीं है, कोई “वैकल्पिक टेलीमेट्री” नहीं है, एवं

पोस्ट पढ़ें →

अपने इनबॉक्स में नवीनतम जानकारियाँ प्राप्त करें।

नए पोस्ट प्रकाशित होने एवं नई संस्करणें भेजी जाने पर सूचित रहने हेतु एक खाता बनाएं।

खाता बनाएं

उत्पाद अपडेट्स

v2.0.0 — 38 भाषाओं में ऑफलाइन अनुवाद

v1.6.16 — व्यक्तिगत वॉइस प्रशिक्षण अब उपलब्ध है

v1.6.0 — एसिंक्रोनस ट्रांसक्रिप्शन जॉब्स + शब्द-स्तरीय SRT सुधार

v1.5.0 — ONNX को हटा दिया गया, अब रनटाइम केवल llama.cpp + libmtmd है।

v1.4.0 — MCP सर्वर का पहला प्रकाशन + मल्टी-GPU डिवाइस चयनकर्ता

macOS संस्करण विकासाधीन है — पहले Apple Silicon के लिए।

व्यक्तिगत मॉडल प्रशिक्षण — अपनी आवाज़ के अनुसार Brethof Voice Pro को संशोधित करें

Brethof Voice Pro अब उपलब्ध है — ऐसा वॉइस-टू-टेक्स्ट टूल जो आपके कंप्यूटर पर ही रहता है।

1,800 मुफ्त लाइसेंस उपलब्ध हैं: चैंपियन्स प्रोग्राम शुरू हो गया है

अब व्यक्तिगत लाइसेंस सोलो व्यवसाय एवं फ्रीलांस कार्यों को भी कवर करता है।

30 ट्रांसक्रिप्शन भाषाएँ, पूरी तरह से अनुवादित यूआई — केवल मशीन-अनुवादित पाठ नहीं

हमने ONNX से GGUF की ओर क्यों स्थानांतरण किया — अधिक तेज़, छोटा, एवं आसानी से उपलब्ध।

ब्रेथोफ वॉइस प्रो 100% ऑफलाइन क्यों काम करता है — और यह केवल एक सुविधा क्यों नहीं है

अपने इनबॉक्स में नवीनतम जानकारियाँ प्राप्त करें।

हम जो कुछ भी बनाते हैं

ब्रेथोफ वॉइस प्रो

Brethof-Mind

3D मॉडल्स

3D प्रिंट

नोवा

शानदार सूचियाँ

मार्गदर्शिकाएँ

ComfyUI कार्यप्रवाह

एंटी-डेव टियर लिस्ट

Brethof AI के बारे में