Brethof Voice Pro टीम की ओर से लॉन्च संबंधी घोषणाएँ, Champions Program संबंधी जानकारियाँ, नई सुविधाएँ, एवं इंजीनियरिंग प्रक्रियाओं से जुड़ी जानकारियाँ।
Brethof Voice Pro अब केवल वॉयस-टू-टेक्स्ट सुविधा तक ही सीमित नहीं है। इसका वर्जन 2.0.0 जारी कर दिया गया है। ऑफलाइन अनुवाद Tencent द्वारा संचालित। Hunyuan MT2 — FLORES-200 (XCOMET-XXL) पर 7B स्तर तक पहुँच जाता है Google Gemini 3.1 Pro का 97.9%यह वास्तविक-दुनिया एवं अल्पसंख्यक-भाषा संबंधी परीक्षणों में Gemini से बेहतर प्रदर्शन करता है। अनुवाद पूरी तरह से आपके कंप्यूटर पर ही होता है। मांग के अनुसार दो प्रकार के मॉडल उपलब्ध हैं: फास्ट (~1 जीबी, CPU या GPU पर सेकंड के भीतर) एवं क्वालिटी (~4.3 जीबी, GPU पर सेकंड के भीतर)। इसके अलावा कई लंबे समय से प्रतीक्षित सुविधाएँ भी उपल
v2.0.0 में क्या नया है:
EN: … || PL: …), या केवल पहला लक्ष्य।translate_text, translate_srt, list_compute_devices, set_compute_deviceअब कुल उपकरणों की संख्या 19 है।Linux बाइनरी 161 MB है, जबकि Windows इंस्टॉलर 118 MB है। दोनों की लॉन्च कीमतें समान हैं: व्यक्तिगत उपयोग हेतु $49, व्यावसायिक उपयोग हेतु $149। मौजूदा लाइसेंस भी लागू रहते हैं — बस v2.0.0 डाउनलोड करें और अनुवाद मॉडल “Settings → Models” में दिखाई देंगे।
v2.0.0 डाउनलोड करें →ट्रेनिंग पाइपलाइन जारी कर दी गई है। अब आपकी अपनी आवाज़ पर LoRA फाइन-ट्यूनिंग आपके कंप्यूटर पर ही एंड-टू-एंड चलेगी — ऐप स्वचालित रूप से चुन लेता है। NVIDIA CUDA or CPUप्रशिक्षण पूरा होने के बाद प्रशिक्षित मॉडल को स्वचालित रूप से GGUF फॉर्मेट में निर्यात कर दिया जाता है। GUI में की गई हर संशोधन स्वचालित रूप से आपके स्थानीय प्रशिक्षण डेटासेट में सहेज दी जाती है; मुख्य विंडो में दिए गए प्रशिक्षण कार्ड में कुल नमूनों एवं समय की
बोनस: llama.cpp के अपग्रेड (बिल्ड b9222) के कारण सभी भाषाओं में वॉयस-कीबोर्ड की सटीकता में सुधार हुआ है; इस अपग्रेड ने लंबे वीडियो फुटेजों में आने वाली समस्याओं को दूर किया। हर पेड लाइसेंस के साथ यह सुविधा मुफ्त में उपलब्ध है।
दो नए MCP उपकरण आए हैं: start_transcription तुरंत एक जॉब आईडी प्रदान करता है ताकि एजेंट अन्य कार्य कर सके, और get_transcription_status पूर्णता हेतु सर्वेक्षण। एक समय में केवल एक ही कार्य; कार्य पूरा होने पर परिणाम सीधे ही प्रदर्शित होता है। लंबी फ़ाइलें अब एजेंट लूप को रोकती नहीं हैं।
शब्द-स्तरीय SRT/VTT आउटपुट में सुधारों की एक श्रृंखला भी शामिल है: विराम चिह्नों से पहले अब कोई अतिरिक्त स्पेस नहीं, कोई एकल-बिंदु चिह्न नहीं, और ट्रांसक्रिप्ट में कोई हॉटवर्ड/कंटेक्स्ट स्ट्रिंगें नहीं घुस पाएंगी। अधिक स्पष्ट उपशीर्षक, बिना किसी म
पूरे इंजन को पुनः लिखा गया है। अब Brethof Voice Pro, Qwen3-ASR का उपयोग करके एंड-टू-एंड प्रसंस्करण करता है। llama.cpp GGUF-क्वांटाइज्ड वेट्स के माध्यम से libmtmdONNX Runtime अब मौजूद नहीं है। परिणामस्वरूप: छोटा इंस्टॉल आकार (~83 MB बाइनरी, 400+ MB से कम), तेज़ कोल्ड-स्टार्ट, एवं प्रत्येक प्लेटफॉर्म पर CUDA/DirectML वील्स से होने वाली समस्याओं का अंत।
Vulkan स्वचालित रूप से आपका GPU — NVIDIA, AMD, या Intel Arc — चुन लेता है; यदि कोई GPU उपलब्ध न हो तो CPU का उपयोग किया जाता है। यही इंजन अब सभी संबंधित सुविधाओं को संचालित करता है: ASR, वॉयस कीबोर्ड, MCP सर्वर, एवं (अब v2.0.0 में) अनुवाद।
Model Context Protocol सर्वर लैंड हो गया। कोई भी MCP-सुसंगत AI एजेंट — Claude Desktop, Claude Code, कर्सर, क्लाइन — stdio के माध्यम से ट्रांसक्रिप्शन चला सकता है (कोई पोर्ट, कोई फायरवॉल नहीं)। इसी रिलीज में यह भी शामिल है। मल्टी-GPU डिवाइस सिलेक्टर इस प्रकार आप यह चुन सकते हैं कि कौन-सा Vulkan GPU ASR चलाएगा, साथ ही वैकल्पिक विकल्प भी। जबरन संरेखक प्रत्येक ट्रांसक्रिप्शन में शब्द-स्तरीय समय-टैग जोड़ने हेतु एड-ऑन।
केवल पेड टियर ही — पर्सनल या बिजनेस लाइसेंस के बिना MCP सर्वर शुरू नहीं होता। brethof-voice --mcp यह एक-लाइन का आह्वान है।
लॉन्च से पहले सबसे अधिक पूछा गया सवाल था “मैकओएस कब आएगा?” उत्तर: इसका निर्माण चल रहा है। सबसे पहले मेटल एक्सेलरेशन के साथ एप्पल सिलिकॉन आधारित संस्करण आएगा, उसके बाद इंटेल आधारित संस्करण। लक्ष्य वर्ष 2026 की तीसरी तिमाही है — और हम दूसरी तिमाही में ही एक क्लोज्ड बीटा संस्करण शुरू कर रहे हैं। यहाँ बताया गया है कि क्या
पोस्ट पढ़ें →Voice Pro में व्यक्तिगत वॉइस प्रशिक्षण सुविधा उपलब्ध है। जब भी आप किसी गलत पहचाने गए शब्द को सही करते हैं, तो उस ऑडियो क्लिप एवं सुधार को स्वचालित रूप से आपके स्थानीय प्रशिक्षण डेटासेट में सहेज दिया जाता है। “Training” टैब पर एक क्लिक से ही आपके लहजे के अनुसार LoRA मॉडल को संशोधित किया जा सकता है — ऐप स्वचालित रूप से NVIDIA CUDA या CPU का उपयोग करता है, फिर प्रशिक्षित मॉडल को GGUF फॉर्मेट में निर्यात कर �
पोस्ट पढ़ें →कई महीनों के इंजीनियरिंग प्रयासों के बाद, Voice Pro v1.0 आज Windows एवं Linux के लिए उपलब्ध है। 30 ट्रांसक्रिप्शन भाषाओं के साथ-साथ 22 चीनी बोलियाँ, पूरी तरह ऑफलाइन ट्रांसक्रिप्शन, कहीं भी हॉटकी के माध्यम से डिक्टेशन, एवं बिना किसी सब्सक्रिप्शन के एकमुश्त शुल्क – ये ही वे विशेषताएँ हैं जिनके कारण यह संस्करण लॉन्च हुआ। आगे हम किन चीजों पर काम कर रहे हैं, यह भी बताय
पोस्ट पढ़ें →चैंपियन्स प्रोग्राम आज से शुरू होकर 16 मई तक चलेगा। प्रत्येक समर्थित भाषा के लिए 50 मुफ्त पर्सनल लाइसेंस – कुल 1,800 – दिए जाएंगे, साथ ही शीर्ष 50 में न आने वाले प्रत्येक प्रतिभागी को 70% की छूट भी दी जाएगी। यहाँ बताया गया है कि यह कैसे काम करता है एवं हम ऐसा क्यों कर रहे हैं।
पोस्ट पढ़ें →हमने लेखकों, सलाहकारों एवं अनुवादकों की प्रारंभिक प्रतिक्रियाओं को सुना; उनका मानना था कि पुराना “केवल व्यक्तिगत उपयोग हेतु” वाला निर्देश भ्रामक था। 49 डॉलर में उपलब्ध पर्सनल लाइसेंस अब स्पष्ट रूप से एकल एवं फ्रीलांस व्यावसायिक उपयोग को कवर करता है। बिजनेस लाइसेंस (प्रति सीट 149 डॉलर) टीमों के लिए है। यहाँ बताया ग�
पोस्ट पढ़ें →Brethof Voice Pro अब 30 भाषाओं एवं 22 चीनी बोलियों में पाठ लिखकर प्रस्तुत करता है: अरबी, कैंटोनीज़, चीनी, चेक, डेनिश, डच, अंग्रेज़ी, फिलिपिनो, फिनिश, फ्रांसीसी, जर्मन, यूनानी, हिंदी, हंगेरियाई, इंडोनेशियाई, इतालवी, जापानी, कोरियाई, मैसेडोनियाई, मलय, फारसी, पोलिश, पुर्तगाली, रोमानियाई, रूसी, स्पेनिश, स्वीडिश, थाई, तुर्की, वियतनामी। यहाँ बताया गया है कि ऐप सही भाषा का चयन कैसे करता है एवं “पूर्ण रूप से अनुवादित” का वास्तव में क्या अर्थ है।
पोस्ट पढ़ें →Brethof Voice Pro का ASR बैकएंड ONNX Runtime के बजाय llama.cpp पर, GGUF-क्वांटाइज्ड Qwen मॉडलों के साथ काम करता है। इसके परिणामस्वरूप आकार में कमी आती है (83 MB का exe बनाम 400+ MB), कोल्ड-स्टार्ट समय में तेजी आती है, एवं हर प्लेटफॉर्म पर CUDA/DirectML वाले व्हील्स से जूझने की आवश्यकता नहीं रहती। यहाँ इस बदलाव के पीछे की इंजीनियरिंग कहानी दी गई है।
पोस्ट पढ़ें →हर प्रमुख डिक्टेशन उत्पाद आपकी आवाज़ को किसी अन्य के सर्वर के माध्यम से भेजता है। हमारे विचार में यह गलत डिफ़ॉल्ट है। आपकी आवाज़ वह सबसे व्यक्तिगत डेटा है जो आप उत्पन्न करते हैं — चिकित्सा नोट, कानूनी दस्तावेज़, निजी डायरियाँ, कार्य संबंधी गुप्त जानकारियाँ। इसीलिए Voice Pro में कोई क्लाउड मोड नहीं है, कोई “वैकल्पिक टेलीमेट्री” नहीं है, एवं
पोस्ट पढ़ें →नए पोस्ट प्रकाशित होने एवं नई संस्करणें भेजी जाने पर सूचित रहने हेतु एक खाता बनाएं।
खाता बनाएंआपकी आवाज़ को सीखने वाला स्थानीय स्पीच-टू-टेक्स्ट। स्थायी लाइसेंस। हमारा फ्लैगशिप।
भुगतान किया गया · फ्लैगशिप
Claude Code के लिए स्थानीय दीर्घकालिक मेमोरी — पूर्ण पाठ + वेक्टर + ग्राफ, SurrealDB पर। MIT.
मुफ्त · ओपन सोर्स
प्रिंट-रेडी डिजिटल मॉडल। STL/3MF/OBJ शामिल। आजीवन पहुँच।
भुगतान किया गया · डिजिटल कैटलॉग
हमारे मुद्रित डिज़ाइन यूरोप भर में भेजे जाते हैं। फ़ाइल नहीं, वस्तु खरीदें।
भुगतान किया गया · भौतिक वस्तुएँ
साइबर-टाइगर AI होस्ट। कॉर्पोरेट फिल्टर के बिना, गोपनीयता-प्रथम AI की व्याख्या।
चैनल · लाइव
AI, MCP, स्थानीय AI, AI के लिए Linux और अन्य से संबंधित चुनिंदा GitHub सूचियाँ। भावनाओं से ज्यादा, तथ्य।
मुफ्त · चयनित
लिनक्स, विंडोज़, मैकओएस पर स्थानीय AI के लिए विस्तृत मार्गदर्शिकाएँ। वास्तविक कॉन्फ़िगरेशन, विज्ञापन नहीं।
मुफ्त · जल्द ही उपलब्ध
उत्पादन-परीक्षण से गुजरे ComfyUI ग्राफ – LTX चंक्ड-लूप, नोवा पाइपलाइन, और अन्य।
मुफ्त · वर्कफ़्लो लैंडिंग
नकारात्मक-क्यूरेशन: आपका समय बर्बाद करने वाली प्रथाएँ और उपकरण, रैंक किए गए। रसीद आवश्यक है।
मुफ्त · जल्द ही उपलब्ध
हम कौन हैं, हम स्थानीय-केंद्रित एआई क्यों बनाते हैं, और हम क्या नहीं करेंगे।