ข่าวการเปิดตัว ข่าวสารเกี่ยวกับโปรแกรม Champions Program ฟีเจอร์ใหม่ๆ และภาพหลังความสำเร็จทางด้านวิศวกรรมจากทีม Brethof Voice Pro
Brethof Voice Pro ไม่ใช่เพียงโปรแกรมแปลงเสียงเป็นข้อความอีกต่อไป มีการเปิดตัวเวอร์ชัน 2.0.0 แล้ว การแปลแบบออฟไลน์ ให้พลังโดย Tencent Hunyuan MT2 — ใน FLORES-200 (XCOMET-XXL) ระดับ 7B สามารถทำได้ 97.9% ของ Google Gemini 3.1 Proนอกจากนี้ยังทำผลได้ดีกว่า Gemini ในการทดสอบในโลกแห่งความเป็นจริงและภาษาชนกลุ่มน้อย การแปลจะดำเนินการบนเครื่องของคุณเองทั้งหมด มีสองระดับของโมเดลให้เลือก โดยสามารถดาวน์โหลดตามความต้องการ: แบบเร็ว (~1 GB, ใช้เวลาไม่ถึงวินาทีบน CPU หรือ GPU) และแบบคุณภาพสูง (~4.3 GB, ใช้เวลาไม่ถึงวินาทีบน GPU) พร้อมด้วยฟีเจอร์เพิ่มเติมอีกหลายอย่างที่ผู้ใช้รอคอยมานาน
มีอะไรใหม่ในเวอร์ชัน 2.0.0:
EN: … || PL: …), หรือเลือกเป้าหมายเพียงตัวแรกเท่านั้น。translate_text, translate_srt, list_compute_devices, set_compute_deviceจำนวนเครื่องมือทั้งหมดขณะนี้คือ 19 เครื่องมือไฟล์ไบนารีสำหรับ Linux มีขนาด 161 MB ส่วนไฟล์ติดตั้งสำหรับ Windows มีขนาด 118 MB ราคาในการซื้อเท่ากัน คือ $49 สำหรับผู้ใช้ทั่วไป และ $149 สำหรับธุรกิจ ใบอนุญาตที่มีอยู่สามารถนำมาใช้ต่อได้ — เพียงแค่ ดาวน์โหลดเวอร์ชัน 2.0.0 และโมเดลการแปลจะปรากฏอยู่ในหัวข้อ Settings → Models
ดาวน์โหลดเวอร์ชัน 2.0.0 →กระบวนการฝึกอบรมได้ถูกส่งมอบแล้ว ตอนนี้การปรับแต่ง LoRA ด้วยเสียงของคุณเองสามารถทำได้แบบ end-to-end บนเครื่องของคุณเอง — แอปจะเลือกให้โดยอัตโนมัติ NVIDIA CUDA or CPUจากนั้นจะส่งออกโมเดลที่ฝึกเสร็จแล้วเป็นรูปแบบ GGUF โดยอัตโนมัติ เมื่อคุณทำการแก้ไขใดๆ ผ่าน GUI ข้อมูลเหล่านั้นจะถูกบันทึกไว้ในชุดข้อมูลฝึกส่วนตัวของคุณโดยอัตโนมัติ แผงแสดงข้อมูลการฝึกในหน้าต่างหลักจะแสดงจำนวนตัวอย่างทั้งหมดและระยะเวลาที่ใช้ในการฝึกได้อย่างชัดเจน
โบนัส: ความแม่นยำของคีย์บอร์ดเสียงได้รับการปรับปรุงในทุกภาษา เนื่องจากมีการอัปเกรด llama.cpp (เวอร์ชัน b9222) ซึ่งช่วยแก้ไขปัญหาการล่มของขอบข้อมูลในคลิปวิดีโอที่มีความยาวมาก มาพร้อมกับใบอนุญาตแบบเสียเงินทุกใบโดยไม่มีค่าใช้จ่ายเพิ่มเติม
เครื่องมือ MCP ใหม่สองตัวเพิ่งถูกเปิดตัว: start_transcription สามารถส่งคืนรหัสงานได้ทันที เพื่อให้เอเจนต์สามารถทำงานอื่นต่อไปได้ get_transcription_status โหวตเพื่อยืนยันการทำงานเสร็จสมบูรณ์ ทำงานทีละอัน และจะแสดงผลทันทีเมื่อเสร็จสิ้น ไฟล์ขนาดใหญ่จะไม่กีดขวางวงจรการทำงานของเอเจนต์อีกต่อไป
นอกจากนี้ยังมีการแก้ไขหลายประการสำหรับผลลัพธ์ SRT/VTT ในระดับคำ ได้แก่ ไม่มีช่องว่างส่วนเกินก่อนเครื่องหมายวรรคตอน ไม่มีเครื่องหมายจุดโดดเดี่ยว และไม่มีข้อความคำสำคัญ/บริบทรั่วไหลเข้ามาในบทสรุปอีกต่อไป ทำให้เกิดคำบรรยายที่สะอาดขึ้น โดยไม่จำเป็นต้องมีการแก้ไขด้วยตนเอง
ปรับเปลี่ยนโครงสร้างเอนจินใหม่ทั้งหมด ตอนนี้ Brethof Voice Pro สามารถใช้งาน Qwen3-ASR แบบ end-to-end ได้แล้ว llama.cpp โดยใช้น้ำหนักที่ถูกควอนไทซ์ในรูปแบบ GGUF libmtmdONNX Runtime หายไปแล้ว ผลลัพธ์คือขนาดไฟล์ที่ต้องดาวน์โหลดเล็กลง (ไฟล์บินารีประมาณ 83 MB ลดลงจากเดิมที่มากกว่า 400 MB) เวลาเริ่มต้นใช้งานเร็วขึ้น และไม่ต้องมาปวดหัวกับไฟล์ CUDA/DirectML ที่แตกต่างกันไปในแต่ละแพลตฟอร์มอีกต่อไป
Vulkan จะตรวจจับการ์ดจอของคุณโดยอัตโนมัติ ไม่ว่าจะเป็น NVIDIA, AMD หรือ Intel Arc และจะใช้ซีพียูเป็นทางเลือกสำรองหากไม่มีการ์ดจอ โดย 엔진เดียวกันนี้ถูกนำมาใช้กับฟีเจอร์ต่างๆ ทั้งหมด เช่น ASR, คีย์บอร์ดเสียง, เซิร์ฟเวอร์ MCP และการแปล (ในเวอร์ชัน 2.0.0)
เซิร์ฟเวอร์ Protocol สำหรับบริบทของโมเดลได้เริ่มทำงานแล้ว ตัวแทน AI ใดก็ตามที่รองรับ MCP — Claude Desktop, Claude Code, เคอร์เซอร์, ไคลน์ — สามารถทำการถอดรหัสเสียงผ่าน stdio ได้ (ไม่จำเป็นต้องมีพอร์ต ไม่จำเป็นต้องมีไฟร์วอลล์) เวอร์ชันเดียวกันนี้ยังมาพร้อมกับ ตัวเลือกอุปกรณ์ multi-GPU ดังนั้นคุณจึงสามารถเลือกได้ว่า GPU ของ Vulkan ตัวใดจะใช้สำหรับ ASR รวมถึงตัวเลือกเสริมด้วย เครื่องมือจัดเรียงแบบบังคับ ส่วนเสริมสำหรับการแสดงเวลาที่แม่นยำในระดับคำสำหรับการถอดเสียงทุกครั้ง
มีให้เฉพาะแผนเสียค่าบริการเท่านั้น — เซิร์ฟเวอร์ MCP จะไม่สามารถเริ่มทำงานได้หากไม่มีใบอนุญาตประเภทบุคคลหรือธุรกิจ brethof-voice --mcp คือการเรียกใช้งานแบบหนึ่งบรรทัด.
คำถามที่ได้รับการถามมากที่สุดก่อนการเปิดตัวคือ “macOS จะออกเมื่อไหร่?” คำตอบคือ: กำลังอยู่ในระหว่างการพัฒนา โดยจะเริ่มจากเวอร์ชันที่ทำงานบน Apple Silicon พร้อมการเร่งประสิทธิภาพด้วย Metal ก่อน ส่วนเวอร์ชันที่ใช้ Intel จะตามมา คาดว่าจะเปิดตัวในไตรมาสที่ 3 ของปี 2026 และเราจะเปิดให้ทดลองใช้งานแบบปิดในไตรมาสที่ 2 นี่คือสิ่งที่กำลังอยู่ในระหว่างการพัฒนา พร้อมวิธีการสมัครเข้าร่วมทดล
อ่านโพสต์ →Brethof Voice Pro มีฟีเจอร์ฝึกพูดส่วนตัวแบบสด ทุกครั้งที่คุณแก้ไขคำที่ระบบจดจำผิด ไฟล์เสียงพร้อมการแก้ไขจะถูกบันทึกไว้ในชุดข้อมูลฝึกฝนส่วนตัวของคุณโดยอัตโนมัติ เพียงคลิกหนึ่งครั้งที่แท็บ Training ก็สามารถปรับแต่งโมเดล LoRA ให้เหมาะกับสำเนียงของคุณได้ แอปจะเลือกใช้ NVIDIA CUDA หรือ CPU โดยอัตโนมัติ จากนั้นจึงส่งออกโมเดลที่ได้รับการฝึกฝนไปเป็นรูปแบบ GGUF มาให้ฟรีพร้อมกับลิขสิทธิ์แบบเสียค่าใช้จ่ายทุกประเภท
อ่านโพสต์ →หลังจากการพัฒนามาหลายเดือน ตอนนี้ Voice Pro v1.0 ได้วางจำหน่ายแล้วสำหรับระบบ Windows และ Linux โดยรองรับการถอดความเสียงใน 30 ภาษา พร้อมด้วยภาษาจีนใน 22 สำเนียง สามารถถอดความเสียงได้แบบออฟไลน์โดยสมบูรณ์ มีฟังก์ชันการพิมพ์ด้วยคีย์ลัดในทุกตำแหน่ง และมีราคาเพียงครั้งเดียวโดยไม่มีค่าสมัครสมาชิก นี่คือสิ่งที่ถูกรวมอยู่ในเวอร์ชันเปิดตัว และสิ่งที่เรากำลังพัฒนาต่อไป
อ่านโพสต์ →โครงการ Champions Program เปิดให้สมัครตั้งแต่วันนี้จนถึงวันที่ 16 พฤษภาคม มีใบอนุญาต Personal ฟรี 50 ใบต่อภาษาที่รองรับ รวมเป็น 1,800 ใบ พร้อมส่วนลด 70% สำหรับผู้เข้าร่วมแข่งขันที่ไม่ติดอันดับ 50 อันดับแรก นี่คือวิธีการดำเนินการและเหตุผลที่เราเลือกทำแบบนี้
อ่านโพสต์ →เราได้ฟังความคิดเห็นเบื้องต้นจากนักเขียน ที่ปรึกษา และนักแปล ซึ่งระบุว่าข้อกำหนดเดิมที่ระบุว่า “ใช้งานส่วนตัวเท่านั้น” นั้นทำให้เกิดความสับสน ปัจจุบันใบอนุญาตแบบ Personal ในราคา 49 ดอลลาร์นั้นครอบคลุมการใช้งานเพื่อการค้าทั้งในรูปแบบการทำงานคนเดียวหรือฟรีแลนซ์อย่างชัดเจน ส่วนใบอนุญาตแบบ Business (149 ดอลลาร์ต่อที่นั่ง) นั้นมีไว้สำหรับทีมงาน
อ่านโพสต์ →ตอนนี้ Brethof Voice Pro สามารถถอดเสียงและแปลข้อความได้ใน 30 ภาษาพร้อมกับภาษาถิ่นจีนอีก 22 ภาษา ได้แก่ ภาษาอาหรับ ภาษากวางตุ้ง ภาษาจีน ภาษาเช็ก ภาษาเดนมาร์ก ภาษาดัตช์ ภาษาอังกฤษ ภาษาฟิลิปปินส์ ภาษาฟินแลนด์ ภาษาฝรั่งเศส ภาษาเยอรมัน ภาษากรีก ภาษาฮินดี ภาษาฮังการี ภาษาอินโดนีเซีย ภาษาอิตาลี ภาษาญี่ปุ่น ภาษาเกาหลี ภาษามาซิโดเนีย ภาษามาเลย์ ภาษาเปอร์เซีย ภาษาโปแลนด์ ภาษาโปรตุเกส ภาษาโรมาเนีย ภาษารัสเซีย ภาษาสเปน ภาษาสวีเดน ภา�
อ่านโพสต์ →เบื้องหลังการทำงานของโมดูล ASR ใน Brethof Voice Pro คือการใช้ llama.cpp ร่วมกับแบบจำลอง Qwen ที่ถูกควอนไทซ์ในรูปแบบ GGUF แทนการใช้ ONNX Runtime สิ่งที่ได้คือขนาดไฟล์ที่เล็กลง (ไฟล์ exe ขนาด 83 MB เทียบกับมากกว่า 400 MB) การเริ่มต้นใช้งานที่รวดเร็วยิ่งขึ้น และไม่ต้องมาปวดหัวกับไลบรารี CUDA/DirectML บนแต่ละแพลตฟอร์มอีกต่อไป นี่คือเรื่องราวด้านวิศวกรรมเบื้องหลังการเปลี่ยนแปลงนี้
อ่านโพสต์ →ผลิตภัณฑ์สำหรับพิมพ์ด้วยเสียงชั้นนำทุกตัวจะส่งเสียงของคุณไปยังเซิร์ฟเวอร์ของบุคคลอื่น เรามองว่านั่นเป็นการตั้งค่าเริ่มต้นที่ผิด โดยเสียงของคุณถือเป็นข้อมูลส่วนบุคคลที่สำคัญที่สุดที่คุณสร้างขึ้น ไม่ว่าจะเป็นบันทึกทางการแพทย์ ร่างเอกสารทางกฎหมาย ไดอารี่ส่วนตัว หรือความลับในที่ทำงาน นี่คือเหตุผลว่าทำไม Voice Pro จึงไม่มีโหมดคลาวด์ ไม่มีระบบส่งข้อมูลเพิ่มเติมแบบเลือกใช้ได
อ่านโพสต์ →สร้างบัญชีเพื่อรับการแจ้งเตือนเมื่อเราเผยแพร่โพสต์ใหม่และส่งมอบเวอร์ชันใหม่
สร้างบัญชีระบบแปลงเสียงเป็นข้อความแบบออฟไลน์ที่เรียนรู้เสียงของคุณได้ ใบอนุญาตถาวร ผลิตภัณฑ์ระดับเรือธงของเรา
แบบเสียค่าใช้จ่าย · ฟลากชิป
หน่วยความจำระยะยาวในเครื่องสำหรับ Claude Code — ข้อความเต็ม + เวกเตอร์ + กราฟ บน SurrealDB. MIT.
ฟรี · โอเพนซอร์ส
แบบจำลองดิจิทัลสำหรับพิมพ์ได้เลย พร้อมรูปแบบ STL/3MF/OBJ เข้าใช้งานได้ตลอดชีพ
แบบเสียค่าใช้จ่าย · แคตตาล็อกดิจิทัล
ผลิตภัณฑ์ที่มีลวดลายพิมพ์ของเราถูกส่งไปทั่วทวีปยุโรป โปรดซื้อผลิตภัณฑ์จริง ไม่ใช่ไฟล์
PAID · วัตถุทางกายภาพ
โฮสต์ AI Cyber-tiger อธิบาย AI ที่ให้ความสำคัญกับความเป็นส่วนตัว โดยปราศจากตัวกรองจากบริษัท
ช่อง · สตรีมสด
รายการที่คัดสรรจาก GitHub สำหรับ AI, MCP, AI แบบโลคัล, Linux สำหรับ AI และอื่นๆ มีเพียงหลักฐานยืนยัน ไม่ใช่แค่ความรู้สึก
ฟรี · คัดสรรมาอย่างพิถีพิถัน
คู่มือแบบละเอียดสำหรับการใช้งาน AI แบบโลคัลบน Linux, Windows, macOS พร้อมการตั้งค่าจริง ไม่ใช่เนื้อหาทางการตลาด
ฟรี · กำลังจะมาถึงเร็วๆ นี้
กราฟ ComfyUI ที่ผ่านการทดสอบในการผลิตจริง — LTX chunked-loop, โหนด Nova และอื่นๆ อีกมากมาย
ฟรี · หน้า Landing ของเวิร์กโฟลว์
การคัดกรองแบบลบ: แนวปฏิบัติและเครื่องมือที่เสียเวลาของคุณ เรียงลำดับตามความสำคัญ พร้อมหลักฐานอ้างอิง
ฟรี · กำลังจะมาถึงเร็วๆ นี้
เราคือใคร เหตุใดเราจึงสร้าง AI ที่ให้ความสำคัญกับการใช้งานในท้องถิ่นเป็นอันดับแรก และสิ่งใดที่เราจะไม่ทำ