การอัปเดต — Brethof Voice Pro

เปิดตัว 21 พฤษภาคม 2026

v2.0.0 — การแปลแบบออฟไลน์ 38 ภาษา

Brethof Voice Pro ไม่ใช่เพียงโปรแกรมแปลงเสียงเป็นข้อความอีกต่อไป มีการเปิดตัวเวอร์ชัน 2.0.0 แล้ว การแปลแบบออฟไลน์ ให้พลังโดย Tencent Hunyuan MT2 — ใน FLORES-200 (XCOMET-XXL) ระดับ 7B สามารถทำได้ 97.9% ของ Google Gemini 3.1 Proนอกจากนี้ยังทำผลได้ดีกว่า Gemini ในการทดสอบในโลกแห่งความเป็นจริงและภาษาชนกลุ่มน้อย การแปลจะดำเนินการบนเครื่องของคุณเองทั้งหมด มีสองระดับของโมเดลให้เลือก โดยสามารถดาวน์โหลดตามความต้องการ: แบบเร็ว (~1 GB, ใช้เวลาไม่ถึงวินาทีบน CPU หรือ GPU) และแบบคุณภาพสูง (~4.3 GB, ใช้เวลาไม่ถึงวินาทีบน GPU) พร้อมด้วยฟีเจอร์เพิ่มเติมอีกหลายอย่างที่ผู้ใช้รอคอยมานาน

มีอะไรใหม่ในเวอร์ชัน 2.0.0:

ถอดเสียง + แปลภาษา — ในหน้าต่าง Transcribe จะมีช่องดรอปดาวน์ “Translate to:” โปรแกรม ASR ทำหน้าที่ถอดเสียง ส่วนโปรแกรม MT ทำหน้าที่แปลข้อความ ผลลัพธ์จะแสดงข้างกัน สามารถใช้งานได้กับไฟล์ เสียงจากไมโครโฟน และเสียงในระบบ (เช่น เสียงจากการประชุมผ่านวิดีโอคอล เสียงจากแท็บเบราว์เซอร์ หรือเสียงใดๆ ที่เล่นออกมาจากลำโพง)
คีย์บอร์ดเสียงหลายภาษา — ชิปแปลใหม่บนแถวหลักจะสร้างกริดภาษา 3 คอลัมน์ขึ้นมา ให้เลือกภาษาปลายทางหนึ่งภาษาหรือมากกว่า จากนั้นคีย์บอร์ดจะทำการพิมพ์ผลแปลออกมา โหมดการจัดวาง: หนึ่งบรรทัดต่อภาษา, แบบฝังในข้อความEN: … || PL: …), หรือเลือกเป้าหมายเพียงตัวแรกเท่านั้น。
โปรแกรมแปลคำบรรยาย SRT / VTT — รักษาเวลาและดัชนีคำสั่งไว้ รองรับโหมดสองภาษา (บรรทัดภาษาต้นฉบับ + การแปลสำหรับแต่ละคำสั่ง) สามารถใช้งานผ่าน MCP เพื่อการอัตโนมัติของ AI-agent ได้
GPU หลายตัวต่อเอนจินหนึ่งตัว — ในส่วน Settings → Models จะมีตัวเลือกสำหรับเลือกอุปกรณ์แยกกันสำหรับแต่ละ 엔진 ให้รัน ASR บน Vulkan 0 และรันการแปลบน Vulkan 1 หรือจะกำหนดให้ Hunyuan MT2 7B ทำงานบน CPU ในโน้ตบุ๊กที่มี VRAM จำกัดก็ได้
การฝึกพูดส่วนบุคคลทำได้แบบสดๆ เต็มรูปแบบ — การปรับแต่ง LoRA ด้วยเสียงของคุณเอง โดยทำได้แบบ end-to-end บนเครื่องของคุณเอง บนหน้าต่างหลัก การ์ดแสดงข้อมูลการฝึกจะแสดงจำนวนตัวอย่างทั้งหมดและระยะเวลาที่บันทึกไว้อย่างชัดเจน ปุ่ม “Start training” ในแท็บ Training จะเลือกใช้ NVIDIA CUDA หรือ CPU โดยอัตโนมัติ จากนั้นจึงส่งออกโมเดลที่ได้รับการฝึกมาเป็นรูปแบบ GGUF ให้โดยอัตโนมัติ มีให้ใช้ฟรีพร้อมกับใบอนุญาตแบบเสียเงินทุกประเภท
เครื่องมือ MCP ใหม่ 4 ตัว — translate_text, translate_srt, list_compute_devices, set_compute_deviceจำนวนเครื่องมือทั้งหมดขณะนี้คือ 19 เครื่องมือ
ภาษาที่ซื่อสัตย์แบ่งแยกได้ — ASR: รองรับภาษาให้เลือก 30 ภาษา พร้อมระบบตรวจจับภาษาอัตโนมัติ และภาษาถิ่นจีน 22 ภาษา (รวมทั้งหมด 52 ภาษา) ส่วนการแปลนั้นรองรับ 38 ภาษา (33 ภาษาหลัก + 5 ภาษาของชนกลุ่มน้อยในพื้นที่จีน) โดยมี 23 ภาษาที่สามารถแปลไปมาได้

ไฟล์ไบนารีสำหรับ Linux มีขนาด 161 MB ส่วนไฟล์ติดตั้งสำหรับ Windows มีขนาด 118 MB ราคาในการซื้อเท่ากัน คือ $49 สำหรับผู้ใช้ทั่วไป และ $149 สำหรับธุรกิจ ใบอนุญาตที่มีอยู่สามารถนำมาใช้ต่อได้ — เพียงแค่ ดาวน์โหลดเวอร์ชัน 2.0.0 และโมเดลการแปลจะปรากฏอยู่ในหัวข้อ Settings → Models

ดาวน์โหลดเวอร์ชัน 2.0.0 →

เปิดตัว 20 พฤษภาคม 2026

v1.6.16 — การฝึกเสียงส่วนบุคคลพร้อมใช้งานแล้ว

กระบวนการฝึกอบรมได้ถูกส่งมอบแล้ว ตอนนี้การปรับแต่ง LoRA ด้วยเสียงของคุณเองสามารถทำได้แบบ end-to-end บนเครื่องของคุณเอง — แอปจะเลือกให้โดยอัตโนมัติ NVIDIA CUDA or CPUจากนั้นจะส่งออกโมเดลที่ฝึกเสร็จแล้วเป็นรูปแบบ GGUF โดยอัตโนมัติ เมื่อคุณทำการแก้ไขใดๆ ผ่าน GUI ข้อมูลเหล่านั้นจะถูกบันทึกไว้ในชุดข้อมูลฝึกส่วนตัวของคุณโดยอัตโนมัติ แผงแสดงข้อมูลการฝึกในหน้าต่างหลักจะแสดงจำนวนตัวอย่างทั้งหมดและระยะเวลาที่ใช้ในการฝึกได้อย่างชัดเจน

โบนัส: ความแม่นยำของคีย์บอร์ดเสียงได้รับการปรับปรุงในทุกภาษา เนื่องจากมีการอัปเกรด llama.cpp (เวอร์ชัน b9222) ซึ่งช่วยแก้ไขปัญหาการล่มของขอบข้อมูลในคลิปวิดีโอที่มีความยาวมาก มาพร้อมกับใบอนุญาตแบบเสียเงินทุกใบโดยไม่มีค่าใช้จ่ายเพิ่มเติม

วิศวกรรมศาสตร์ 15 พฤษภาคม 2026

v1.6.0 — งานถอดเสียงแบบอะซิงโครนัส + การปรับปรุงไฟล์ SRT ในระดับคำ

เครื่องมือ MCP ใหม่สองตัวเพิ่งถูกเปิดตัว: start_transcription สามารถส่งคืนรหัสงานได้ทันที เพื่อให้เอเจนต์สามารถทำงานอื่นต่อไปได้ get_transcription_status โหวตเพื่อยืนยันการทำงานเสร็จสมบูรณ์ ทำงานทีละอัน และจะแสดงผลทันทีเมื่อเสร็จสิ้น ไฟล์ขนาดใหญ่จะไม่กีดขวางวงจรการทำงานของเอเจนต์อีกต่อไป

นอกจากนี้ยังมีการแก้ไขหลายประการสำหรับผลลัพธ์ SRT/VTT ในระดับคำ ได้แก่ ไม่มีช่องว่างส่วนเกินก่อนเครื่องหมายวรรคตอน ไม่มีเครื่องหมายจุดโดดเดี่ยว และไม่มีข้อความคำสำคัญ/บริบทรั่วไหลเข้ามาในบทสรุปอีกต่อไป ทำให้เกิดคำบรรยายที่สะอาดขึ้น โดยไม่จำเป็นต้องมีการแก้ไขด้วยตนเอง

วิศวกรรมศาสตร์ 15 พฤษภาคม 2026

v1.5.0 — ยกเลิกการใช้งาน ONNX โดยตอนนี้ใช้เฉพาะ llama.cpp + libmtmd เท่านั้น

ปรับเปลี่ยนโครงสร้างเอนจินใหม่ทั้งหมด ตอนนี้ Brethof Voice Pro สามารถใช้งาน Qwen3-ASR แบบ end-to-end ได้แล้ว llama.cpp โดยใช้น้ำหนักที่ถูกควอนไทซ์ในรูปแบบ GGUF libmtmdONNX Runtime หายไปแล้ว ผลลัพธ์คือขนาดไฟล์ที่ต้องดาวน์โหลดเล็กลง (ไฟล์บินารีประมาณ 83 MB ลดลงจากเดิมที่มากกว่า 400 MB) เวลาเริ่มต้นใช้งานเร็วขึ้น และไม่ต้องมาปวดหัวกับไฟล์ CUDA/DirectML ที่แตกต่างกันไปในแต่ละแพลตฟอร์มอีกต่อไป

Vulkan จะตรวจจับการ์ดจอของคุณโดยอัตโนมัติ ไม่ว่าจะเป็น NVIDIA, AMD หรือ Intel Arc และจะใช้ซีพียูเป็นทางเลือกสำรองหากไม่มีการ์ดจอ โดย 엔진เดียวกันนี้ถูกนำมาใช้กับฟีเจอร์ต่างๆ ทั้งหมด เช่น ASR, คีย์บอร์ดเสียง, เซิร์ฟเวอร์ MCP และการแปล (ในเวอร์ชัน 2.0.0)

วิศวกรรมศาสตร์ 14 พฤษภาคม 2026

v1.4.0 — การเปิดตัวเซิร์ฟเวอร์ MCP + เครื่องมือเลือกอุปกรณ์ GPU หลายตัว

เซิร์ฟเวอร์ Protocol สำหรับบริบทของโมเดลได้เริ่มทำงานแล้ว ตัวแทน AI ใดก็ตามที่รองรับ MCP — Claude Desktop, Claude Code, เคอร์เซอร์, ไคลน์ — สามารถทำการถอดรหัสเสียงผ่าน stdio ได้ (ไม่จำเป็นต้องมีพอร์ต ไม่จำเป็นต้องมีไฟร์วอลล์) เวอร์ชันเดียวกันนี้ยังมาพร้อมกับ ตัวเลือกอุปกรณ์ multi-GPU ดังนั้นคุณจึงสามารถเลือกได้ว่า GPU ของ Vulkan ตัวใดจะใช้สำหรับ ASR รวมถึงตัวเลือกเสริมด้วย เครื่องมือจัดเรียงแบบบังคับ ส่วนเสริมสำหรับการแสดงเวลาที่แม่นยำในระดับคำสำหรับการถอดเสียงทุกครั้ง

มีให้เฉพาะแผนเสียค่าบริการเท่านั้น — เซิร์ฟเวอร์ MCP จะไม่สามารถเริ่มทำงานได้หากไม่มีใบอนุญาตประเภทบุคคลหรือธุรกิจ brethof-voice --mcp คือการเรียกใช้งานแบบหนึ่งบรรทัด.

แผนงานระยะยาว 16 เมษายน 2026

เวอร์ชัน macOS อยู่ระหว่างการพัฒนา — เริ่มต้นด้วย Apple Silicon

คำถามที่ได้รับการถามมากที่สุดก่อนการเปิดตัวคือ “macOS จะออกเมื่อไหร่?” คำตอบคือ: กำลังอยู่ในระหว่างการพัฒนา โดยจะเริ่มจากเวอร์ชันที่ทำงานบน Apple Silicon พร้อมการเร่งประสิทธิภาพด้วย Metal ก่อน ส่วนเวอร์ชันที่ใช้ Intel จะตามมา คาดว่าจะเปิดตัวในไตรมาสที่ 3 ของปี 2026 และเราจะเปิดให้ทดลองใช้งานแบบปิดในไตรมาสที่ 2 นี่คือสิ่งที่กำลังอยู่ในระหว่างการพัฒนา พร้อมวิธีการสมัครเข้าร่วมทดล

อ่านโพสต์ →

ผลิตภัณฑ์ 16 เมษายน 2026

การฝึกโมเดลส่วนบุคคล — ปรับแต่ง Brethof Voice Pro ให้เข้ากับเสียงของคุณเอง

Brethof Voice Pro มีฟีเจอร์ฝึกพูดส่วนตัวแบบสด ทุกครั้งที่คุณแก้ไขคำที่ระบบจดจำผิด ไฟล์เสียงพร้อมการแก้ไขจะถูกบันทึกไว้ในชุดข้อมูลฝึกฝนส่วนตัวของคุณโดยอัตโนมัติ เพียงคลิกหนึ่งครั้งที่แท็บ Training ก็สามารถปรับแต่งโมเดล LoRA ให้เหมาะกับสำเนียงของคุณได้ แอปจะเลือกใช้ NVIDIA CUDA หรือ CPU โดยอัตโนมัติ จากนั้นจึงส่งออกโมเดลที่ได้รับการฝึกฝนไปเป็นรูปแบบ GGUF มาให้ฟรีพร้อมกับลิขสิทธิ์แบบเสียค่าใช้จ่ายทุกประเภท

อ่านโพสต์ →

ประกาศ 16 เมษายน 2026

Brethof Voice Pro พร้อมใช้งานแล้ว — ฟีเจอร์แปลงเสียงเป็นข้อความที่ทำงานบนเครื่องของคุณโดยตรง

หลังจากการพัฒนามาหลายเดือน ตอนนี้ Voice Pro v1.0 ได้วางจำหน่ายแล้วสำหรับระบบ Windows และ Linux โดยรองรับการถอดความเสียงใน 30 ภาษา พร้อมด้วยภาษาจีนใน 22 สำเนียง สามารถถอดความเสียงได้แบบออฟไลน์โดยสมบูรณ์ มีฟังก์ชันการพิมพ์ด้วยคีย์ลัดในทุกตำแหน่ง และมีราคาเพียงครั้งเดียวโดยไม่มีค่าสมัครสมาชิก นี่คือสิ่งที่ถูกรวมอยู่ในเวอร์ชันเปิดตัว และสิ่งที่เรากำลังพัฒนาต่อไป

อ่านโพสต์ →

แชมเปียนส์ 16 เมษายน 2026

มีใบอนุญาตฟรี 1,800 ใบให้รับไปใช้: โครงการ Champions Program เปิดรับสมัครแล้ว

โครงการ Champions Program เปิดให้สมัครตั้งแต่วันนี้จนถึงวันที่ 16 พฤษภาคม มีใบอนุญาต Personal ฟรี 50 ใบต่อภาษาที่รองรับ รวมเป็น 1,800 ใบ พร้อมส่วนลด 70% สำหรับผู้เข้าร่วมแข่งขันที่ไม่ติดอันดับ 50 อันดับแรก นี่คือวิธีการดำเนินการและเหตุผลที่เราเลือกทำแบบนี้

อ่านโพสต์ →

การอนุญาตใช้งาน 16 เมษายน 2026

ใบอนุญาตส่วนบุคคลปัจจุบันครอบคลุมทั้งการทำธุรกิจเดี่ยวและงานฟรีแลนซ์

เราได้ฟังความคิดเห็นเบื้องต้นจากนักเขียน ที่ปรึกษา และนักแปล ซึ่งระบุว่าข้อกำหนดเดิมที่ระบุว่า “ใช้งานส่วนตัวเท่านั้น” นั้นทำให้เกิดความสับสน ปัจจุบันใบอนุญาตแบบ Personal ในราคา 49 ดอลลาร์นั้นครอบคลุมการใช้งานเพื่อการค้าทั้งในรูปแบบการทำงานคนเดียวหรือฟรีแลนซ์อย่างชัดเจน ส่วนใบอนุญาตแบบ Business (149 ดอลลาร์ต่อที่นั่ง) นั้นมีไว้สำหรับทีมงาน

อ่านโพสต์ →

ผลิตภัณฑ์ 12 เมษายน 2026

ภาษาสำหรับการถอดเสียง 30 ภาษา อินเทอร์เฟซที่ได้รับการแปลอย่างครบถ้วน — ไม่ใช่ข้อความที่แปลโดยเครื่องจักร

ตอนนี้ Brethof Voice Pro สามารถถอดเสียงและแปลข้อความได้ใน 30 ภาษาพร้อมกับภาษาถิ่นจีนอีก 22 ภาษา ได้แก่ ภาษาอาหรับ ภาษากวางตุ้ง ภาษาจีน ภาษาเช็ก ภาษาเดนมาร์ก ภาษาดัตช์ ภาษาอังกฤษ ภาษาฟิลิปปินส์ ภาษาฟินแลนด์ ภาษาฝรั่งเศส ภาษาเยอรมัน ภาษากรีก ภาษาฮินดี ภาษาฮังการี ภาษาอินโดนีเซีย ภาษาอิตาลี ภาษาญี่ปุ่น ภาษาเกาหลี ภาษามาซิโดเนีย ภาษามาเลย์ ภาษาเปอร์เซีย ภาษาโปแลนด์ ภาษาโปรตุเกส ภาษาโรมาเนีย ภาษารัสเซีย ภาษาสเปน ภาษาสวีเดน ภา�

อ่านโพสต์ →

วิศวกรรมศาสตร์ 8 เมษายน 2026

ทำไมเราถึงเปลี่ยนจาก ONNX เป็น GGUF — ทั้งเร็วขึ้น มีขนาดเล็กลง และสามารถนำไปใช้งานได้ง่ายขึ้น

เบื้องหลังการทำงานของโมดูล ASR ใน Brethof Voice Pro คือการใช้ llama.cpp ร่วมกับแบบจำลอง Qwen ที่ถูกควอนไทซ์ในรูปแบบ GGUF แทนการใช้ ONNX Runtime สิ่งที่ได้คือขนาดไฟล์ที่เล็กลง (ไฟล์ exe ขนาด 83 MB เทียบกับมากกว่า 400 MB) การเริ่มต้นใช้งานที่รวดเร็วยิ่งขึ้น และไม่ต้องมาปวดหัวกับไลบรารี CUDA/DirectML บนแต่ละแพลตฟอร์มอีกต่อไป นี่คือเรื่องราวด้านวิศวกรรมเบื้องหลังการเปลี่ยนแปลงนี้

อ่านโพสต์ →

หลักการ 4 เมษายน 2026

เหตุใด Brethof Voice Pro จึงสามารถทำงานได้ 100% แบบออฟไลน์ — และทำไมนั่นจึงไม่ใช่เพียงแค่ฟีเจอร์หนึ่งเท่านั้น

ผลิตภัณฑ์สำหรับพิมพ์ด้วยเสียงชั้นนำทุกตัวจะส่งเสียงของคุณไปยังเซิร์ฟเวอร์ของบุคคลอื่น เรามองว่านั่นเป็นการตั้งค่าเริ่มต้นที่ผิด โดยเสียงของคุณถือเป็นข้อมูลส่วนบุคคลที่สำคัญที่สุดที่คุณสร้างขึ้น ไม่ว่าจะเป็นบันทึกทางการแพทย์ ร่างเอกสารทางกฎหมาย ไดอารี่ส่วนตัว หรือความลับในที่ทำงาน นี่คือเหตุผลว่าทำไม Voice Pro จึงไม่มีโหมดคลาวด์ ไม่มีระบบส่งข้อมูลเพิ่มเติมแบบเลือกใช้ได

อ่านโพสต์ →

รับข่าวสารล่าสุดในกล่องจดหมายของคุณ

สร้างบัญชีเพื่อรับการแจ้งเตือนเมื่อเราเผยแพร่โพสต์ใหม่และส่งมอบเวอร์ชันใหม่

สร้างบัญชี

ผลิตภัณฑ์ การอัปเดต

v2.0.0 — การแปลแบบออฟไลน์ 38 ภาษา

v1.6.16 — การฝึกเสียงส่วนบุคคลพร้อมใช้งานแล้ว

v1.6.0 — งานถอดเสียงแบบอะซิงโครนัส + การปรับปรุงไฟล์ SRT ในระดับคำ

v1.5.0 — ยกเลิกการใช้งาน ONNX โดยตอนนี้ใช้เฉพาะ llama.cpp + libmtmd เท่านั้น

v1.4.0 — การเปิดตัวเซิร์ฟเวอร์ MCP + เครื่องมือเลือกอุปกรณ์ GPU หลายตัว

เวอร์ชัน macOS อยู่ระหว่างการพัฒนา — เริ่มต้นด้วย Apple Silicon

การฝึกโมเดลส่วนบุคคล — ปรับแต่ง Brethof Voice Pro ให้เข้ากับเสียงของคุณเอง

Brethof Voice Pro พร้อมใช้งานแล้ว — ฟีเจอร์แปลงเสียงเป็นข้อความที่ทำงานบนเครื่องของคุณโดยตรง

มีใบอนุญาตฟรี 1,800 ใบให้รับไปใช้: โครงการ Champions Program เปิดรับสมัครแล้ว

ใบอนุญาตส่วนบุคคลปัจจุบันครอบคลุมทั้งการทำธุรกิจเดี่ยวและงานฟรีแลนซ์

ภาษาสำหรับการถอดเสียง 30 ภาษา อินเทอร์เฟซที่ได้รับการแปลอย่างครบถ้วน — ไม่ใช่ข้อความที่แปลโดยเครื่องจักร

ทำไมเราถึงเปลี่ยนจาก ONNX เป็น GGUF — ทั้งเร็วขึ้น มีขนาดเล็กลง และสามารถนำไปใช้งานได้ง่ายขึ้น

เหตุใด Brethof Voice Pro จึงสามารถทำงานได้ 100% แบบออฟไลน์ — และทำไมนั่นจึงไม่ใช่เพียงแค่ฟีเจอร์หนึ่งเท่านั้น

รับข่าวสารล่าสุดในกล่องจดหมายของคุณ

ทุกสิ่งที่เราสร้างขึ้นมา

Brethof Voice Pro

Brethof-Mind

แบบจำลอง 3D

การพิมพ์สามมิติ

โนวา

รายการที่ยอดเยี่ยม

คู่มือ

เวิร์กโฟลว์ของ ComfyUI

รายการระดับ Anti-dev

เกี่ยวกับ Brethof AI