ถอดเสียง 30 ภาษา + 22 ภาษาถิ่นจีน
แปลเป็นภาษาไทย 38 ภาษา ใช้งานได้โดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต
เวลาที่บันทึก สร้างคำบรรยายของคุณเองได้
เซิร์ฟเวอร์ MCP พูดคุยกับมันผ่านชุดเทคโนโลยี AI ของคุณ
ทำงานแบบออฟไลน์ — แม้ในโน้ตบุ๊กก็ได้•ไม่มีค่าสมัครสมาชิก•ทดลองใช้ฟรี 14 วัน
ทุกคำที่คุณพูดจะได้รับการประมวลผลบนอุปกรณ์ของคุณเอง ไม่มีการส่งข้อมูลเสียง ข้อความ หรือข้อมูลเมตาใดๆ ไปยังเซิร์ฟเวอร์ใดๆ เลย ไม่มีบริการแบ็กเอนด์บนคลาวด์ ไม่มีการส่งข้อมูลเพื่อติดตามสถานะ ไม่มีการวิเคราะห์ข้อมูล และไม่มีการส่งข้อมูลกลับไปยังศูนย์กลางด้วย
Brethof Voice Pro ใช้เครื่องยนต์ที่ได้รับการปรับแต่งสำหรับรูปแบบ GGUF ร่วมกับ llama.cpp เพื่อให้การประมวลผลทำได้อย่างรวดเร็ว โดยรองรับผลิตภัณฑ์ GPU ชั้นนำทั้งสามยี่ห้อได้ทันทีโดยไม่ต้องตั้งค่าเพิ่มเติม
ใช้เทคโนโลยี Qwen3-ASR ผ่าน llama.cpp เพื่อแปลข้อความ คุณสามารถกำหนดภาษาที่ต้องการใช้เพื่อให้ได้ความแม่นยำสูงสุด หรือปล่อยให้เครื่องมือตรวจจับภาษาโดยอัตโนมัติก็ได้ ข้อความทั้งหมดจะยังคงอยู่ในเครื่องของคุณเอง
นอกจากนี้ยังรองรับภาษาถิ่นจีน 22 ภาษา (เช่น อานฮุย, ตงเป่ย, ฝูเจี้ยน, เหอหนาน, หูหนาน, ซานตง, สี่ฉวน, วู, มินหนาน และอื่นๆ) โดยจะถูกระบุโดยอัตโนมัติเมื่อตั้งภาษาเป็นภาษาจีนหรือใช้โหมดตรวจจับภาษาอัตโนมัติ
สามารถแปลไฟล์การถอดเสียง ผลลัพธ์จากคีย์บอร์ดเสียง ข้อความธรรมดา หรือไฟล์คำบรรยายได้ทั้งหมด — โดยทำการแปลบนเครื่องของคุณเอง ใช้เทคโนโลยีจาก Tencent Hunyuan MT2: ใน FLORES-200 (XCOMET-XXL) ระดับคุณภาพจะอยู่ที่ 97.9% ของ Google Gemini 3.1 Pro นอกจากนี้ยังมีรุ่น Fast ขนาดกะทัดรัดที่มีประสิทธิภาพ 89.9% ซึ่งสามารถเอาชนะ Gemini 3.1 Pro ได้ในการแปลในสถานการณ์จริง (WildMTBench) และการแปลภาษาที่มีผู้พูดน้อย
เลือกระดับความแม่นยำ ความเร็ว และปริมาณ VRAM ที่เหมาะสมกับเครื่องของคุณ ทั้งสองตัวใช้อาร์คิเทคเจอร์ Qwen3-ASR เดียวกัน สามารถเปลี่ยนได้ตลอดเวลาผ่านหน้า Settings → Models
สามารถดาวน์โหลดส่วนเสริมตามความต้องการได้จาก Settings → Models: เครื่องมือจัดเรียงแบบบังคับ (ประมาณ 540 MB) สำหรับเวลาที่ระบุในระดับคำ Hunyuan MT2 Fast (ประมาณ 1 GB) หรือ คุณภาพ (ประมาณ 4.3 GB) สำหรับการแปล。
ฟีเจอร์ DeepFilter สำหรับลดเสียงรบกวนแบบไม่บังคับ สำหรับการบันทึกในห้องที่มีเสียงรบกวน — ปิดอยู่โดยค่าเริ่มต้น สามารถเปิดได้จากหน้าต่างป๊อปอัป Noise การไม่ใช้ฟีเจอร์นี้กับไฟล์เสียงที่มีคุณภาพดีจริงๆ จะช่วยให้คุณภาพดียิ่งขึ้น (DeepFilter อาจประมวลผลเสียงที่สั้นและบริสุท�
ปรับแต่งโมเดลให้เข้ากับเสียงของคุณเองด้วย LoRA — สามารถทำงานแบบ end-to-end บนเครื่องของคุณได้เลย ทุกครั้งที่คุณแก้ไขคำที่ระบบจดจำผิด เซตข้อมูล {clip, correction} นั้นจะถูกบันทึกเข้าไปในชุดข้อมูลฝึกอบรมส่วนตัวของคุณ แผงการฝึกอบรมในหน้าต่างหลักจะแสดงจำนวนตัวอย่างทั้งหมดและเวลาที่บันทึกไว้อย่างชัดเจน — คลิกที่นั่นเพื่อเปิดเครื่องมือดูชุดข้อมูล จากนั้นคลิก “Start training” ในแท็บ Training
กดคีย์ลัดไว้ พูดออกมา แล้วข้อความจะปรากฏตรงที่เคอร์เซอร์อยู่ — เหมือนกับการใช้คีย์บอร์ด สามารถใช้งานได้ในเว็บเบราว์เซอร์ โปรแกรมพัฒนาซอฟต์แวร์ ไทล์เอ็น แอปพลิเคชันแชท และทุกที่ที่ฟิลด์ข้อความรับอินพุตจากคีย์บอร์ดได้
EN: … || PL: …), หรือเลือกเป้าหมายเพียงตัวแรกเท่านั้น。ที่ดินผืนเดียว ใช้ได้สองอย่าง สร้างความลำเอียง ASR สำหรับคำนามเฉพาะ ชื่อแบรนด์ และศัพท์เฉพาะ — ช่วยลดโอกาสที่ “VFIO” จะถูกแปลผิดเป็น “VEAF1” ส่วนฟิลด์เดียวกันนี้ยังใช้งานได้หลายอย่างอีกด้วย พจนานุกรมศัพท์เฉพาะด้านการแปล — ติดป้าย “Brethof Voice” เพื่อให้ยังคงเป็น “Brethof Voice” ในทุกภาษาเป้าหมาย
ไฟล์ไบนารีเดียวกันที่ใช้รันอินเตอร์เฟซผู้ใช้สามารถใช้งานเป็นเซิร์ฟเวอร์ Model Context Protocol ได้เช่นกัน — โดยมีเครื่องมือ 19 ตัวที่ช่วยให้สามารถใช้งานฟีเจอร์ ASR และ MT ได้กับ Claude Desktop, Claude Code, Cursor, Cline หรือเอเจนต์ใดๆ ที่รองรับ MCP การส่งข้อมูลทำผ่าน stdio: ไม่มีการกำหนดพอร์ต ไม่มีไฟร์วอลล์ และไม่มีการเชื่อมต่อกับ localhost เอเจนต์เป็นผู้ควบคุมวงจรชีวิตของโปรแกรมเอง
รัน brethof-voice --mcp และเอเจนต์จะเชื่อมต่อผ่าน stdio จำเป็นต้องมีใบอนุญาตแบบเสียค่าใช้จ่าย — ผู้ใช้ทดลองไม่สามารถเริ่มต้นเซิร์ฟเวอร์ได้
ทดลองใช้ฟรี 14 วัน มีฟีเจอร์ทั้งหมดให้ใช้งานได้เลย ไม่จำเป็นต้องใช้บัตรเครดิต
ระบบแปลงเสียงเป็นข้อความแบบออฟไลน์ที่เรียนรู้เสียงของคุณได้ ใบอนุญาตถาวร ผลิตภัณฑ์ระดับเรือธงของเรา
แบบเสียค่าใช้จ่าย · ฟลากชิป
หน่วยความจำระยะยาวในเครื่องสำหรับ Claude Code — ข้อความเต็ม + เวกเตอร์ + กราฟ บน SurrealDB. MIT.
ฟรี · โอเพนซอร์ส
แบบจำลองดิจิทัลสำหรับพิมพ์ได้เลย พร้อมรูปแบบ STL/3MF/OBJ เข้าใช้งานได้ตลอดชีพ
แบบเสียค่าใช้จ่าย · แคตตาล็อกดิจิทัล
ผลิตภัณฑ์ที่มีลวดลายพิมพ์ของเราถูกส่งไปทั่วทวีปยุโรป โปรดซื้อผลิตภัณฑ์จริง ไม่ใช่ไฟล์
PAID · วัตถุทางกายภาพ
โฮสต์ AI Cyber-tiger อธิบาย AI ที่ให้ความสำคัญกับความเป็นส่วนตัว โดยปราศจากตัวกรองจากบริษัท
ช่อง · สตรีมสด
รายการที่คัดสรรจาก GitHub สำหรับ AI, MCP, AI แบบโลคัล, Linux สำหรับ AI และอื่นๆ มีเพียงหลักฐานยืนยัน ไม่ใช่แค่ความรู้สึก
ฟรี · คัดสรรมาอย่างพิถีพิถัน
คู่มือแบบละเอียดสำหรับการใช้งาน AI แบบโลคัลบน Linux, Windows, macOS พร้อมการตั้งค่าจริง ไม่ใช่เนื้อหาทางการตลาด
ฟรี · กำลังจะมาถึงเร็วๆ นี้
กราฟ ComfyUI ที่ผ่านการทดสอบในการผลิตจริง — LTX chunked-loop, โหนด Nova และอื่นๆ อีกมากมาย
ฟรี · หน้า Landing ของเวิร์กโฟลว์
การคัดกรองแบบลบ: แนวปฏิบัติและเครื่องมือที่เสียเวลาของคุณ เรียงลำดับตามความสำคัญ พร้อมหลักฐานอ้างอิง
ฟรี · กำลังจะมาถึงเร็วๆ นี้
เราคือใคร เหตุใดเราจึงสร้าง AI ที่ให้ความสำคัญกับการใช้งานในท้องถิ่นเป็นอันดับแรก และสิ่งใดที่เราจะไม่ทำ