AI 19 พฤษภาคม 2569 อ่าน 2 นาที

TTS offline 99M parameters 31 ภาษา — รันบน CPU ก็ได้

🔥 TTS offline 99M parameters 31 ภาษา — รันบน CPU ก็ได้

ทั่ว ๆ ไป TTS คุณภาพดีต้องใช้โมเดลใหญ่ 0.7B-2B parameters + GPU

Supertonic กลับกันเลยครับ — 99M params รันบน ONNX ไม่ต้องใช้ GPU ไม่ต้องต่อคลาวด์ ไม่มี privacy issue

เปิดตัวไปแล้ว 3 version ล่าสุดเพิ่งอัปเดต SDK v1.3.1 เมื่อวานนี้เอง

ขนาด vs ประสิทธิภาพ:

Supertonic 3 — 99M params — ไม่ต้อง GPU — CPU OK VoxCPM2 — ~1.5B params — ต้อง GPU — CPU ไม่ไหว MetaVoice — ~1.2B params — ต้อง GPU — CPU ไม่ไหว Coqui XTTS — ~1.6B params — ต้อง GPU — CPU ช้า

ได้เปรียบตรง cold start เร็ว พื้นที่เก็บน้อย และลง edge device ได้สบาย

มี supertonic serve รันเป็น local HTTP server เรียกใช้ผ่าน OpenAI-compatible endpoint /v1/audio/speech ได้ — ถ้าใช้ OpenAI TTS อยู่แล้ว แค่เปลี่ยน base_url

Expression Tags — ใส่ effect ใน text ได้เลย: วันนี้เหนื่อยจัง — เสียงหัวเราะ นี่คือความลับนะ — เสียงกระซิบ สำคัญมาก — เน้นคำ

SDK ครบ 11 runtimes: Python, Node.js, Browser (WebGPU), Go, Rust, Swift, Java, C++, C#, iOS, Flutter

ภาษาไทย support — ใส่ lang=“th” หรือ lang=“na” (language-agnostic)

Use cases ที่น่าสนใจสำหรับคนไทย: • Voice assistant ภาษาไทย 100% local — ไม่ส่งข้อมูล cloud • AI Agent พูดตอบทางโทรศัพท์ latency ต่ำ • E-book reader TTS บน e-reader/tablet • Content creator generate voiceover • ระบบประกาศเสียงร้าน — รันบน Raspberry Pi

ข้อควรรู้: • Voice style ~6-8 voices — น้อยกว่าค่ายใหญ่ • total_steps 5-12 — ต่ำ = ไว แต่ quality อาจลด • speed 0.7-2.0x — 1.05x ธรรมชาติสุด

Repo กำลังมาแรงวันนี้ — ใช้ได้จริงถ้าทำ automation หรือ voice AI

มีใครลอง TTS on-device ตัวไหนแล้วบ้าง? มาแชร์กันครับ

👍 ถ้าชอบเนื้อหาแนวนี้ กดติดตาม SynapTech ได้เลย

#SynapTechAI #TTS #OnDeviceAI #EdgeAI #OpenSource

📖 อ่านบทความเต็มบน Facebook | 🔔 ติดตาม SynapTech

แชร์:

อยากรับข่าวก่อนใคร?

รับข่าว AI และบทความใหม่ก่อนผู้อื่น ส่งตรงถึง inbox