🖱️ Hermes มี computer_use แล้ว — แต่ตอนนี้เป็นสิทธิ์ของสาย M…
🖱️ Hermes มี computer_use แล้ว — แต่ตอนนี้เป็นสิทธิ์ของสาย Mac ก่อน
หลังอัปเดต Hermes ล่าสุด หลายคนเห็น computer_use โผล่มาในรายการ toolset แล้วสงสัยว่า “Windows จะได้ใช้แล้วหรือเปล่า?”
คำตอบสั้น ๆ คือ ยังไม่ — และไม่ใช่แค่ “ยังไม่ทำ” แต่มีเหตุผลทางเทคนิคที่ชัดเจนมากครับ
───────────────────────── 🔧 เบื้องหลังทำงานยังไง?
ปกติถ้า AI จะคลิกหรือพิมพ์แทนเรา มันต้องขยับเมาส์จริง ๆ หรือแย่ง keyboard ไปจากเรา ระหว่างที่มันทำงาน เราทำอะไรแทบไม่ได้เลย
Hermes ทำต่างออกไปครับ
มันใช้ตัวที่เรียกว่า cua-driver ซึ่งส่งคำสั่งตรงเข้าไปใน process ของแอปที่ต้องการ โดยไม่ผ่านเมาส์หรือคีย์บอร์ดของเราเลย ผลคือเราใช้งานเครื่องได้ตามปกติ พิมพ์งานของเราไป ในขณะที่ Agent กำลังคลิก กรอกฟอร์ม หรือดึงข้อมูลในอีกแอปหนึ่งพร้อมกัน — เหมือนมีผู้ช่วยนั่งทำงานอยู่บนเครื่องเดียวกับเรา แต่ไม่รบกวนกัน
───────────────────────── 🍎 แล้วทำไม Windows ถึงยังใช้ไม่ได้?
cua-driver ทำแบบนี้ได้เพราะอาศัย API ลึกของ Apple ที่เรียกว่า SkyLight private SPIs โดยตรง ซึ่งเป็น API ที่ Apple ไม่ได้เปิดเป็น public — มีแค่บน macOS เท่านั้น ไม่มีบน Windows หรือ Linux
นอกจากนี้ยังต้องขอสิทธิ์ Accessibility และ Screen Recording จาก macOS ด้วย ถึงจะทำงานได้
นั่นแปลว่าไม่ใช่แค่ “ยังไม่ port” แต่คือ Windows ไม่มี API นี้ให้ใช้ตั้งแต่แรก จะทำได้ต้องหาวิธีใหม่ทั้งหมด
───────────────────────── ⚡ อีกจุดที่น่าสนใจ: token ลดลง 95%
ปัญหาของ computer_use ทั่วไปคือกิน token มหาศาล เพราะทุก step มันต้องถ่ายภาพหน้าจอส่งให้ AI ดูก่อน แล้วค่อยตัดสินใจว่าจะคลิกอะไร ทำซ้ำแบบนี้ทุก action ต้นทุนจึงพุ่งเร็วมาก
Hermes แก้ปัญหานี้ด้วยระบบบีบอัดข้อมูล 4 ชั้น แทนที่จะส่งภาพหน้าจอดิบทุกครั้ง มันจะส่งเฉพาะข้อมูลที่ AI ต้องการจริง ๆ ผลคือ token ลดจาก 600,000 เหลือ 30,000 สำหรับ 20 actions — ลดลง 95% นี่คือความต่างระหว่าง “ใช้งานได้จริงในชีวิตประจำวัน” กับ “แพงจนคุ้มยาก”
───────────────────────── 💻 ถ้าใช้ Windows แล้วรัน hermes doctor เจอแบบนี้:
computer_use ─── system dependency not met
ไม่ต้องตกใจครับ Hermes ไม่ได้พัง ทุกอย่างยังทำงานได้ปกติ แค่ cua-driver ที่เป็น dependency หลักของฟีเจอร์นี้ยังไม่มีบน Windows ฟีเจอร์อื่น ๆ อย่าง CLI, Gateway, Cron, Browser tool และ MCP ใช้ได้หมดครับ
───────────────────────── 🚀 ทำไมเรื่องนี้ถึงสำคัญ?
AI Agent กำลังขยับจาก “ตอบคำถาม” ไปสู่ “ลงมือทำงานบนเครื่องจริง” ไม่ว่าจะเป็นกรอกฟอร์ม, ดึงข้อมูลจากแอปที่ไม่มี API, หรือทำงานซ้ำ ๆ ที่เราไม่อยากทำเอง
computer_use ของ Hermes คือก้าวแรกที่จับต้องได้ของทิศทางนั้น
───────────────────────── 📋 สรุปชัด ๆ:
- computer_use มีใน Hermes จริง ✅
- ใช้ cua-driver + SkyLight private SPIs ของ Apple ✅
- macOS เท่านั้น — Windows ไม่มี API นี้ตั้งแต่แรก ✅
- ต้องให้สิทธิ์ Accessibility + Screen Recording ก่อนใช้ ✅
- token ลดลง 95% ด้วยระบบบีบอัด 4 ชั้น ✅
- Agent เริ่ม “ลงมือทำ” บนเครื่องจริง ไม่ใช่แค่ตอบ ✅
─────────────────────────
คนที่ใช้ Mac ลองแล้วเป็นยังไงบ้างครับ — ติดขั้นตอนไหน หรือลื่นตั้งแต่ต้น? คอมเมนต์มาเลย 👇 ส่วนสาย Windows รอรอบหน้าด้วยกัน — ถ้า Hermes port มาได้จะรีบแจ้งเลย
ติดตาม SynapTech AI ไว้ครับ รอบหน้าจะมาแกะ use case จริง step by step
#SynapTechAI #HermesAgent #AIAgent #ComputerUse #CodingAgent
📖 อ่านบทความเต็มบน Facebook | 🔔 ติดตาม SynapTech
รับข่าว AI และบทความใหม่ก่อนผู้อื่น ส่งตรงถึง inbox
บทความแนะนำ
ถ้าชอบเนื้อหาแบบนี้
กดติดตาม SynapTech บน Facebook