🧠 AI Agent ความจำ 3 ชั้น ที่ผมใช้จริงกับ Hermes Agent
🧠 AI Agent ความจำ 3 ชั้น ที่ผมใช้จริงกับ Hermes Agent
ช่วงหลังผมใช้ Hermes Agent เป็น AI ผู้ช่วยส่วนตัวบน CLI / WSL มากขึ้นเรื่อย ๆ ตอนแรกก็ช่วยงานได้ดีมาก แต่พอใช้ไปนาน ๆ เริ่มเจออาการเดิม ๆ
ตอบช้าลง จำบางอย่างไม่ได้ บางทีก็วนคำตอบเดิม หรือเอา context เก่ามาปนกับงานใหม่
ตอนแรกผมนึกว่าเป็นที่โมเดล แต่พอไล่ดูจริง ๆ ปัญหาไม่ได้อยู่ที่โมเดลอย่างเดียวครับ
มันอยู่ที่ ระบบความจำของ Agent
ตอน audit ผมเจอว่า Hot Memory แน่นถึง 84% ทุกครั้งที่ถามอะไร ระบบต้องแบก context เดิมส่งเข้า LLM ทุก turn
พูดง่าย ๆ คือ เหมือนให้คนอ่านเอกสารหลายหน้าก่อนตอบทุกคำถาม มันเลยช้า เปลือง token และบางครั้งตอบไม่คมเท่าที่ควร
สิ่งที่ผมทำคือ ไม่ได้เพิ่ม prompt ให้ยาวขึ้น แต่แยกความจำออกเป็น 3 ชั้น ด้วย 3 เครื่องมือหลัก
🔥 1. MEMORY.md / USER.md — Hot Memory
อันนี้คือความจำที่ Agent ต้องเห็นทุกครั้ง ผมใช้เก็บเฉพาะข้อมูลสำคัญจริง ๆ เช่น path สำคัญ, project rules, page IDs, workflow หลัก และสิ่งที่ไม่ควรลืมในทุก session
หลัง audit แล้วตัดของที่ไม่จำเป็นออก Hot Memory ลดจาก 84% เหลือ 64% เท่ากับลดภาระ context ไปประมาณ 20%
ผลคือ Agent ตอบไวขึ้น และ context สะอาดขึ้น
📚 2. GBrain — Warm Memory
อันนี้คือความจำกึ่งถาวรแบบค้นหาได้ ผมใช้เก็บความรู้ที่สำคัญ แต่ไม่จำเป็นต้อง inject เข้า prompt ทุกครั้ง เช่น entity profiles, concept relationships, notes จากงานเก่า, pattern ที่เคยใช้ และ workflow ที่เรียกกลับมาได้
ตอนนี้ใน GBrain มีประมาณ 244 pages / 739 chunks และผมสร้าง graph links ไว้ 83 เส้น
พอ Agent ต้องใช้ความรู้นั้น ค่อย query กลับมา ไม่ต้องแบกทั้งหมดไว้ใน Hot Memory ตั้งแต่แรก
🗄️ 3. Obsidian Vault / Session History — Cold Storage
อันนี้คือคลังอ้างอิงระยะยาว ใช้เก็บข้อมูลที่ไม่ต้องใช้ทุกวัน แต่ควรย้อนกลับไปดูได้ เช่น reference docs, templates, logs, session history, notes รายละเอียด และไอเดียเก่า ๆ
ชั้นนี้ไม่ได้เอาเข้า prompt ตลอด แต่ใช้เป็น source of truth เวลาต้องย้อนดูรายละเอียดจริง
พูดง่าย ๆ คือ:
MEMORY.md / USER.md = ความจำที่ต้องเห็นทุกครั้ง GBrain = ความรู้ที่ค้นกลับมาได้ Obsidian = คลังอ้างอิงระยะยาว
หลังจัดใหม่ ผลที่เห็นชัดคือ:
• Hot Memory: 84% → 64% • ลดภาระ Hot Memory: -20% • brain_score: 44 → 57 • Graph links: 0 → 83 เส้น • Dead links: 0% • ประหยัด context ได้ประมาณ 1,200 ตัวอักษรต่อ turn
ตัวเลข 1,200 ตัวอักษรต่อ turn อาจดูไม่เยอะถ้ามองแค่คำถามเดียว แต่สำหรับ Agent ที่ทำงานยาว ๆ 50–100 turns ต่อวัน นี่คือ context ที่ไม่ต้องส่งซ้ำหลายหมื่นตัวอักษรทุกวัน
สำหรับผม นี่คือจุดที่ทำให้ Hermes Agent เริ่มใช้งานระยะยาวได้จริงขึ้นมาก
ไม่ใช่แค่ถามตอบเก่ง แต่ต้องมีระบบจัดความจำที่รู้ว่า อะไรควรจำทันที อะไรควรค้นเมื่อจำเป็น และอะไรควรเก็บไว้เป็นหลักฐานอ้างอิง
แล้วคุณล่ะครับ ตอนนี้ AI Agent ของคุณมีระบบความจำกี่ชั้น หรือยังใส่ทุกอย่างไว้ใน prompt เดียว?
รายละเอียดเพิ่มในคอมเมนต์แรกครับ
#SynapTechAI #AIAgent #HermesAgent #MemoryArchitecture #LLM
📖 อ่านบทความเต็มบน Facebook | 🔔 ติดตาม SynapTech
รับข่าว AI และบทความใหม่ก่อนผู้อื่น ส่งตรงถึง inbox
บทความแนะนำ
ถ้าชอบเนื้อหาแบบนี้
กดติดตาม SynapTech บน Facebook