AI 19 พฤษภาคม 2569 อ่าน 2 นาที

🧠 AI Agent ความจำ 3 ชั้น ที่ผมใช้จริงกับ Hermes Agent

ช่วงหลังผมใช้ Hermes Agent เป็น AI ผู้ช่วยส่วนตัวบน CLI / WSL มากขึ้นเรื่อย ๆ ตอนแรกก็ช่วยงานได้ดีมาก แต่พอใช้ไปนาน ๆ เริ่มเจออาการเดิม ๆ

ตอบช้าลง จำบางอย่างไม่ได้ บางทีก็วนคำตอบเดิม หรือเอา context เก่ามาปนกับงานใหม่

ตอนแรกผมนึกว่าเป็นที่โมเดล แต่พอไล่ดูจริง ๆ ปัญหาไม่ได้อยู่ที่โมเดลอย่างเดียวครับ

มันอยู่ที่ ระบบความจำของ Agent

ตอน audit ผมเจอว่า Hot Memory แน่นถึง 84% ทุกครั้งที่ถามอะไร ระบบต้องแบก context เดิมส่งเข้า LLM ทุก turn

พูดง่าย ๆ คือ เหมือนให้คนอ่านเอกสารหลายหน้าก่อนตอบทุกคำถาม มันเลยช้า เปลือง token และบางครั้งตอบไม่คมเท่าที่ควร

สิ่งที่ผมทำคือ ไม่ได้เพิ่ม prompt ให้ยาวขึ้น แต่แยกความจำออกเป็น 3 ชั้น ด้วย 3 เครื่องมือหลัก

🔥 1. MEMORY.md / USER.md — Hot Memory

อันนี้คือความจำที่ Agent ต้องเห็นทุกครั้ง ผมใช้เก็บเฉพาะข้อมูลสำคัญจริง ๆ เช่น path สำคัญ, project rules, page IDs, workflow หลัก และสิ่งที่ไม่ควรลืมในทุก session

หลัง audit แล้วตัดของที่ไม่จำเป็นออก Hot Memory ลดจาก 84% เหลือ 64% เท่ากับลดภาระ context ไปประมาณ 20%

ผลคือ Agent ตอบไวขึ้น และ context สะอาดขึ้น

📚 2. GBrain — Warm Memory

อันนี้คือความจำกึ่งถาวรแบบค้นหาได้ ผมใช้เก็บความรู้ที่สำคัญ แต่ไม่จำเป็นต้อง inject เข้า prompt ทุกครั้ง เช่น entity profiles, concept relationships, notes จากงานเก่า, pattern ที่เคยใช้ และ workflow ที่เรียกกลับมาได้

ตอนนี้ใน GBrain มีประมาณ 244 pages / 739 chunks และผมสร้าง graph links ไว้ 83 เส้น

พอ Agent ต้องใช้ความรู้นั้น ค่อย query กลับมา ไม่ต้องแบกทั้งหมดไว้ใน Hot Memory ตั้งแต่แรก

🗄️ 3. Obsidian Vault / Session History — Cold Storage

อันนี้คือคลังอ้างอิงระยะยาว ใช้เก็บข้อมูลที่ไม่ต้องใช้ทุกวัน แต่ควรย้อนกลับไปดูได้ เช่น reference docs, templates, logs, session history, notes รายละเอียด และไอเดียเก่า ๆ

ชั้นนี้ไม่ได้เอาเข้า prompt ตลอด แต่ใช้เป็น source of truth เวลาต้องย้อนดูรายละเอียดจริง

พูดง่าย ๆ คือ:

MEMORY.md / USER.md = ความจำที่ต้องเห็นทุกครั้ง GBrain = ความรู้ที่ค้นกลับมาได้ Obsidian = คลังอ้างอิงระยะยาว

หลังจัดใหม่ ผลที่เห็นชัดคือ:

• Hot Memory: 84% → 64% • ลดภาระ Hot Memory: -20% • brain_score: 44 → 57 • Graph links: 0 → 83 เส้น • Dead links: 0% • ประหยัด context ได้ประมาณ 1,200 ตัวอักษรต่อ turn

ตัวเลข 1,200 ตัวอักษรต่อ turn อาจดูไม่เยอะถ้ามองแค่คำถามเดียว แต่สำหรับ Agent ที่ทำงานยาว ๆ 50–100 turns ต่อวัน นี่คือ context ที่ไม่ต้องส่งซ้ำหลายหมื่นตัวอักษรทุกวัน

สำหรับผม นี่คือจุดที่ทำให้ Hermes Agent เริ่มใช้งานระยะยาวได้จริงขึ้นมาก

ไม่ใช่แค่ถามตอบเก่ง แต่ต้องมีระบบจัดความจำที่รู้ว่า อะไรควรจำทันที อะไรควรค้นเมื่อจำเป็น และอะไรควรเก็บไว้เป็นหลักฐานอ้างอิง

แล้วคุณล่ะครับ ตอนนี้ AI Agent ของคุณมีระบบความจำกี่ชั้น หรือยังใส่ทุกอย่างไว้ใน prompt เดียว?

รายละเอียดเพิ่มในคอมเมนต์แรกครับ

#SynapTechAI #AIAgent #HermesAgent #MemoryArchitecture #LLM

📖 อ่านบทความเต็มบน Facebook | 🔔 ติดตาม SynapTech

แชร์:

อยากรับข่าวก่อนใคร?

รับข่าว AI และบทความใหม่ก่อนผู้อื่น ส่งตรงถึง inbox