ตอบสั้นๆ: Agent harness คือ "ชั้นปฏิบัติการ" (operational layer) ที่ห่อ LLM แล้วเชื่อมเข้ากับ tools, memory, planning loop, sandbox, orchestration และ output channels — เป็นโครงสร้างที่เปลี่ยน LLM จาก chatbot ตอบคำถามเฉยๆ ให้กลายเป็น agent ที่ทำงานจริง คุณภาพของ agent ในการใช้งานจริง ไม่ได้ขึ้นกับว่าโมเดลฉลาดแค่ไหนอย่างเดียว แต่ขึ้นกับว่า harness รอบโมเดลรองรับโมเดลดีแค่ไหน — สำคัญพอๆ กับการเลือกโมเดล
📌 ภาพรวม: "ทำไม Claude ตัวเดียวกัน เอามาใส่ Claude Code ทำงานต่างจากเรียก API ตรงๆ" คำตอบคือ harness — Claude Code มี planning loop + memory + tool dispatch ที่ Google / Anthropic ตัดสินใจให้ ส่วน API ตรงๆ คือ LLM เปล่าๆ ไม่มี harness
Agent Harness คืออะไรกันแน่
ก่อนปี 2024 "agent" หมายถึงแค่ "LLM ที่เรียก tool ได้" ตอนนี้ไม่พอ — production agent ต้องการ context window management, retry/error recovery, budget control, output validation, persistence ข้าม session, parallel tool calling, sandboxing สำหรับ untrusted code — และอีกหลายเรื่อง โครงสร้างทั้งหมดที่ทำให้ทุกอย่างนี้ทำงานร่วมกันได้เรียกว่า agent harness ใครๆ ก็เรียก LLM ผ่าน API ได้ — แต่การ build harness ที่เสถียร = สิ่งที่แยก product ระดับ Claude Code/Antigravity ออกจาก demo POC
5 ชั้น architecture ของ agent harness
จาก paper survey (Preprints.org) + Firecrawl/Parallel articles — harness แบ่งได้ 5 ชั้นหลัก:
| ชั้น | ทำอะไร | ตัวอย่าง |
|---|---|---|
| 1. LLM reasoning core | โมเดลตัวจริง — Claude / GPT / Gemini / Llama | Claude Opus 4.7, Gemini 3.5 Flash |
| 2. Gateway + Session | Routing requests, จำ session ข้าม turn, rate-limit, auth | API gateway + session store |
| 3. Context + Memory | แยก working / retrieved / long-term memory, จัดการ context window | Vector DB + summary cache |
| 4. Instructions + Tools + Agentic loop | Tool registry, tool dispatch, planning loop, retry, validation | MCP servers, function calling |
| 5. Triggers + Outputs | เริ่มงานจาก event (webhook / schedule / chat), ส่งผลออก (email / DB / API) | Cron, webhook, output channels |
💡 ไม่ใช่ทุก agent ต้องครบ 5 ชั้น — chatbot ง่ายๆ อาจมีแค่ชั้น 1+4 แต่ production agent ที่ทำงาน long-horizon ต้องครบทุกชั้น

ตัวอย่าง agent harness ในผลิตภัณฑ์จริง
ทุก agent product ปี 2026 มี harness ของตัวเอง — ต่างกันที่ trade-off:
- •Claude Code (Anthropic) — harness ที่ focus งาน coding: tool dispatch แม่นยำ, sandbox จำกัดที่ filesystem ของ user, planning loop ที่ controlled, MCP ใน Claude Code
- •Antigravity SDK (Google) — เปิดให้ developer ใช้ "agent harness ตัวเดียวกับที่ Google ใช้ในผลิตภัณฑ์ตัวเอง" optimize สำหรับ Gemini models รวม Managed Agents (isolated Linux env per call) + persistent state
- •OpenAI Agents SDK — harness แบบ open ที่ programmatic — ให้คุณ define agent behavior เอง รวม responses API + tool registry
- •LangChain / LlamaIndex / CrewAI — open-source harness ที่รองรับหลาย provider เป็น layer แบบ orchestration ให้คุณ swap LLM ได้
- •Custom (self-built) — บริษัทใหญ่หลายแห่งเขียน harness เอง เพื่อคุม policy, audit, vendor portability

Build harness เอง vs ใช้ของ framework
decision นี้สำคัญสำหรับทีมที่ build agent product — มี 3 ทาง:
- •ใช้ harness ของ vendor (Antigravity SDK / OpenAI Agents) — เริ่มเร็ว, มาตรฐานสูง, แต่ผูกกับ vendor (Gemini หรือ OpenAI) เปลี่ยน LLM ยาก
- •ใช้ open-source framework (LangChain / LlamaIndex / CrewAI) — vendor-neutral, swap LLM ได้, แต่ต้องเขียน glue code เยอะกว่า + ดูแล production เอง
- •Build harness เอง — คุม policy/audit/cost เต็มที่ + ออกแบบตาม domain ของตัวเอง แต่ใช้เวลา dev 3-6 เดือนสำหรับชั้นพื้นฐาน + ต้อง maintain ต่อเนื่อง — เหมาะองค์กรใหญ่หรือ startup ที่ harness เป็น differentiator
💡 กฎข้อนิ้ว: ถ้า agent คือ feature ของ product (เช่น chatbot ใน e-commerce) → vendor SDK · ถ้า agent คือ product (เช่น AI dev tool) → custom harness · กรณีกลางๆ → open-source framework

ทำไม dev ไทยควรรู้เรื่อง agent harness
พอตลาด AI agent โตขึ้น — ทีม dev ไทยที่เข้าใจ harness ได้เปรียบ 4 เรื่อง:
- •ประเมินคุณภาพ agent product เป็น — เห็น POC สวยๆ แล้วถามได้ทันทีว่า harness ทำอะไรบ้าง มี retry/eval loop หรือเปล่า สาเหตุที่ POC ส่วนใหญ่ fail ใน production = harness ยังไม่พร้อม
- •Build product/feature ที่ scale ได้ — แทนที่จะแค่เรียก OpenAI/Claude API ตรงๆ ออกแบบ harness ที่คุม cost, retry, validation ได้ตั้งแต่ต้น
- •คุย vendor ได้แบบ informed — เลือก Antigravity vs Claude SDK vs LangChain ตาม trade-off ของ harness ไม่ใช่ตามชื่อแบรนด์
- •ลด vendor lock-in — เข้าใจว่าอะไรอยู่ใน harness (เปลี่ยนได้) vs อะไรอยู่ใน LLM (เปลี่ยนยากกว่า) ออกแบบให้ swap โมเดลได้เมื่อราคา/คุณภาพเปลี่ยน
🎯 อยาก build agent product/feature บน harness ที่เหมาะกับธุรกิจไทย? ดู Antigravity 2.0 deep-dive · Gemini 3.5 Flash specs · หรือ ปรึกษา AI Consulting — เราช่วยเลือก harness ที่ scale ได้ตาม domain ของคุณ

ข้อจำกัด + ความเสี่ยงที่ต้องเข้าใจ
harness ที่ดีต้องคุม 4 จุดเสี่ยงนี้:
- •Runaway cost — agentic loop ที่ไม่ cap max iterations = API bill บานได้เป็น 10-100 เท่า ตั้ง budget alert + hard cap iteration เสมอ
- •Tool call hallucination — agent เรียก tool ที่ไม่มี / ใส่ argument ผิด schema = harness ต้อง validate args + retry กลับมาให้
- •Context drift — long-horizon task ที่ context ขึ้นเรื่อยๆ = output แย่ลงเรื่อยๆ harness ต้องมี context compression + memory tier
- •Security boundary — agent ที่รัน user code / เข้า system ของลูกค้า ต้องมี sandbox + permission scope จำกัด ไม่ใช้ root access ตรงๆ
คำถามที่พบบ่อย
Agent harness คืออะไรในคำสั้นๆ?
Agent harness คือ โครงสร้างซอฟต์แวร์ที่ห่อ LLM แล้วเชื่อมเข้ากับ tools, memory, planning loop, sandbox, orchestration และ output channels เปลี่ยน LLM จาก chatbot ตอบคำถามเฉยๆ → agent ที่ทำงาน multi-step ได้จริง ตัวอย่างเป็น Claude Code, Antigravity SDK, OpenAI Agents SDK, LangChain ทุกตัวคือ harness ที่ design มาคนละแบบ
Agent harness ต่างจาก agent framework ยังไง?
ใกล้กันมาก ใช้แทนกันได้บ่อย แต่ละเอียดต่างกันเล็กน้อย: framework มักหมายถึง library/SDK ที่ developer ใช้ build agent (LangChain, CrewAI) harness หมายถึงโครงสร้าง runtime ทั้งหมดที่ run agent ในการใช้งานจริง (รวม sandbox, gateway, monitoring) framework = สิ่งที่คุณเขียน harness = สิ่งที่รันโค้ดของคุณ — ในการสนทนาทั่วไปสองคำนี้แทนกันได้
ต้อง build harness เองไหม หรือใช้ของพร้อม?
ขึ้นกับว่า agent เป็น feature หรือ product — ถ้าเป็น feature (เช่น chatbot ใน e-commerce) → ใช้ vendor SDK (Antigravity / OpenAI Agents) เริ่มเร็วและไม่ต้องคุม infra ถ้าเป็น product (เช่น AI dev tool ที่แข่งกับ Claude Code) → ต้อง build เองเพราะ harness เป็น differentiator ตรงกลางๆ → open-source framework (LangChain / CrewAI) vendor-neutral
Agent harness ดีๆ ต้องมีอะไรบ้าง?
5 ชั้น: (1) LLM reasoning core ที่เลือกได้ (2) Gateway/session ที่จำ context ข้าม turn (3) Memory tier ที่แยก working/retrieved/long-term (4) Agentic loop ที่ retry/validate tool calls (5) Triggers/outputs ที่ start จาก event และส่งผลออก รวมกับ guardrail: max iteration cap, budget alert, sandbox isolation, output validation
ทำไม Claude ตัวเดียวกัน เอาใส่ Claude Code ดีกว่าเรียก API ตรงๆ?
เพราะ Claude Code มี harness ที่ Anthropic engineer มาให้ — planning loop ที่ตัดสินใจว่าจะเรียก tool ไหน, memory ของ codebase, sandbox ใน filesystem, retry logic, MCP integration เรียก API ตรงๆ = ได้ LLM เปล่าๆ ไม่มีโครงสร้างเหล่านี้ คุณต้อง build เอง ความฉลาดของโมเดลใกล้กัน — ต่างที่ harness รอบโมเดล
Vendor SDK กับ open-source framework เลือกอะไรในไทย?
ถ้าทีมเล็ก (1-5 คน) ต้องการเริ่มเร็ว → vendor SDK ลดเวลา setup จากหลายสัปดาห์เหลือไม่กี่วัน ถ้าทีมกลาง-ใหญ่ (5-50 คน) ที่ต้องการ vendor portability + คุม cost ระยะยาว → open-source framework (LangChain หรือ CrewAI) ถ้าทีมที่ build agent product เป็นธุรกิจหลัก → build harness เอง บางส่วน ใช้ framework อื่นเสริม สำหรับ chercode แนะนำเริ่มที่ vendor SDK ก่อน ถ้า scale ค่อยขยับ
Arm - CherCode
Full-Stack Developer & Founder
นักพัฒนาซอฟต์แวร์ที่มีประสบการณ์กว่า 5 ปีด้าน Web Development, AI Integration และ Automation เชี่ยวชาญ Next.js, React, n8n และ LLM Integration ผู้ก่อตั้ง CherCode ให้บริการพัฒนาระบบสำหรับธุรกิจไทย
Portfolio


