ใช้ Claude Code ให้ประหยัด Token 7 เทคนิคที่ Developer ต้องรู้

Context window หมดเร็วกว่าที่คิด — ไม่ใช่เพราะ prompt คุณยาว แต่เพราะพฤติกรรมที่ซ่อนอยู่ใน session นี่คือวิธีแก้

Token ไม่ได้หมดเพราะ prompt ยาว — แต่เพราะนิสัยที่คุณไม่รู้ว่ากำลังทำอยู่

200K
Context window สูงสุดของ Claude

~1 ชม.
ใช้หมด 50–100K tokens ทำงานจริง

70%
ประหยัดได้จากการปรับพฤติกรรม

สารบัญ

  1. ทำไม Token ถึงหมดเร็วกว่าที่คิด?
  2. สร้าง .claudeignore — หยุด Claude อ่านไฟล์ขยะ
  3. ใช้ /compact ก่อน Context เต็ม
  4. ทำ CLAUDE.md ให้กระชับ — ไม่เกิน 2,000 tokens
  5. 1 Session = 1 งาน อย่า Mix Task
  6. เลือก Model ให้ตรงงาน
  7. เขียน Prompt ให้ตรงเป้า
  8. ใช้ Subagent รับงานหนัก
  9. สรุป: Checklist ก่อนเริ่ม Session

บทนำ

ทำไม Token ถึงหมดเร็วกว่าที่คิด?

ถ้าคุณเคยนั่งทำงานกับ Claude Code แล้วพบว่า token หมดกลางคัน ทั้งที่รู้สึกว่าแค่ถามคำถามไม่กี่ครั้ง — นั่นไม่ใช่ความผิดของคุณ แต่เป็นเพราะวิธีที่ Claude Code ทำงานอยู่เบื้องหลัง

"ทุกครั้งที่กด Enter Claude Code จะส่งประวัติการสนทนาทั้งหมดซ้ำตั้งแต่ต้น รวมถึงทุกไฟล์ที่อ่าน ทุก command output ทุกอย่าง — ไม่ใช่แค่ข้อความล่าสุด"

นี่คือพฤติกรรมพื้นฐานของ Transformer architecture — model ไม่มี “memory” แบบต่อเนื่อง แต่อ่าน context ทั้งหมดใหม่ทุกครั้ง ผลคือ session ที่นานขึ้นไม่ได้แค่ “ใช้ token เพิ่ม” แต่ใช้ แบบทวีคูณ

เทคนิคที่ 1

สร้าง .claudeignore — หยุด Claude อ่านไฟล์ขยะ

เมื่อ Claude Code explore codebase ของคุณ มันจะพยายามอ่านทุกไฟล์ที่เห็น รวมถึง  node_modules  (อาจมีหมื่นไฟล์), dist, * .lock  และไฟล์ที่ generate อัตโนมัติ ซึ่งไม่มีประโยชน์ต่อการทำงานเลย

 

ไฟล์ .claudeignore ทำงานเหมือน .gitignore ทุกประการ — สร้างไว้ที่ root ของโปรเจ็คแล้ว Claude จะข้ามไฟล์เหล่านั้นทันที