업계 Harness Engineering 트렌드 — 2026
업계 공통 수렴 패턴
Stripe Minions, Ramp Inspect, Coinbase Cloudbot이 독립적으로 만들었으나 같은 구조로 수렴. LangChain이 이를 Open SWE로 오픈소스화 (2026.03.17).
4대 공통 요소
| 요소 | 설명 | |---|---| | Isolated sandbox | task마다 독립 클라우드 Linux 환경, 프로덕션 영향 없음 | | Curated toolset | 수보다 품질 — Stripe는 ~500개 선별 유지 | | Rich context at startup | Linear 이슈/Slack 스레드 전체를 시작 전에 주입 | | Middleware layer | deterministic 로직을 agentic과 분리 |
사례별 핵심
OpenAI Codex Harness
- AGENTS.md (~100줄) → docs/ 포인터 구조
- feature_list.json (MD보다 덜 훼손됨)
- Structural test — 레이어 의존성 기계적 강제
- GC agent — 주기적 docs 불일치 탐지 후 PR 생성
- Initializer agent + Coding agent 역할 분리
- 규모: 5개월, ~100만 줄, 엔지니어 3~7명
Stripe Minions
- 주당 1,000+ PR — agent가 전량 생성
- One-shot agent — task당 단일 LLM call (신뢰성 우선)
- ~500개 curated tool
- Slack 트리거 — 기존 워크플로우에 통합
- Isolated sandbox
전략: task를 좁게 정의해서 신뢰성 극대화. 복잡한 open-ended task보다 narrow하고 well-specified task 1,300개가 더 나음.
LangChain Open SWE / Deep Agents
- Middleware 레이어: LocalContext → LoopDetection → ReasoningSandwich → PreCompletionChecklist
- AGENTS.md (memory) — 항상 로드
- Skills — frontmatter만 먼저 로드 (progressive disclosure)
- Subagent — context 격리 + 병렬 실행
- Context compression — 오래된 것 자동 요약
내 구조와의 비교
업계 대비 부족한 부분
| 항목 | 업계 | 내 구조 | 우선순위 | |---|---|---|---| | Sandbox | 독립 클라우드 환경 | SSH 서버 직접 실행 | 중 | | Middleware | 코드로 강제 | CLAUDE.md 규칙 의존 | 중 | | CI 통합 | structural test + lint 자동화 | 수동 검토 | 높음 | | Subagent | context 격리 + 병렬 | 단일 세션 | 낮음 (현재 불필요) | | feature list | JSON (훼손 방지) | MD | 낮음 | | GC agent | 자동 drift 탐지 | gc-checklist 수동 | 중 |
내 구조가 더 나은 부분
Knowledge vault — 업계는 repo-local docs에 한정. 내 구조는 learn/research/design이 분리된 축적 지식 체계. 장기적으로 더 강한 Knowledge layer.
context-bridge.md — Desktop↔Claude Code 맥락 연결. 업계 equivalent 없음. 인간이 설계 도구를 분리해서 쓰는 구조에만 필요한 독자 패턴.
설계/연구 분리 — 업계는 repo 중심. 내 구조는 설계하자/연구하자가 구현과 명확히 분리됨. 맥락 이해 vs 실행이 더 잘 나뉘어져 있음.
개선 우선순위
- CI + structural test 추가 — 임팩트 대비 비용 가장 낮음
- feature_list를 JSON으로 전환 — agent 훼손 방지
- Hook으로 세션 종료 강제 — Middleware 부분 대체
- gc-checklist → 주기적 자동화 (나중에)
출처
- OpenAI Harness Engineering: https://openai.com/index/harness-engineering/
- LangChain Open SWE: https://github.com/langchain-ai/open-swe (2026.03.17)
- Stripe Minions 분석: https://www.mindstudio.ai/blog/what-is-ai-agent-harness-stripe-minions
- Anthropic 2026 Agentic Coding Trends Report
시각화
![[industry-vs-my-structure.svg]]
5-Layer 구조 비교
![[harness-5layer-comparison.svg]]
내 구조 — Desktop / Claude Code 레이어 매핑
![[my-structure-desktop-code.svg]]