research

업계 Harness Engineering 트렌드 — 2026

업계 Harness Engineering 트렌드 — 2026

업계 공통 수렴 패턴

Stripe Minions, Ramp Inspect, Coinbase Cloudbot이 독립적으로 만들었으나 같은 구조로 수렴. LangChain이 이를 Open SWE로 오픈소스화 (2026.03.17).

4대 공통 요소

| 요소 | 설명 | |---|---| | Isolated sandbox | task마다 독립 클라우드 Linux 환경, 프로덕션 영향 없음 | | Curated toolset | 수보다 품질 — Stripe는 ~500개 선별 유지 | | Rich context at startup | Linear 이슈/Slack 스레드 전체를 시작 전에 주입 | | Middleware layer | deterministic 로직을 agentic과 분리 |


사례별 핵심

OpenAI Codex Harness

  • AGENTS.md (~100줄) → docs/ 포인터 구조
  • feature_list.json (MD보다 덜 훼손됨)
  • Structural test — 레이어 의존성 기계적 강제
  • GC agent — 주기적 docs 불일치 탐지 후 PR 생성
  • Initializer agent + Coding agent 역할 분리
  • 규모: 5개월, ~100만 줄, 엔지니어 3~7명

Stripe Minions

  • 주당 1,000+ PR — agent가 전량 생성
  • One-shot agent — task당 단일 LLM call (신뢰성 우선)
  • ~500개 curated tool
  • Slack 트리거 — 기존 워크플로우에 통합
  • Isolated sandbox

전략: task를 좁게 정의해서 신뢰성 극대화. 복잡한 open-ended task보다 narrow하고 well-specified task 1,300개가 더 나음.

LangChain Open SWE / Deep Agents

  • Middleware 레이어: LocalContext → LoopDetection → ReasoningSandwich → PreCompletionChecklist
  • AGENTS.md (memory) — 항상 로드
  • Skills — frontmatter만 먼저 로드 (progressive disclosure)
  • Subagent — context 격리 + 병렬 실행
  • Context compression — 오래된 것 자동 요약

내 구조와의 비교

업계 대비 부족한 부분

| 항목 | 업계 | 내 구조 | 우선순위 | |---|---|---|---| | Sandbox | 독립 클라우드 환경 | SSH 서버 직접 실행 | 중 | | Middleware | 코드로 강제 | CLAUDE.md 규칙 의존 | 중 | | CI 통합 | structural test + lint 자동화 | 수동 검토 | 높음 | | Subagent | context 격리 + 병렬 | 단일 세션 | 낮음 (현재 불필요) | | feature list | JSON (훼손 방지) | MD | 낮음 | | GC agent | 자동 drift 탐지 | gc-checklist 수동 | 중 |

내 구조가 더 나은 부분

Knowledge vault — 업계는 repo-local docs에 한정. 내 구조는 learn/research/design이 분리된 축적 지식 체계. 장기적으로 더 강한 Knowledge layer.

context-bridge.md — Desktop↔Claude Code 맥락 연결. 업계 equivalent 없음. 인간이 설계 도구를 분리해서 쓰는 구조에만 필요한 독자 패턴.

설계/연구 분리 — 업계는 repo 중심. 내 구조는 설계하자/연구하자가 구현과 명확히 분리됨. 맥락 이해 vs 실행이 더 잘 나뉘어져 있음.


개선 우선순위

  1. CI + structural test 추가 — 임팩트 대비 비용 가장 낮음
  2. feature_list를 JSON으로 전환 — agent 훼손 방지
  3. Hook으로 세션 종료 강제 — Middleware 부분 대체
  4. gc-checklist → 주기적 자동화 (나중에)

출처

  • OpenAI Harness Engineering: https://openai.com/index/harness-engineering/
  • LangChain Open SWE: https://github.com/langchain-ai/open-swe (2026.03.17)
  • Stripe Minions 분석: https://www.mindstudio.ai/blog/what-is-ai-agent-harness-stripe-minions
  • Anthropic 2026 Agentic Coding Trends Report

시각화

![[industry-vs-my-structure.svg]]

5-Layer 구조 비교

![[harness-5layer-comparison.svg]]

내 구조 — Desktop / Claude Code 레이어 매핑

![[my-structure-desktop-code.svg]]