발표 영상이 공개된게 아니라, 그냥 PPT 보고 추측해서 부족한 부분은 채움. 뇌피셜이 좀 섞여있을 수 있음.
IDE의 탄생과 발전을 소개하면서 AI IDE가 발전의 최신 단계라고 설명함. 개발 작업의 대부분이 IDE 안에서 이루어지므로, AI 강화의 가장 자연스러운 접점이라는 논리.
AI IDE의 기능
- 기본: 자동완성, 싱글/멀티 라인 수정 등
- AI-Native: Background agents, MCP, PR review
AI IDE 내부 작동 원리
- Tab-complete (자동완성):
- 현재 코드 주변의 작은 컨텍스트 윈도우를 암호화하여 전송
- 서버에서 infilling LLM 실행 (코드의 빈 부분을 채우는 모델)
- 제안을 다시 전송하여 IDE에 표시
- Chat (채팅 모드):
- 코드 청크를 임베딩 벡터로 변환
- 서버의 시맨틱 인덱스에 저장 (파일명은 난독화)
- 사용자 쿼리 시 가장 관련 있는 청크를 검색 (RAG 패턴)
- 검색된 청크를 LLM 컨텍스트로 투입하여 응답 생성
- IDE가 정기적으로 코드 청크를 재인덱싱하고 임베딩 동기화
- Merkle tree로 청크 diff를 계산하여 변경분만 효율적으로 업데이트
Best Practices
- 프롬프팅: (복잡한 작업을 수행하려면) PM처럼 스펙 문서 작성
- 추천 템플릿 요소: Goal, Definitions, Plan, Test cases, Edge cases, Out-of-scope, Extensions
- 템플릿 구글 드라이브 링크
- 코드베이스 최적화: LLM-friendly 코드베이스 - 낮은 성능의 원인은 컨텍스트 오염 문제임
- 모노레포 사용
- 문서화: Repo 방향 지시, File 구조, 환경설정, 코딩 스타일, 접근 패턴, API와 규칙
- 에이전트 설정 파일 활용:
AGENTS.md,llms.txt등
AI IDE 동작 방식은 인상깊긴 한데, 요즘 하는걸 보면 아예 비동기 작업이 아닌 이상 Claude Code나 Codex CLI 같은 걸로 유행이 바뀐 듯 함.
그래도 AI 활용 방법에 대한 건 꽤 좋은거 같음.
Silas Alberti, Cognition 리서치 총괄
Cognition(Devin 개발사) 창업 멤버의 발표.
AI 코딩 도구에는 2가지 분류 축이 있다.
- 동기/비동기: 동기는 사람이 루프 안에서 결과를 즉시 확인(1분 이내). 비동기는 작업을 위임해두고 완료되면 확인(10분-수시간).
- 로컬/클라우드: LLM 자체가 아니라 에이전트의 실행 환경 기준. Claude Code나 Cursor 같은 IDE 도구는 로컬, Devin이나 GitHub 연동 봇(예: Copilot Workspace)은 클라우드.
AI 코딩 도구는 로컬·동기에서 클라우드·비동기로 이동하고 있다.
실전 워크플로우는 3단계로 구분된다 — Planning(sync, Windsurf/DeepWiki로 코드베이스 파악) → Coding(async, Devin에 위임) → Testing(sync, Windsurf에서 검증·수정). 데모에서는 Cognition 제품(Devin, DeepWiki)과 Windsurf의 조합을 보여줬을 것으로 추정.
주의할 점으로 "Semi-Async"(1~5분 대기) 구간을 지적한다. 플로우를 유지하기엔 너무 느리고, 멀티태스킹하기엔 너무 짧은 최악의 구간이므로 피해야 한다.
Planning과 Testing은 현재 동기(사람 주도)이지만, 미래에는 에이전트가 테스팅까지 자율 수행하는 방향으로 확장될 것. 엔지니어가 직접 코딩에 투자하는 시간은 줄어든다.
미래 전망 — 인간 엔지니어의 역할은 "에이전트 매니저"로 수렴. 미래 핵심 스킬은 코딩 자체보다 위임·멀티태스킹, 코드 리딩, 아키텍처 설계.
자료에 Devin을 쓰면 12배 생산성이고 하는데, 많이 과장된 수치라고 생각한다.
Devin이나 DeepWiki가 작년 중반쯤에 떴던거 같은데, 요즘에도 잘 사용하는진 모르겠다.
오픈소스 등에서는 LLM 모델을 직접 만드는 회사(Goolge, OpenAI나 Anthropic)에서 이런 기능을 통합해간다고 생각하는데, Devin은 회사 내부에서 쓸만한거라 눈에 안 띄는 걸지도.
OpenClaw도 그렇고 비동기 + 클라우드 형태를 사람들이 최종 목적지로 보는건 맞는거 같음.
TODO:
일단 전반적으로 AI 에이전트를 잘 쓰는 방법을 설명함.
대충 흝어보고 기억나는 주요 주장을 메모
- 컨텍스트 오염과 컨텍스트가 많아지면 실수한다는 내용
- 도구를 쓰고 컨텍스트 오염을 줄이면 성능이 좋아짐
- 컨텍스트를 주기적으로 정리하고, 문서만 인간이 보면 코드를 거의 리뷰하지 않고도 높은 성과(조금이지만 실무 증명)를 보일 수 있음.
- FAANG에선 명확한 의도와 문서를 기반으로 AI가 코드를 작성함. (근데 사람들 댓글 보면 바이브코딩의 정의에 맞지 않다고 함.)