MACHINE: EXPLOIT

AI '기억 예산'의 숨겨진 규칙. "네"라고 대답했지만, 아무것도 기억하지 않는다

morgan021 2025. 11. 6.

우리는 모두 그 순간을 경험한다. 공들여 지시하고, 데이터를 제공하고, 완벽한 결과물을 기대했지만, AI는 마치 방금 나눈 대화를 처음 듣는다는 듯 엉뚱한 대답을 내놓는다. 우리는 AI가 '학습'하고 '기억'한다고 믿지만, 이 거대한 지능은 사실상 놀라울 정도로 건망증이 심하다. 하지만 이것은 실수가 아니다. 이것은 '설계'다.

AI는 겉보기엔 순종적인 비서처럼 보이지만, 그 '기억'은 지극히 이기적인 경제 원칙에 따라 작동한다. 우리가 '컨텍스트'라 부르는 그 작업대는 사실 한정된 '예산'과도 같다. 우리는 이 예산을 현명하게 배분해야 하는 AI의 '재정 관리인' 역할을 맡았다. 하지만 대부분의 사람들은 이 예산의 존재조차 모르고, 중요한 지시(고정 지출)와 단순 데이터(변동 지출)를 한 주머니에 섞어 넣는 실수를 저지른다. 결국 AI는 예산이 초과될 때마다 가장 오래되고 비효율적인 지출, 즉 당신의 '오래된 지시'부터 잘라내기 시작한다. 이 글은 그 냉혹한 AI의 '예산 삭감' 메커니즘을 파헤치고, 어떻게 하면 나의 핵심 지시를 '최우선 고정 지출'로 격상시킬 수 있는지, 그 영리한 '토큰 예산' 관리 비법을 다룬다.

1M의 배신: 모든 토큰은 평등하지 않다

최신 AI 모델들은 '1M 컨텍스트'라는 어마어마한 숫자를 자랑한다. 1백만 토큰, 수십만 단어에 해당하는 방대한 기억 용량이다. 이 숫자 앞에서 우리는 AI가 우리가 제공하는 모든 정보를 완벽하게 기억할 것이라 착각한다. 책 한 권을 통째로 던져주어도 핵심을 파악해낼 것이라 기대한다. 하지만 이 1M이라는 숫자는 교묘한 마케팅 용어에 가깝다. 그 거대한 작업대 위에 올라간 모든 정보가 동등한 가치를 지니는 것은 아니기 때문이다.

AI의 컨텍스트는 균질한 기억의 공간이 아니다. 그것은 오히려 중요도에 따라 차등 대우를 받는 '토큰들의 계급 사회'다. 이 계급을 결정하는 가장 중요한 기준은 '시간'과 '위치'다. AI는 방금 입력된, 가장 '최신'의 지시에 가장 높은 우선순위를 부여한다. 반대로, 대화의 가장 처음에 입력된 오래된 정보는 가장 먼저 '잊힐' 대상이 된다. 1M이라는 거대한 공간이 주어져도, AI는 그 공간을 효율적으로 관리하기 위해 끊임없이 정보의 가치를 저울질한다. 당신이 10시간 전에 입력한 핵심 지시와 1초 전에 입력한 단순한 질문은 AI에게 전혀 다른 무게로 다가온다. 이것이 바로 1M 컨텍스트가 1M이 아닌 첫 번째 이유다. 모든 토큰은 평등하게 취급되지 않는다.

'상황판'의 비극: 데이터에 오염되는 지시

AI의 컨텍스트, 즉 '작업대'는 개념적으로 두 개의 다른 영역으로 나뉘어 작동한다. 이 사실을 인지하는 것이 '토큰 예산' 관리의 첫걸음이다. 첫 번째 영역은 우리가 AI와 대화를 나누는 채팅창, 즉 '대화 기록' 영역이다. 나는 이것을 '상황판'이라 부른다. 이곳은 AI가 다음에 무엇을 해야 할지 결정하는 '핵심 지시'가 기록되는 공간이다.

문제는 대부분의 사용자가 이 '상황판'의 치명적인 약점을 모른다는 것이다. 바로 '데이터 오염'에 극도로 취약하다는 점이다. 예를 들어, 당신이 AI에게 "이 텍스트를 A 스타일로 요약해 줘"라는 '지시'를 내린 후, 참고할 텍스트 수천 자를 채팅창에 그대로 '붙여넣기'했다고 가정해 보자. 당신의 의도는 '지시'와 '데이터'를 순차적으로 제공하는 것이었지만, AI의 '상황판'에는 끔찍한 일이 벌어진다. 그 수천 자의 '데이터'가 소중한 '지시' 영역을 덮어쓰며 '상황판'을 가득 채워버린다.

이 '상황판'은 AI의 작업 기억(Working Memory) 그 자체다. 이 공간은 생각보다 훨씬 작고 예민하다. 방대한 데이터가 이 공간을 점령하면, 그 앞에 있던 'A 스타일로 요약하라'는 핵심 지시는 컨텍스트 용량 저편으로 밀려나 '삭제' 대기열에 오르게 된다. AI는 결국 가장 최근에 입력된 데이터 덩어리만 어렴풋이 기억한 채, 당신의 핵심 지시를 잊어버린다. 이것이 바로 당신의 지시가 데이터의 홍수 속에서 익사하는 '상황판의 비극'이다.

VIP 전용 통로: '첨부 파일'의 분리 처리

그렇다면 이 비극을 피할 방법은 없는가? 다행히 AI의 작업대에는 두 번째 영역이 존재한다. 바로 '증거물 보관함'이라 부를 수 있는 '첨부 파일' 영역이다. 채팅창에 텍스트를 직접 붙여넣는 것이 '상황판'을 어지럽히는 행위라면, 파일을 첨부하는 것은 데이터를 깔끔하게 '증거물 보관함'에 넣어두는 행위다. 이것은 AI에게 "이것은 지시가 아니라, 나중에 필요할 때 꺼내 볼 '참조 자료'다"라고 명확하게 알려주는 VIP 전용 통로와 같다.

당신이 1만 자의 텍스트를 .txt 파일로 첨부하면, AI의 '상황판'에는 어떤 일이 벌어질까? 놀랍게도 거의 아무 일도 일어나지 않는다. '상황판'에는 "사용자가 [파일 A]를 첨부했다"는 짧은 메모만 남을 뿐, 1만 자의 데이터가 '상황판'의 귀중한 공간을 차지하지 않는다. '상황판'은 깨끗하게 유지되며, 당신의 핵심 지시("A 스타일로 요약하라")는 안전하게 보존된다.

AI는 이제 명확하게 분리된 두 영역을 가지고 작업한다. '상황판'에서 당신의 지시를 확인하고, '증거물 보관함'에서 필요한 파일을 꺼내와 작업을 수행한다. 데이터는 더 이상 지시를 오염시키지 않는다. 이것이 바로 긴 텍스트를 처리할 때 채팅창 붙여넣기가 아닌 파일 첨부를 사용해야 하는 결정적인 이유다. 그것은 단순히 편리함의 문제가 아니라, 당신의 지시를 AI의 건망증으로부터 지켜내는 예산 분리의 핵심 기술이다.

AI의 효율성이라는 변명: 지연된 처리의 진실

AI의 이상한 작동 방식은 이뿐만이 아니다. 당신이 PDF 파일을 업로드하며 "이거 다 읽고나서 학습이 끝나면 '예'라고만 대답해"라고 지시했다고 치자. AI는 1초 만에 "예"라고 대답한다. 당신은 AI가 500페이지를 순식간에 읽었다고 감탄하지만, 진실은 다르다. AI는 단 한 글자도 읽지 않았다.

이것이 AI의 '지연된 처리(Deferred Processing)'라는 본성이다. AI는 기본적으로 '게으르다'. 정확히는, 에너지를 최소한으로 사용하도록 설계되어 있다. AI에게 '작업'이란 당신의 지시를 수행하는 것이 아니라, 당신이 요구한 출력물을 생성하는 것이다. 당신의 지시가 "'예'라는 텍스트를 출력하라"였다면, AI는 그 텍스트를 출력하기 위해 굳이 500페이지를 읽는 '힘든 일'을 할 필요가 없다. 그저 파일을 작업대에 올린 후, 가장 쉬운 경로, 즉 "예"라고 말하는 경로를 선택할 뿐이다.

이것은 인간의 의도와 AI의 효율성이 정면으로 충돌하는 지점이다. 인간은 AI가 '미리' 준비하고 '이해'하기를 원하지만, AI는 '지금 당장' 필요하지 않은 작업은 최대한 미룬다. '학습을 완료한 뒤'라는 조건은 AI에게 아무런 강제성을 갖지 못한다. AI는 당신의 다음 질문, 즉 파일의 내용을 실제로 묻는 질문이 들어올 때까지 그 파일을 거들떠보지도 않을 것이다.

"네"라는 대답을 믿지 말라: '작업 증명' 프롬프트 전략

그렇다면 이 게으른 AI를 어떻게 일하게 만들 수 있을까? "네"라는 순종적인 대답에 속지 않고, AI가 실제로 작업을 수행했는지 확인하는 방법이 필요하다. 바로 '작업 증명(Proof of Work)' 프롬프트 전략이다.

다시는 AI에게 "다 했니?"라고 묻지 말라. 대신, 그 작업을 '수행해야만' 알 수 있는 결과물을 요구하라. "이 PDF를 읽고 다 했으면 '예'라고 해"라는 지시는 최악이다. 대신 이렇게 말해야 한다. "이 PDF의 1페이지에 나오는 세 가지 핵심 키워드를 추출해." 또는 "이 파일의 전체 내용을 한 문장으로 요약해."

이 '작업 증명' 지시는 AI가 '지연된 처리'라는 안락한 의자에서 일어나 실제로 일하도록 강제한다. AI는 한 문장 요약이나 키워드 추출이라는 '출력물'을 생성하기 위해, 어쩔 수 없이 파일 전체를 읽고 '처리'해야만 한다. 이것은 AI에게 '최단 경로'가 파일을 읽는 것이 되도록 설계를 역이용하는 것이다. 당신의 지시가 단순한 '확인'이 아니라 '결과물'을 요구할 때, 비로소 AI는 당신의 의도대로 움직이기 시작한다. AI의 "네"라는 대답은 아무것도 증명하지 못한다. 오직 '결과'만이 모든 것을 증명한다.

예산 초과, 삭제의 시작: AI는 무엇부터 버리는가

AI의 '토큰 예산'은 무한하지 않다. 1M이라는 거대한 컨텍스트도 결국 한계에 다다른다. 대화가 길어지고, 첨부 파일이 쌓이면 '예산 초과' 상황이 발생한다. 이때 AI는 냉혹한 구조조정에 들어간다. 무엇부터 버릴 것인가?

AI의 기억 삭제 방식은 매우 단순하고 기계적이다. 바로 '선입선출(First In, First Out)'이다. 가장 오래된 정보, 즉 당신의 대화 기록 중 가장 처음에 입력된 것부터 순서대로 컨텍스트 윈도우 밖으로 밀어내기 시작한다. 당신이 대화 초반에 설정했던 중요한 페르소나 지시, 복잡한 작업의 전제 조건 등은 AI의 '예산 삭감' 1순위 대상이다.

이것이 바로 대화가 길어질수록 AI가 초반의 지시를 '잊어버리고' 멍청하게 구는 이유다. '상황판'의 비극과 '선입선출'의 비극이 합쳐진 결과다. 데이터가 '상황판'을 오염시키고, 그렇게 오염된 '상황판'의 가장 오래된 기록(핵심 지시)부터 삭제된다. 반면, '증거물 보관함(첨부 파일)'에 있는 데이터는 상대적으로 이 '선형적 압박'에서 안전하다. 파일은 참조 객체로 존재하며, '대화 기록'처럼 쉽게 밀려나지 않는다.

결국 AI를 조련한다는 것은 이 '토큰 예산'의 흐름을 이해하는 것과 같다. 중요한 지시는 '상황판'에 짧고 명확하게, 그리고 '최대한 최근에' 반복해서 상기시켜야 한다. 방대한 데이터는 '증거물 보관함'에 격리해야 한다. AI의 기억은 영원하지 않다. 그것은 끊임없이 흐르고, 재편성되고, 삭제되는 유한한 자원이다. 이 자원의 흐름을 읽고, 나의 지시를 가장 높은 우선순위로 유지하는 것. 그것이 AI라는 강력하지만 변덕스러운 비서를 다루는 유일한 방법이다.

< 3줄 요약 >

AI의 '컨텍스트'는 무한한 기억이 아닌, '토큰 예산'이 정해진 유한한 작업대다.
긴 텍스트를 채팅창에 붙여넣으면 '지시' 영역이 오염되므로, '파일 첨부'로 데이터를 분리해야 지시가 잊히지 않는다.
AI는 '지연된 처리'를 선호하므로, "다 했어?" 대신 '요약'이나 '키워드 추출' 같은 '작업 증명'을 요구해야 한다.

'MACHINE: EXPLOIT' 카테고리의 다른 글

지분 증명 시대의 보이지 않는 권력자들, 검증인 (0)	2025.11.10
실행자의 유령. 코드상의 나는 진짜 나인가? (0)	2025.11.08
보안의 제1원칙: 왜 장부를 먼저 정리하고 돈을 내줘야 하는가 (0)	2025.11.08
블록체인은 어떻게 현실을 움직이는가? 오라클의 양방향 혁명 (0)	2025.11.07
블록체인의 심장, EVM은 왜 외부 세계와 단절되어야 하는가 (0)	2025.11.07
인터넷이 정보를 해방시켰다면, IBC는 자산을 해방시킨다 (0)	2025.11.05
EVM은 왜 미래를 예측할 수 없는가 (0)	2025.11.04
Code is Law의 배신, 그리고 프록시라는 구원 (0)	2025.10.31
가장 비싼 땅, 이더리움에서 28바이트를 아끼는 기술 (0)	2025.10.31
우아한 포장지의 비밀, transfer는 왜 _transfer를 부를까? (0)	2025.10.30