2026년 1월 연구 요약 — 더 정확한 예측이 아닌, 더 나은 결정을 만드는 한 달

오세에이아이연구소·2026년 2월 1일·20분 읽기

#2026년1월논문 #금융AI #퀀트리서치월간 #Uniswap최적실행 #유틸리티가중예측 #LLM트레이딩에이전트 #딥러닝포트폴리오 #전력시장예측

2026년 1월 연구 요약 — 더 정확한 예측이 아닌, 더 나은 결정을 만드는 한 달

574편의 논문 속에서, 진짜 중요한 흐름 다섯 가지를 짚어드립니다.

들어가며

주식을 사야 할지 말아야 할지, 혹은 코인을 언제 팔아야 할지 — 우리는 "미래를 더 정확히 맞히는 것"이 투자의 핵심이라고 생각하곤 합니다. 마치 일기 예보가 정확하면 우산을 잘 챙기는 것처럼요.

그런데 2026년 1월의 논문들은 한 가지 흥미로운 신호를 보내고 있습니다. "예측 자체의 정확도"보다, "실제 결정이 얼마나 잘 작동했는가"에 초점을 맞추는 연구가 급격히 늘었다는 겁니다. 일기 예보가 99% 정확해도, 우산을 챙기는 과정에서 가방이 꽉 차서 못 넣는다면 무슨 소용이겠어요? 이 비유처럼, 실제 시장에서는 거래 비용, 유동성 한계, 실행 지연 같은 "마찰"이 존재합니다. 이번 달 논문들은 바로 이 마찰 속에서 더 나은 결정을 내리는 방법을 고민합니다.

자, 2026년 1월 코호트(574편)에서 상위 30편(S/A 티어)을 골라, 다섯 가지 연구 테마로 정리해 보겠습니다.

테마 1: 탈중앙화 거래소에서 대량 거래를 스마트하게 — DEX 실행 최적화

일상 비유로 시작하기

카페에서 커피 100잔을 한 번에 주문하면 어떨까요? 바리스타가 당황하고, 대기 시간이 길어지고, 나중에 나올 잔은 이미 식어 있겠죠. 그래서 우리는 "10잔씩 10번에 나눠 주문"하는 게 낫다는 걸 직감으로 압니다. 탈중앙화 거래소(DEX)에서도 비슷한 문제가 생깁니다. 한 번에 큰 거래를 하면 가격이 출렁이고(슬리피지), 손해를 보기 쉬워요.

무엇이 문제였나

전통적인 주식시장에서는 "최적 실행(optimal execution)"이라는 오래된 연구 분야가 있어서, 대량 주문을 시간에 걸쳐 나눠 넣는 최적 전략을 이미 잘 알고 있습니다. 그런데 탈중앙화 거래소, 특히 유니스왑(Uniswap) 같은 자동화 마켓 메이커(AMM)에서는 상황이 다릅니다. 중앙 주문장(LOB)이 없고, 유동성이 특정 수학 함수 형태로 묶여 있어서 기존 이론을 그대로 쓸 수 없어요.

핵심 아이디어

바우데(Baude) 등 연구진은 유니스왑 v2와 v3의 가격 규칙에서 출발해서, 가격 충격을 시간에 따라 서서히 줄어드는 "순간 충격(transient impact)"과 영구적인 충격으로 분리했습니다. 이 두 가지를 결합한 뒤, 동적 계획법으로 최적 분할 실행 전략을 유도했어요.

v2에서는 닫힌형(closed-form) 최적 전략을 찾아냈고, v3의 "집중 유동성" 구조는 이중 레이어 프레임워크로 자연스럽게 확장했습니다. 핵심 발견은: 유니스왑에서도 전통 LOB 문헌과 유사한 "처음엔 빠르게, 나중엔 천천히" 패턴이 최적이지만, 유동성 곡선의 형태에 따라 변형된다는 점이에요.

그림: 세 가지 시나리오별 최적 실행 스케줄 비교. 전통적 선형 감소(점선)와 유니스왑에 맞춘 변형(실선)의 차이를 보여줍니다.

결과 — 무엇을 알아냈나

v2 설정에서 일반적 가격 조건 하에 해석적 최적 전략을 도출했습니다.
v3의 경우 다중 유동성 레이어로 자연스럽게 확장 가능함을 보였습니다.
다만 실제 온체인 데이터에 대한 실증 검증은 아직 제한적입니다.

이 테마의 공통 인사이트

"어디서 거래하든, 대량 주문을 한 번에 던지면 손해"라는 원리는 변하지 않습니다. 하지만 AMM의 수학적 구조를 정확히 반영해야 최적 전략이 달라진다는 점이 이번 달 연구의 핵심이에요.

테마 2: 예측이 아니라 "좋은 결정"에 맞춰 보정하기 — 포트폴리오 최적화와 예측 보정

일상 비유로 시작하기

골프를 칠 때, 바람이 강하게 분다면요? 프로 골퍼는 "100미터 앞 핀을 정확히 맞히기"보다 "바람을 감안해서 105미터 지점을 노리기"를 합니다. 정확한 거리를 아는 것도 중요하지만, 바람이라는 "마찰"이 있으니 목표를 조정해야 실전에서 잘 맞죠.

무엇이 문제였나

기계학습 모델로 주가나 수익률을 예측할 때, 보통 "예측 오차가 작은 모델"을 최고로 칩니다. 그런데 실제 투자에서는 거래 비용이 있고, 포지션 변경에 제한이 있고, 유동성이 한정적이에요. 예측이 아주 조금 틀려도 거래 비용 때문에 오히려 손해가 나는 경우가 있고, 예측이 좀 부정확해도 마찰이 적으면 괜찮을 수 있습니다. 즉, "예측 정확도 ≠ 투자 성과"인 거예요.

핵심 아이디어

크레이그 라이트(Craig Wright)는 "유틸리티 가중 예측(Utility-Weighted Forecasting)"이라는 새 기준을 제안합니다. 핵심은: 예측 분포를 "얼마나 정확한가"가 아니라 "의사결정 손실을 얼마나 줄여주는가"로 보정하자는 겁니다.

쉽게 말하면, 거래 비용이 클 때는 예측 오차에 둔감해지고(작은 오차는 무시), 거래 비용이 작을 때는 오차에 민감해지도록(정확하게 맞춰야) 가중치를 조정합니다.

그림: 보정된 예측(UWC, 초록)과 비보정 예측(빨강)의 의사결정 손실 등고선. 보정된 예측이 더 낮은 손실 영역에 위치함을 보여줍니다.

결과 — 무엇을 알아냈나

선형 중첩 워크포워드(nested walk-forward) 프로토콜에서 유틸리티 가중 보정이 비보정 대비 의사결정 손실 30% 이상 감소했습니다.
드로우다운 구간에서 샤프 비율이 -3.62에서 -2.29로 개선되었습니다.
가장 인상적인 수치: 제약 구속 빈도가 16.0%에서 5.1%로 구조적 감소했습니다.

이 테마의 공통 인사이트

예측 모델을 "실제 결정 맥락"에 맞게 보정하는 것이, 모델 자체를 더 복잡하게 만드는 것보다 효과적일 수 있다는 메시지입니다. 특히 거래 비용이 큰 시장에서는 "과신을 줄이는 것"이 핵심 경쟁력이 됩니다.

테마 3: AI 에이전트, 믿을 수 있나? — LLM 트레이딩 에이전트의 재현성과 검증

일상 비유로 시작하기

비서에게 "오늘 점심 메뉴를 추천해 줘"라고 했는데, 아침에는 "파스타"라고 했다가 오후에는 "샐러드"라고 한다면 어떨까요? 같은 질문에 매번 다른 답을 하는 비서는 신뢰하기 어렵습니다. LLM 기반 트레이딩 에이전트도 비슷한 문제가 있어요.

무엇이 문제였나

2026년 1월에는 LLM 기반 트레이딩 에이전트 논문이 16편이나 나왔습니다. 대부분의 연구가 "성능이 좋다"에 초점을 맞추지만, 실전 배포에서는 다른 문제가 있습니다: 같은 입력에 대해 같은 출력을 내놓는가(결정론)? 근거를 제시할 때 진실을 말하는가(충실성)?

핵심 아이디어

IBM의 카차두리안(Khatchadourian) 등 연구진은 "DFAH(Determinism-Faithfulness Assurance Harness)"이라는 평가 프레임워크를 만들었습니다. 7개 모델, 4개 프로바이더, 3개 벤치마크에서 4,700회 이상의 에이전트 실행을 돌려서 결정론과 충실성을 체계적으로 측정했어요.

핵심 발견은 놀랍습니다:

의사결정 결정론과 정확도 사이에 통계적으로 유의미한 상관관계가 없었습니다 (r=-0.11, p=0.63).
소형 모델(7-20B)은 거의 완벽한 결정론을 보이지만 정확도가 20-42%에 불과했습니다.
어떤 모델도 완벽한 결정론과 높은 정확도를 동시에 달성하지 못했습니다.

이 테마의 공통 인사이트

LLM 에이전트의 "성능"을 넘어 "신뢰성"이 핵심 화두로 떠올랐습니다. 금융에서는 결정의 근거를 설명할 수 있어야 하고, 같은 조건에서 같은 결과가 나와야 규제 감사를 통과할 수 있어요.

테마 4: 시장이 변해도 흔들리지 않는 포트폴리오 — 거시 자산배분의 딥러닝 혁신

일상 비유로 시작하기

운전할 때 "과속 카메라가 있는 구간"과 "일반 도로"를 같은 방식으로 운전하면 안 되겠죠? 시장도 마찬가지예요. 2010년대의 "CTA 윈터" 같은 조용한 시기와 2020년대 팬데믹·인플레이션 같은 폭풍기는 완전히 다른 접근이 필요합니다.

핵심 아이디어

옥스퍼드의 우드(Wood) 등 연구진은 DeePM(Deep Portfolio Manager)이라는 엔드투엔드 구조를 제안합니다. 세 가지 핵심 설계가 있습니다:

지연된 방향(Directed Delay): 각국 시장이 문 닫는 시간이 다른 비동기 문제를 "인과적 임펄스 응답"을 학습해서 해결합니다.
거시경제 그래프 사전 지식(Macro Graph Prior): "금리가 오르면 채권은 떨어진다" 같은 경제 상식을 그래프 구조로 주입합니다.
분포 강건 목적함수: 가장 나빴던 구간의 성과를 중점적으로 고려하는 방식으로 학습합니다.

그림: DeePM의 파이프라인. 시간축, 횡단면, 구조, 목적함수의 4단계 처리 과정.

결과 — 무엇을 알아냈나

2010-2025년, 50개 다변화 선물, 높은 현실적 거래비용 하에서 고전적 트렌드 팔로잉 대비 약 2배 위험조정수익률을 달성했습니다.
Momentum Transformer(기존 최첨단) 대비 약 50% 성능 향상.
특히 2010년대 "CTA 윈터"와 2020년대 팬데믹 환경 모두에서 구조적 복원력을 확인했습니다.

그림: 2010-2025년 누적 수익률(거래비용 차감 후). DeePM이 전통적 트렌드 베이스라인과 Momentum Transformer를 꾸준히 앞서는 모습입니다.

이 테마의 공통 인사이트

"예측 → 구성"의 2단계 파이프라인을 버리고, 리스크 조정 유틸리티를 직접 최적화하는 엔드투엔드 구조가 성숙기에 접어들었다는 신호입니다.

테마 5: 전기요금을 예측하는 새로운 방법 — 전력시장 곡선 예측과 저장소 최적화

일상 비유로 시작하기

여름 한낮에 에어컨을 틀면 전기 사용량이 급증하고, 전기요금이 올라갑니다. 새벽에는 수요가 줄어서 가격이 내려가죠. 이 가격 변동을 잘 예측하면, 대형 배터리 저장소가 쌀 때 전기를 사서(충전) 비쌀 때 팔고(방전) 이익을 낼 수 있습니다.

핵심 아이디어

이 논문은 전력시장의 수요·공급 곡선을 다항식으로 근사한 뒤, 그 다항식 계수를 외부 변수(기온, 가스 가격, 태양광 발전량 등)로 예측하는 프레임워크를 제안합니다.

그림: 2022년 11월 3일 오후 3시의 집계된 입찰 곡선. 주황색은 수요, 파란색은 공급. 두 곡선이 만나는 지점이 전일 전력 가격이 됩니다.

결과 — 무엇을 알아냈나

다항식 근사를 통한 곡선 예측이 기존 가격-only 예측 대비 낮은 정규화 평균 절대 오차(nMAE)를 달성했습니다.
저장소 최적화 시, 충전·방전 속도 제한이 클수록 "제약 구속" 비중이 증가하는 패턴을 확인했습니다.

월 전체 Big Picture — "더 정확한 모델"에서 "더 잘 작동하는 시스템"으로

2026년 1월의 연구 풍경을 한 문장으로 요약하면: "더 정확한 예측이 아니라, 실제 의사결정 맥락에서 더 잘 작동하는 시스템을 만드는 것"이 핵심 경쟁력이 되었다는 것입니다.

테마	전통적 접근	2026년 1월의 방향
DEX 실행	가격 예측 후 거래	AMM 유동성 구조를 반영한 최적 분할
포트폴리오	예측 오차 최소화	의사결정 손실 최소화로 보정
LLM 에이전트	성능 지표 경쟁	재현성·충실성 검증
거시 자산배분	2단계(예측→구성)	엔드투엔드 리스크 최적화
전력시장	가격 예측	곡선 형태 예측 + 저장소 최적화

더 알아보기

이 글에서 다룬 논문들의 arXiv 링크입니다:

테마	논문	링크	Composite
DEX 실행	Uniswap v2/v3 최적 실행	2601.03799	75.1
포트폴리오	유틸리티 가중 예측	2601.07852	72.4
포트폴리오	마팅게일 최적수송	2601.05290	72.2
전력시장	전력 곡선 예측	2601.20226	71.7
거시 자산배분	DeePM	2601.05975	70.9
LLM 에이전트	DFAH	2601.15322	70.9
LLM 에이전트	Trade-R1	2601.03948	70.0