
2026년 1월 연구 요약 — 더 정확한 예측이 아닌, 더 나은 결정을 만드는 한 달
574편의 논문 속에서, 진짜 중요한 흐름 다섯 가지를 짚어드립니다.
들어가며
주식을 사야 할지 말아야 할지, 혹은 코인을 언제 팔아야 할지 — 우리는 "미래를 더 정확히 맞히는 것"이 투자의 핵심이라고 생각하곤 합니다. 마치 일기 예보가 정확하면 우산을 잘 챙기는 것처럼요.
그런데 2026년 1월의 논문들은 한 가지 흥미로운 신호를 보내고 있습니다. "예측 자체의 정확도"보다, "실제 결정이 얼마나 잘 작동했는가"에 초점을 맞추는 연구가 급격히 늘었다는 겁니다. 일기 예보가 99% 정확해도, 우산을 챙기는 과정에서 가방이 꽉 차서 못 넣는다면 무슨 소용이겠어요? 이 비유처럼, 실제 시장에서는 거래 비용, 유동성 한계, 실행 지연 같은 "마찰"이 존재합니다. 이번 달 논문들은 바로 이 마찰 속에서 더 나은 결정을 내리는 방법을 고민합니다.
자, 2026년 1월 코호트(574편)에서 상위 30편(S/A 티어)을 골라, 다섯 가지 연구 테마로 정리해 보겠습니다.
테마 1: 탈중앙화 거래소에서 대량 거래를 스마트하게 — DEX 실행 최적화
일상 비유로 시작하기
카페에서 커피 100잔을 한 번에 주문하면 어떨까요? 바리스타가 당황하고, 대기 시간이 길어지고, 나중에 나올 잔은 이미 식어 있겠죠. 그래서 우리는 "10잔씩 10번에 나눠 주문"하는 게 낫다는 걸 직감으로 압니다. 탈중앙화 거래소(DEX)에서도 비슷한 문제가 생깁니다. 한 번에 큰 거래를 하면 가격이 출렁이고(슬리피지), 손해를 보기 쉬워요.
무엇이 문제였나
전통적인 주식시장에서는 "최적 실행(optimal execution)"이라는 오래된 연구 분야가 있어서, 대량 주문을 시간에 걸쳐 나눠 넣는 최적 전략을 이미 잘 알고 있습니다. 그런데 탈중앙화 거래소, 특히 유니스왑(Uniswap) 같은 자동화 마켓 메이커(AMM)에서는 상황이 다릅니다. 중앙 주문장(LOB)이 없고, 유동성이 특정 수학 함수 형태로 묶여 있어서 기존 이론을 그대로 쓸 수 없어요.
핵심 아이디어
바우데(Baude) 등 연구진은 유니스왑 v2와 v3의 가격 규칙에서 출발해서, 가격 충격을 시간에 따라 서서히 줄어드는 "순간 충격(transient impact)"과 영구적인 충격으로 분리했습니다. 이 두 가지를 결합한 뒤, 동적 계획법으로 최적 분할 실행 전략을 유도했어요.
v2에서는 닫힌형(closed-form) 최적 전략을 찾아냈고, v3의 "집중 유동성" 구조는 이중 레이어 프레임워크로 자연스럽게 확장했습니다. 핵심 발견은: 유니스왑에서도 전통 LOB 문헌과 유사한 "처음엔 빠르게, 나중엔 천천히" 패턴이 최적이지만, 유동성 곡선의 형태에 따라 변형된다는 점이에요.

결과 — 무엇을 알아냈나
- v2 설정에서 일반적 가격 조건 하에 해석적 최적 전략을 도출했습니다.
- v3의 경우 다중 유동성 레이어로 자연스럽게 확장 가능함을 보였습니다.
- 다만 실제 온체인 데이터에 대한 실증 검증은 아직 제한적입니다.
관련 논문
- 퍼페추얼 계약 최적 청산(2601.10812, Composite 66.9): 선물이 아니라 무기한 계약(perpetual)의 경우 펀딩비까지 고려한 최적 제어 문제를 다룹니다.
- 자사주 매입 최적 전략(2601.18686, Composite 66.0): 기업이 자사주를 살 때도 "시장 충격을 최소화하며 나눠 사기"라는 동일한 문제 구조를 사용합니다.
이 테마의 공통 인사이트
"어디서 거래하든, 대량 주문을 한 번에 던지면 손해"라는 원리는 변하지 않습니다. 하지만 AMM의 수학적 구조를 정확히 반영해야 최적 전략이 달라진다는 점이 이번 달 연구의 핵심이에요.
테마 2: 예측이 아니라 "좋은 결정"에 맞춰 보정하기 — 포트폴리오 최적화와 예측 보정
일상 비유로 시작하기
골프를 칠 때, 바람이 강하게 분다면요? 프로 골퍼는 "100미터 앞 핀을 정확히 맞히기"보다 "바람을 감안해서 105미터 지점을 노리기"를 합니다. 정확한 거리를 아는 것도 중요하지만, 바람이라는 "마찰"이 있으니 목표를 조정해야 실전에서 잘 맞죠.
무엇이 문제였나
기계학습 모델로 주가나 수익률을 예측할 때, 보통 "예측 오차가 작은 모델"을 최고로 칩니다. 그런데 실제 투자에서는 거래 비용이 있고, 포지션 변경에 제한이 있고, 유동성이 한정적이에요. 예측이 아주 조금 틀려도 거래 비용 때문에 오히려 손해가 나는 경우가 있고, 예측이 좀 부정확해도 마찰이 적으면 괜찮을 수 있습니다. 즉, "예측 정확도 ≠ 투자 성과"인 거예요.
핵심 아이디어
크레이그 라이트(Craig Wright)는 "유틸리티 가중 예측(Utility-Weighted Forecasting)"이라는 새 기준을 제안합니다. 핵심은: 예측 분포를 "얼마나 정확한가"가 아니라 "의사결정 손실을 얼마나 줄여주는가"로 보정하자는 겁니다.
쉽게 말하면, 거래 비용이 클 때는 예측 오차에 둔감해지고(작은 오차는 무시), 거래 비용이 작을 때는 오차에 민감해지도록(정확하게 맞춰야) 가중치를 조정합니다.

결과 — 무엇을 알아냈나
- 선형 중첩 워크포워드(nested walk-forward) 프로토콜에서 유틸리티 가중 보정이 비보정 대비 의사결정 손실 30% 이상 감소했습니다.
- 드로우다운 구간에서 샤프 비율이 -3.62에서 -2.29로 개선되었습니다.
- 가장 인상적인 수치: 제약 구속 빈도가 16.0%에서 5.1%로 구조적 감소했습니다.
관련 논문
- 신경망 비선형 축소 추정(2601.15597, Composite 69.0): 공분산 행렬 추정의 고전적 방법인 Ledoit-Wolf 축소를 신경망으로 확장합니다.
- 차원의 장벽 넘기(2601.03175, Composite 68.8): 파라미터 불확실성을 반영한 동적 포트폴리오를 Pontryagin 투영으로 구현합니다.
이 테마의 공통 인사이트
예측 모델을 "실제 결정 맥락"에 맞게 보정하는 것이, 모델 자체를 더 복잡하게 만드는 것보다 효과적일 수 있다는 메시지입니다. 특히 거래 비용이 큰 시장에서는 "과신을 줄이는 것"이 핵심 경쟁력이 됩니다.
테마 3: AI 에이전트, 믿을 수 있나? — LLM 트레이딩 에이전트의 재현성과 검증
일상 비유로 시작하기
비서에게 "오늘 점심 메뉴를 추천해 줘"라고 했는데, 아침에는 "파스타"라고 했다가 오후에는 "샐러드"라고 한다면 어떨까요? 같은 질문에 매번 다른 답을 하는 비서는 신뢰하기 어렵습니다. LLM 기반 트레이딩 에이전트도 비슷한 문제가 있어요.
무엇이 문제였나
2026년 1월에는 LLM 기반 트레이딩 에이전트 논문이 16편이나 나왔습니다. 대부분의 연구가 "성능이 좋다"에 초점을 맞추지만, 실전 배포에서는 다른 문제가 있습니다: 같은 입력에 대해 같은 출력을 내놓는가(결정론)? 근거를 제시할 때 진실을 말하는가(충실성)?
핵심 아이디어
IBM의 카차두리안(Khatchadourian) 등 연구진은 "DFAH(Determinism-Faithfulness Assurance Harness)"이라는 평가 프레임워크를 만들었습니다. 7개 모델, 4개 프로바이더, 3개 벤치마크에서 4,700회 이상의 에이전트 실행을 돌려서 결정론과 충실성을 체계적으로 측정했어요.
핵심 발견은 놀랍습니다:
- 의사결정 결정론과 정확도 사이에 통계적으로 유의미한 상관관계가 없었습니다 (r=-0.11, p=0.63).
- 소형 모델(7-20B)은 거의 완벽한 결정론을 보이지만 정확도가 20-42%에 불과했습니다.
- 어떤 모델도 완벽한 결정론과 높은 정확도를 동시에 달성하지 못했습니다.
관련 논문
- Trade-R1(2601.03948, Composite 70.0): 확률적 환경에서 프로세스 수준 추론 검증으로 보상 해킹을 완화하는 방법을 제안합니다.
- Look-Ahead-Bench(2601.13770, Composite 66.3): LLM의 미래 정보 유입(룩어헤드 바이어스)을 표준 벤치마크로 측정합니다.
이 테마의 공통 인사이트
LLM 에이전트의 "성능"을 넘어 "신뢰성"이 핵심 화두로 떠올랐습니다. 금융에서는 결정의 근거를 설명할 수 있어야 하고, 같은 조건에서 같은 결과가 나와야 규제 감사를 통과할 수 있어요.
테마 4: 시장이 변해도 흔들리지 않는 포트폴리오 — 거시 자산배분의 딥러닝 혁신
일상 비유로 시작하기
운전할 때 "과속 카메라가 있는 구간"과 "일반 도로"를 같은 방식으로 운전하면 안 되겠죠? 시장도 마찬가지예요. 2010년대의 "CTA 윈터" 같은 조용한 시기와 2020년대 팬데믹·인플레이션 같은 폭풍기는 완전히 다른 접근이 필요합니다.
핵심 아이디어
옥스퍼드의 우드(Wood) 등 연구진은 DeePM(Deep Portfolio Manager)이라는 엔드투엔드 구조를 제안합니다. 세 가지 핵심 설계가 있습니다:
- 지연된 방향(Directed Delay): 각국 시장이 문 닫는 시간이 다른 비동기 문제를 "인과적 임펄스 응답"을 학습해서 해결합니다.
- 거시경제 그래프 사전 지식(Macro Graph Prior): "금리가 오르면 채권은 떨어진다" 같은 경제 상식을 그래프 구조로 주입합니다.
- 분포 강건 목적함수: 가장 나빴던 구간의 성과를 중점적으로 고려하는 방식으로 학습합니다.

결과 — 무엇을 알아냈나
- 2010-2025년, 50개 다변화 선물, 높은 현실적 거래비용 하에서 고전적 트렌드 팔로잉 대비 약 2배 위험조정수익률을 달성했습니다.
- Momentum Transformer(기존 최첨단) 대비 약 50% 성능 향상.
- 특히 2010년대 "CTA 윈터"와 2020년대 팬데믹 환경 모두에서 구조적 복원력을 확인했습니다.

이 테마의 공통 인사이트
"예측 → 구성"의 2단계 파이프라인을 버리고, 리스크 조정 유틸리티를 직접 최적화하는 엔드투엔드 구조가 성숙기에 접어들었다는 신호입니다.
테마 5: 전기요금을 예측하는 새로운 방법 — 전력시장 곡선 예측과 저장소 최적화
일상 비유로 시작하기
여름 한낮에 에어컨을 틀면 전기 사용량이 급증하고, 전기요금이 올라갑니다. 새벽에는 수요가 줄어서 가격이 내려가죠. 이 가격 변동을 잘 예측하면, 대형 배터리 저장소가 쌀 때 전기를 사서(충전) 비쌀 때 팔고(방전) 이익을 낼 수 있습니다.
핵심 아이디어
이 논문은 전력시장의 수요·공급 곡선을 다항식으로 근사한 뒤, 그 다항식 계수를 외부 변수(기온, 가스 가격, 태양광 발전량 등)로 예측하는 프레임워크를 제안합니다.

결과 — 무엇을 알아냈나
- 다항식 근사를 통한 곡선 예측이 기존 가격-only 예측 대비 낮은 정규화 평균 절대 오차(nMAE)를 달성했습니다.
- 저장소 최적화 시, 충전·방전 속도 제한이 클수록 "제약 구속" 비중이 증가하는 패턴을 확인했습니다.
월 전체 Big Picture — "더 정확한 모델"에서 "더 잘 작동하는 시스템"으로
2026년 1월의 연구 풍경을 한 문장으로 요약하면: "더 정확한 예측이 아니라, 실제 의사결정 맥락에서 더 잘 작동하는 시스템을 만드는 것"이 핵심 경쟁력이 되었다는 것입니다.
| 테마 | 전통적 접근 | 2026년 1월의 방향 |
|---|---|---|
| DEX 실행 | 가격 예측 후 거래 | AMM 유동성 구조를 반영한 최적 분할 |
| 포트폴리오 | 예측 오차 최소화 | 의사결정 손실 최소화로 보정 |
| LLM 에이전트 | 성능 지표 경쟁 | 재현성·충실성 검증 |
| 거시 자산배분 | 2단계(예측→구성) | 엔드투엔드 리스크 최적화 |
| 전력시장 | 가격 예측 | 곡선 형태 예측 + 저장소 최적화 |
더 알아보기
이 글에서 다룬 논문들의 arXiv 링크입니다:
| 테마 | 논문 | 링크 | Composite |
|---|---|---|---|
| DEX 실행 | Uniswap v2/v3 최적 실행 | 2601.03799 | 75.1 |
| 포트폴리오 | 유틸리티 가중 예측 | 2601.07852 | 72.4 |
| 포트폴리오 | 마팅게일 최적수송 | 2601.05290 | 72.2 |
| 전력시장 | 전력 곡선 예측 | 2601.20226 | 71.7 |
| 거시 자산배분 | DeePM | 2601.05975 | 70.9 |
| LLM 에이전트 | DFAH | 2601.15322 | 70.9 |
| LLM 에이전트 | Trade-R1 | 2601.03948 | 70.0 |
이 글은 2026년 1월 코호트(574편)의 상위 30편(S/A 티어)을 기반으로 작성되었습니다. 모든 수치는 원문 논문의 데이터를 기준으로 하며, 환산이 필요한 경우 별도 표기했습니다.
참고: 이 글은 일반적인 정보 제공 목적이며, 구체적인 사안은 전문가와 상담하시기 바랍니다.
관련 글

수익을 자랑하기 전에, 그 수익이 진짜인지 증명하라 — 2026년 4월 시스템 트레이딩 연구 월간 종합
2026년 4월 arXiv에 공개된 716편의 금융 AI 논문 중 252편을 분석한 월간 종합 리포트. 백테스트 검증, LLM 에이전트, 포트폴리오 최적화, 시장 미시구조, 옵션·파생까지 다섯 가지 연구 테마를 살펴봅니다.
AI가 주식을 예측할 때, '기억'하고 있었다면? — MemGuard-Alpha로 LLM 알파의 함정을 걸러내는 방법
대형 언어 모델(LLM)이 금융 데이터를 '기억'해서 만든 허위 알파 신호를 실시간으로 걸러내는 MemGuard-Alpha 프레임워크를 소개합니다. Sharpe 비율 49% 개선, 오염 신호 대비 7배 수익 차이의 핵심 원리를 쉽게 풀어 설명합니다.

성과를 만드는 것보다 검증하는 것이 더 중요해진 시대 — 2026년 5월 AI 퀀트 연구 월간 종합
2026년 5월에 발표된 AI 퀀트 연구 755편을 분석한 월간 종합. 백테스트 검증의 함정, LLM 트레이딩 에이전트의 감사가능성, 마켓메이킹의 리스크 민감 제어, 크립토 DeFi 미시구조, 옵션 변동성 딥헤징 등 5가지 테마를 친절하게 풀어낸다.