본문 바로가기

2023

첫 연구가 될 수 있을까?

7월, 지도교수님과 식사 자리에서 교수님께서 던져주신 논문이 있다. 계량경제학 교과서 초반 회귀분석 부분에서 등장하는 정리로 Frisch-Waugh-Lovell, 즉 FWL 정리가 있다. 이 정리를 쉽게 얘기하면 기존에 OLS 돌려서 얻은 회귀계수가 다른 방식으로도 똑같이 얻을 수 있다는 것이다. 재밌는 얘기고 개인적으로 생각할 때 이 정리의 기여는 두 가지가 있다.
 
첫째, 계산의 용이성이다. 최근에는 빅데이터가 대두하면서 데이터의 양과 차원이 모두 증가하고 있다. 이런 데이터에 대해 평범한 컴퓨터를 사용하여 회귀계수를 구하려고 하면 시간이 오래 걸릴 수 있고, 결과가 제대로 나오지 않을 수도 있다. 하지만, FWL 정리를 사용하면 분석해야 할 데이터의 차원이 줄어들기 때문에 계산의 시간이 상당히 빨라질 수 있다. 
 
둘째, OLS에 대한 기하학적 해석이다. OLS를 수식으로 보면 OLS의 직관적인 의미를 이해하기 어려울 수 있다. 그런데, FWL 정리에서 우리는 OLS의 직관적인 의미를 파악할 수 있다. 사실 이건 선형대수에 등장하는 내용이다. 
 
과거에는 데이터가 그렇게 크지 않았기 떄문에 FWL 정리는 단순히 교과서에 등장하는 하나의 지식으로 남아있었다. 최근, 앞서 말한 것처럼 빅데이터 분석에 관심이 쏠리면서 FWL 정리에 학자들이 다시 주목하기 시작했다. 버클리 대학의 통계학과 교수님인 Ding(2021)은 기존에 보지 못했던 시각을 던졌다. Ding은 FWL 정리로 구한 회귀계수의 standard error가 과연 full model을 OLS 돌려 얻은 회귀계수의 standard error와 같은지에 대해 분석하는 논문을 썼다(이 논문이 교수님께서 던져주신 논문이다). 생각해 보면 FWL 정리는 회귀계수에만 주목했지 standard error에 대해선 아무도 주목하지 않았다(결론은 같다는 것이다).
 
계속해서 논문에 대해 얘기를 하기엔 앞에서 생략한 것이 너무 많기 때문에 여기서 멈춰야겠다. 교수님께서 던져주신 Ding의 논문을 확장시키는 논문들이 등장하고 있다. 7월 말에는 Instrument variable을 사용하여 FWL 정리에 대한 얘기가 나왔고, 내가 본 working paper에서는 empirical likelihood에 대해서도 얘기가 있었다. 처음 교수님께서 논문을 던져주시고 나에게 "논문이 이해가 되면 또 한번 얘기해 보자"라고 말씀하셨다. 나는 교수님의 말씀이 정확히 무엇을 의미하는 것인지 몰랐다. 논문을 읽고 이해됐다 싶으면 교수님께 "다 읽었습니다!"라고 얘기를 해야 할지, 논문을 어떻게 발전시킬 수 있을지 생각해서 교수님께 말씀을 드려야 할지 등등 고민이 많았다. 
 
감사하게도, 이런 고민을 하고 있을 나를 아셨는지 교수님께서 먼저 7월 말에 메일을 주셨다. 앞서 말한 IV를 사용하여 FWL 정리에 대한 논문이 있다는 얘기였고, 교수님께서는 이 논문을 다른 방법으로 확장할 수 있을 것 같다고 말씀하셨다. 교수님께서 먼저 말씀을 이렇게 해주시고 신이 났는지 교수님께 장문의 답장을 보냈고, 이 주제를 확장해보고 싶다고 말씀드렸다. 
 
그렇게 며칠 교수님께서 처음 주셨던 논문과 IV에 대한 논문을 공부했고, 내일 교수님을 찾아뵙기로 했다. 사실 무슨 말씀을 드려야할지 아직도 잘 모르겠다. 오늘 하루종일 내일 교수님과 만나 어떤 이야기를 해야 할지 고민했는데 모르겠다. 항상 이렇게 걱정하는 것에 비해 교수님을 만나면 교수님께서 먼저 리드를 해주셔서 즐겁게 얘기를 마치고 오는 것을 알고 있지만, 내일은 조금 더 긴장된다. 어쩌면 이게 내 첫 번째 연구로 이어질 수도 있다는 생각 때문인 것 같다. 

'2023' 카테고리의 다른 글

가을 학기의 절반이 지나며  (0) 2023.10.24
2학년 2학기 개강!  (1) 2023.09.05
2학년 1학기 종강. 오랜만의 포스팅.  (2) 2023.07.13
4월의 근황 + 재밌었던 논문  (0) 2023.04.13
박사 2년차 첫학기 계획  (0) 2023.03.05