[논문이야기] 부동산 경매 시장의 할인/할증 요인 ③

기존 연구들의 한계, ‘푸리에 변환’으로 해결 푸리에 변환으로 추출된 잠재 요인들, 실제 요인과 일치하는 것 통계적으로도 검증돼 할인/할증 요인의 경우 낙찰가율의 전월, 전전월 차분 값과 유사한 움직암 보여

pabii research

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ②에서 이어집니다.

지난 글(1,2)에서 가격 분석이 아닌 시장 분석을 해야 하는 이유, 그리고 외부 데이터 동원이 힘든 점 등에 대해 살펴보며 부동산 경매 시장의 데이터 분석이 어렵다는 것을 확인했다. 그렇다면 이 문제를 어떻게 해결할 수 있을까? 이번 글에서는 위 두 가지 문제를 한 번에 해결할 방법을 소개한다.

푸리에 변환 요인 분리 (추출)

시끌벅적하게 섞인 음성 속에서 어떻게 특정 남자 목소리만을 분리할 수 있을까? 이때 활용되는 것이 ‘푸리에 변환’이다. 푸리에 변환은 입력 신호를 시간 영역에서 주파수 영역으로 전환하여 모든 개별 주파수를 독립적으로 분리해 낸다. 그리고 그 주파수를 다시 신호 시간 영역으로 전환하면 (역 푸리에 변환) 고유의 음성을 찾을 수 있고, 그 음성만 남겨놓고 다른 요소를 0으로 만드는 형태로 노이즈 필터링(제거) 을 할 수 있다.

낙찰가율에서 회귀식으로 매매시세 영향을 제거한 뒤, 남아있는 잔차 항에 법원감정가 및 할인/할증요인의 영향이 남아있다고 볼 수 있다

위와 동일한 맥락으로 낙찰가율을 시끌벅적하게 섞인 입력 신호로 본다면, 그 속에서 낙찰가율을 구성하는 요인들을 독립적으로 분리해 낼 수 있다. 이를 위해 먼저 위 그림과 같이 낙찰가율에서 매매시세 영향을 회귀식으로 제거해 주고 남아있는 잔차항(residual term)에 법원감정가와 할인/할증요인이 숨겨져 있다고 가정해보자. 이후 잔차에 남아있는 수많은 요소 중 가장 큰 영향력(strongest amplitude)을 가진 두 가지 요인이 바로 법원 감정가 및 할인/할증이라고 가정해 볼 수 있고, 이때 푸리에 변환으로 두 가지 독립 신호를 추출할 수 있다.

변수 추가에 따른 Coef / R-sqd 변화

이러한 가정이 실제로 유의함을 통계적으로도 검증할 수 있다. 위 표에서도 확인할 수 있듯, 푸리에로 뽑아낸 두 가지 컴포넌트와 시세 데이터까지 초기에 가정한 회귀식의 3가지 변수만으로 낙찰가율을 회귀한 결과, 수정결정계수(adjusted R-squared) 기준 약 94%가 설명됨을 확인할 수 있다. 다시 말해 경매 시장이 실제로 3가지 변수(매매시세, 법원감정가, 할인/할증)로 설명된다는 것이다. 한편 푸리에 변환 추출 후 남은 잔차의 ACF/PACF plot(아래 그림)에서도 더 이상의 유의한 패턴은 존재하지 않는 것으로 확인됐다.

ACF/PACF Plot (Residual에 유의미한 패턴 없음)

위 푸리에 변환을 통해 필자는 낙찰가율이 시계열 데이터로서 갖는 한계점과 외부 데이터 동원이 힘든 문제점 모두를 해결할 수 있었다. 또한 실제로 남은 두 가지 요인(법원감정가,할인/할증) 을 매매 시세 영향을 제거한 뒤의 잔차에서 추출할 수 있었다.

한편 주식, 채권 시장 등의 일반적 자산 시장 데이터에 푸리에 변환을 사용하는 것은 위험한 일임을 밝힌다. 푸리에 변환은 일정한 주기를 갖는 형태에만 사용할 수 있기 때문이다. 반면 낙찰가율 데이터는 집 값 시세나 매매 지수와 같이 지수 형태로 상승하는 데이터가 아니라, 경기 및 시장 국면에 따라 80~120% 사이의 움직임을 반복하는 주기성(cyclic) 데이터에 해당하므로 위 과정을 오류 없이 수행할 수 있었던 것이다.

푸리에 변환으로 추출한 첫 번째 컴포넌트 – 법원감정가에 대한 검증

푸리에 변환을 통해 추출한 두 가지 요인이 실제로 법원감정가와 할인/할증 요인인지는 아직까진 연구자 가정에 의한 추정일 뿐이다. 따라서 해당 두가지 요인이 실제 법원감정가와 할인/할증 요인으로 연결되는지 정확하게 검증할 필요가 있다. 먼저 법원감정가의 경우 기존의 개별 경매 사례 (약 2,600건)을 통해 아래 두 가지를 분석했다.

  • 법원 감정 시점과 낙찰 시점의 평균적인 시간 간격
  • 법원 감정 시점에서 KB시세 (매매시세)와의 관계

법원감정 시점과 낙찰 시점의 시간 간격은 25% ~ 75% 범위 내에서 약 7개월 ~11개월의 간격을 갖는 것으로 확인됐고, 법원감정 시점에서 법원감정가-KB시세 상호 간의 관계는 Beta 계수 1.03 으로 거의 차이가 없는 것으로 나타났다. 필자는 두 가지 분석 결과를 종합해서 다음과 같은 결론을 얻을 수 있었다.

  • 법원감정가와 매매 시세는 Lag 관계가 있다. (lag = 시간 간격)
  • 매매 시세의 lag 변수가 법원감정가를 대체할 수 있다.

회귀 분석 결과 매매 지수의 lag 변수와 법원 감정가는 약 54%의 설명력을 갖는 바, 푸리에 변환으로 추출한 법원감정가 컴포넌트는 실제 법원감정가로서 기능을 할 수 있다는 것을 검증할 수 있었고, 두 번째로 lag 변수와 법원감정가 컴포넌트 중 각각 낙찰가율을 얼마나 잘 설명하는지를 대조했을 때 법원감정가 컴포넌트(50%)가 lag 변수(20%)보다 더 우월한 설명력을 보인다는 것을 확인할 수 있었다.

푸리에 변환으로 추출한 두 번째 컴포넌트 – 할인/할증에 대한 검증

이번에는 본 [논문이야기]의 핵심인 할인/할증 컴포넌트에 대한 검증을 두 가지 측면에서 진행해 본다. 첫 번째로 푸리에 변환으로 추출한 할인/할증 컴포넌트가 그 기능을 할 수 있는지, 두 번째는 그 할인/할증 컴포넌트의 정체가 무엇인지다.

검증을 위해 할인/할증 컴포넌트가 일종의 on/off 효과를 낼 수 있도록 시그모이드(sigmoid) 함수 처리를 했고 (0/1) on/off에 따라 낙찰가율 데이터를 평균과 분산이 다른 두 개의 분포로 나뉠 수 있다는 것을 확인하여 그 기능을 할 수 있다는 것을 아래 그림과 같이 검증했다.

Auction Sale Rate : 낙찰가율, SIG2 = 할인/할증 컴포넌트 (by 푸리에)

또한 이 컴포넌트의 정체가 무엇인지 통계청 등지에서 동원할 수 있는 많은 데이터와 대조를 시도하였으나 비슷한 움직임을 갖는 데이터는 찾을 수 없었다. 이에 대한 이유는 생각보다 간단했다.

그림 3. 낙찰가율의 전월/전전월 차분값 (= v1,v2) vs 할인/할증 컴포넌트 (= SIG 2)

경매 시장은 매매 시장 대비 종속적인 위치를 갖는다. 우리가 알고 있는 거시 경제 변수들은 매매 시세(집값)을 구성하는 요인일 가능성이 크고, 매매 시세 영향은 이미 회귀식에서 제거된 상태이기 때문에 결국 남은 변수들은 매매 시세와 독립적인 경매 시장만의 변수일 가능성이 높은 것이다. 결국 그렇게 찾아낸 비슷한 움직임을 갖는 변수는 위 그림에 해당하는 낙찰가율의 전월, 전전월 차분 값이다.

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ④로 이어집니다.

Similar Posts