AI/DS논문이야기

데이터 사이언스를 활용한 논문을 쓰는 뒷 이야기를 일반인 대상으로 풀어내는 글입니다. 어떻게 아이디어를 얻고, 어떻게 사고를 풀어나가고, 어떻게 계산과학 도구를 활용해서 현장에서 쓰일 수 있는 결과물을 만들어내는지를 풀어냈습니다.

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ④

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ④

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ③에서 이어집니다. 지난 글에서 필자는 경매 시장 분석(낙찰가율)의 한계를 푸리에 변환으로 해결했으며, 나아가 푸리에 변환으로 추출된 ‘잠재’ 컴포넌트들이 실제 변수로 직결된다는 것을 통계적으로 검정했다. 이번 글에서는 위 과정을 통해 추출된 할인/할증 컴포넌트의 정체가 무엇인지 살펴본다. 할인/할증 컴포넌트의 정체는 지금까지의 분석 결과를 정리해 보면 다음과 같다. 낙찰가율에서 매매 시세와 법원…

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ③

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ③

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ②에서 이어집니다. 지난 글(1,2)에서 가격 분석이 아닌 시장 분석을 해야 하는 이유, 그리고 외부 데이터 동원이 힘든 점 등에 대해 살펴보며 부동산 경매 시장의 데이터 분석이 어렵다는 것을 확인했다. 그렇다면 이 문제를 어떻게 해결할 수 있을까? 이번 글에서는 위 두 가지 문제를 한 번에 해결할 방법을 소개한다. 푸리에 변환…

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ②

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ②

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ①에서 이어집니다. 이전 글에서는 부동산 경매 시장을 왜 분석해야 하는지, 낙찰가율이라는 경매 시장의 시계열 지표가 어떤 오류를 가지는지, 그리고 법원 감정가 교정 등의 방법이 왜 비지니스에서 사용되기 어려운지를 살펴봤다. 서술한 문제들은 정확히 필자 또한 실무자로서 겪었던 문제들이기도 하다. 의사 결정을 위해 시계열 분석이 필요한 와중에, 낙찰가율의 고질적 문제로 인해…

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ①

[논문이야기] 부동산 경매 시장의 할인/할증 요인 ①

최근 부동산 시장이 심상치 않다. 전 세계적으로 긴축 기조가 시작됨에 따라, 전문가들 사이에서는 코로나19 이후 통화 완화 정책으로 엄청난 유동성 수혜를 봤던 국내 부동산 시장의 ‘거품’이 꺼지면서 실물시장 충격에 대비해야 하는 것 아니냐는 우려가 나온다. 작년 말부터 미국을 포함한 주요국 중앙은행을 중심으로 인플레이션을 대비하기 위해 기준금리 인상이 지속되고 있는 가운데, 이에 따라 주택가격이 하락하면서 가계의…

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ⑤

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ⑤

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ④에서 이어집니다. 이전 글(1,2,3,4)까지의 기나긴 대장정을 통해, 우리는 에너지 사용량에 대한 기존 연구의 1차 모멘트 벡터(1st moment vector) 계산과 함께 회귀 모델의 ‘공분산’을 포함한 2차 모멘트 행렬(2nd moment matrix)까지 완전히 추정할 수 있게 됐다. 아울러 이렇게 계산된 1차 모멘트 벡터 및 2차 모멘트 행렬을 통해…

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ④

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ④

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ③에서 이어집니다. 이전 글(1,2,3)까지를 통해 필자는 에너지 사용량 추정의 필요성, 이와 관련된 기존 연구의 한계, 그리고 이를 개선하기 위해 종국적으로는 서로 다른 식들의 오차항들 간 ‘상관관계(correlation)’, 즉 2차 모멘트 행렬의 계산이 통계 모델에 포함돼야 한다고 설명했다. 이번 글에서는 이 같은 상관관계를 모델에 반영하는 통계적 방법론을…

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ③

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ③

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ②에서 이어집니다. 이전 글에서 기존 개별 건축물의 에너지 사용량은 종속 변수는 (각 월별) 에너지 사용량으로, 독립 변수는 연면적,총수, 재질 등의 건축물 속성으로 하는 회귀(Regression) 기반의 모델로 추정된다고 설명했다. 아울러 이전 글 말미에, 기존 연구가 2차 모멘트(2nd moment) 계산이 반영되지 않았기 때문에 현실을 제대로 설명하지 못한다고도…

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ②

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ②

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ①에서 이어집니다. 이전 글에서 언급했듯 에너지원 수급,생산,수송,설비 투자 등에 관한 효율적 의사결정을 위해서는 무엇보다도 에너지 사용량 추정이 정확하게 이뤄져야만 한다. 이번 글에서는 기존 연구들이 어떻게 ‘통계적으로’ 에너지 사용량을 추정했는지 개략적으로 살펴보고, 나아가 ‘계절적 추이’를 반영해야하는 이유를 짚어본다. 에너지 사용량을 현실적으로 추정하기 위한 방법, ‘회귀분석’ 이상적으로는,…

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ①

[논문이야기] 건축물 별 월간 전기/가스 사용량 예측:결합확률분포 모델 기반 예측 ①

대내외 경제 불확실성으로 올겨울 에너지 관련 원자재 가격 급등은 ‘예견’된 가운데, 전문가들은 지금부터라도 겨울철 에너지 사용량을 정확하게 예측하는 한편, 에너지 절약을 위한 대응 방안을 마련해야 한다고 당부했다. 그러나 정작 업계에서는 기존 에너지 사용량 추정에 사용됐던 방법론에 대해 의문을 제기하는 분위기다. 해당 연구들의 방법론이 현실을 제대로 대변하지 못한다는 이유에서다. 그렇다면 어떻게 정확하게 에너지 사용량을 예측할 수…

[논문이야기] 우리나라 제약업은 연구개발 중심일까 카피약 판매 중심일까? ③

가격 경쟁 구도 변화와 시장 점유율 구도 변화에서 핵심 논리는 산업별로 특이한 내재매몰비용이 있을 경우, 해당 비용에 대한 투입이 얼마나 많이 이뤄지느냐에 따라 상품의 품질에 영향을 받고, 결국 가격 경쟁 구도와 시장 점유율 구도가 변화한다는 논리가 아래에 깔려있다. 따라서 서튼(Sutton 1991, 1997, 1998)[1],[2],[3]의 논리가 실제로 한국 시장에 적용되는지 확인하기 위해서는 필수적으로 내재매몰비용(Endogenous sunk cost)이 있었는지…

[논문이야기] 우리나라 제약업은 연구개발 중심일까 카피약 판매 중심일까? ②

[논문이야기] 우리나라 제약업은 연구개발 중심일까 카피약 판매 중심일까? ②

공정거래위원회는 2010년 11월에 리베이트를 제공한 제약사 뿐만 아니라 리베이트로 불법 이득을 수취한 의료진까지 양쪽을 모두 처벌하는 이른바 ‘리베이트 쌍벌제’로 처벌 수위를 올렸다. 리베이트를 받은 의료진은 1년 이내 자격정지, 2년 이하 징역 등의 처벌을 받게됐고, 이어 2011년 4월에는 정부합동 리베이트 전담수사반이 만들어진다. 실제로 2012년 7월에 자사 의약품을 써 주는 대가로 의사 400명에게 리베이트성 향응, 접대를 제공한…

[논문이야기] 우리나라 제약업은 연구개발 중심일까 카피약 판매 중심일까? ①

[논문이야기] 우리나라 제약업은 연구개발 중심일까 카피약 판매 중심일까? ①

보건복지부가 지난해 12월에 제정된 리베이트 과징금 상향 조정안에 따른 세부운영지침을 발표했다. 지난 2018년 9월 약가인하 처분을 명시한 이른바 ‘남인순법’에 이어 지난해 12월의 ‘이용호법’이 반영된 세부 지침이다. 공정거래위원회는 지난 2009년 8월부터 수차례에 걸쳐 제도 개선을 통해 제약사와 의료진에 대한 처벌 조항을 구체화했다. 특정 약품을 구매하도록 사실상 강요하는 구조가 되는 처방전에 따라 제약사 매출액이 결정되는 이상, 제약사들은…