[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ④

날씨, 한강 자전거길과의 거리, 공휴일 여부가 자전거 거치소의 대여량 결정하는 중요 요인 권역별로 최적화 범위 넓혀 효율성 제고 재배치가 필요한 대여소만 걸러내면 비용 낭비 막을 수 있다

18
pabii research

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③에서 이어집니다

가장 심한 불균형이 발생하는 지점은, 출퇴근 시간 대여와 반납이 활발히 일어나는 초 거대 업무 지구(예시: 강서 마곡업무 지구, 여의도 업무 지구, 성수동 지식산업센터 등)입니다. 이때 앞서 논의한 ‘평형상태’ 개념을 활용해 대여소별 자전거 수를 정확히 예측해낼 수만 있다면, 새벽 단 한 번의 재배치만으로 대여소별 일일 거치 자전거수를 최적화 해낼 수 있을 것이라는 게 본 논문의 골자입니다.

대여소별 누적 자전거수는 아래와 같이 정의해볼 수 있습니다.

대여소별 자전거 수 산출식

위 식에서 초기 배분 자전거 수는 주어진 값, 즉 상수입니다. 한편 사용자 Factor와 재분배 Factor는 저희가 통계적 방법론을 통해 추정해야 하는 확률 변수입니다. 여기서 주의해야할 점은 대여소별 자전거수의 과잉보다는 부족이 문제라는 것입니다. 대여소의 자전거 재고량이 부족할 경우 따릉이 이용이 완전히 불가하기 때문에 사용자들의 불편을 초래하고, 민원이 제기될 수 있습니다.

이런 가운데 사용자 Factor를 정확히 추정한다면, 결과적으로 자전거 재고량이 부족한 대여소 또한 사전적으로 예측할 수 있을 것입니다. 이를 위해 생각해봤던 부분이 공휴일의 여부에 따라 따릉이 사용량이 좌우되지 않을까?라는 것이었습니다. 공휴일이라면 따릉이 사용 시간대가 평일의 출퇴근 시간대와는 다르게 형성될 것이기 때문입니다. 예컨대 주말은 따릉이를 업무 출퇴근으로 이용하는 것이 아닌, 레저나 관광용으로 이용하는 경우가 대부분일 것입니다. 나아가, 이로 인해 주중보다 주말에 한강 자전거길을 이용하는 사용자 수도 더욱 두드러질 것이라는 추론도 해볼 수 있습니다.

또한 기온과 날씨로 인해 따릉이 사용량이 크게 영향 받을 것이라고 생각했습니다. 실제 아래 표를 살펴보면 23~26도 사이의 날씨에서 가장 많은 따릉이 사용량을 보이고 있었습니다.

때문에 따릉이 자전거 사용의 예측을 계절과 온도, 그리고 날씨에 따라 예측하는 것이 평형상태가 이뤄지지 않을 때를 예상하는 좋은 아이디어라고 생각하게 됐습니다. 따라서 날씨(눈, 비, 흐림, 맑음, 황사), 온도, 요일, 공휴일(더미 변수) 등을 독립변수로, 대여소 따릉이 이용량을 종속변수로 하는 시계열 회귀분석을 진행하고자 합니다.

모든 대여소가 재배치 대여소의 대상이 될 필요는 없다(Part 5) 

서울시 내 대여소는 총 3,245개 입니다. 이 모든 따릉이 대여소에 대한 재배치를 대여소 별 거치율 70%(현재 재배치 정책)으로 진행한다면 엄청난 손실이 발생할 수 밖에 없습니다. 이런 이유 때문에 재배치가 필요한 대여소를 적절히 선정하는 것이 효율적인 따릉이 재배치 운영 방법의 중요한 축 중 하나일 것으로 생각됩니다.

재배치 필요 대여소를 선정하는 기준으로는 평형상태 개념을 다시 활용할 수 있습니다. 즉 하루 기준으로 대여와 반납이 어느 정도 평형이 이뤄지는 주거지역의 따릉이 거치소를 찾아 재배치 대상 대여소에서 제외하는 것입니다.

재배치 대여소가 선정되면, 다음으로는 해당 대여소에 대한 재배치 자전거 수 산출이 필요합니다. 이를 위해 앞서 언급한 회귀분석을 활용해 대여소 따릉이 이용 수요를 예측합니다.

특정 대여소의 누적 자전거수가 이용수요보다 크다면, 이를 회수 필요 대여소로 정의합니다. 이때 이용 수요가 대여소 누적 자전거수를 웃돌지 않도록 여유마진 수를 둔다면, 분배 필요 대여소 항목에서 제외될 수 있을 것입니다.

해당 논리를 요약하면 아래와 같습니다.

하지만 여유 마진을 무한정 늘리는 것은 대여소 별 최대 거치대 수와 따릉이 수가 전체적으로 늘어나 또다른 비효율을 초래합니다. 따라서 적절한 여유 마진 수를 결정하는 것이 필요합니다.

이를 위해서 추가로 한가지 생각해본 아이디어가 있습니다.

행정동별 총반납과 대여가 동일한 권역 설정

서울시 내에는 25 개 자치구와 426개의 행정동이 있습니다. 이 중에선 행정동이나 자치구 기준으로 따릉이 사용량이 유입되는 행정동이 있는가 하면, 따릉이가 유출되는 행정동도 있을 것입니다. 해당 현상 또한 평형상태 개념을 활용해 풀어낼 수 있습니다. 즉 자치구 기준으로 따릉이 재배치 인력을 운영하기보다는, 유입과 유출이 일치하는 행정동 기준으로 묶어서 재배치 운영을 하는 것입니다.

해당 아이디어를 학교에서 공유했을 때, 교수님께서 이를 네트워크 이론으로 풀어보면 재밌을 것 같다고 코멘트 주셨습니다. 이를 어떻게 구체화할지에 대해선 현재 스터디중이며, 아직까지는 좀더 공부가 필요한 부분입니다.

따릉이 이용량 예측을 위한 데이터 소개 

마지막으로 따릉이 이용량 예측을 위한 데이터를 소개하고자 합니다. 첫 번째는 따릉이 대여 이력 정보입니다. 서울 열린 데이터 광장 사이트에서 누구나 접근할 수 있으며, 따릉이 하나에 각각의 Id인 자전거 번호 기준으로 대여 및 반납 정보를 확인 할 수 있습니다. 해당 데이터를 통해 자전거의 이동 경로를 노드(이동경로)와 엣지(대여소)로 나타낼 수 있습니다.

따릉이 대여이력 데이터

두 번째로는 따릉이 대여소 데이터입니다. 대여소의 상세 주소와 위도 및 경도가 표기 돼 있습니다. 이를 통해 한강 자전거 길과의 접근성 및 거리를 계산할 수 있으며, 주거지역 및 업무지구의 관계를 벡터 형태로 나타낼 수 있습니다.

따릉이 대여소 정보

토이 모델 제시

토이 모델로 활용할 수 있는 액션 아이템을 생각해봤습니다. 즉 아래와 같이 마곡 출근시간과 퇴근시간을 분석하고, 초 거대 업무지구의 따릉이 이용자 사용 패턴을 간단히 분석해봤습니다.

먼저 출근 시간을 분석합니다. 이를 위해 첫 번째로 출근시간(6시~10시) 강서구 마곡 LGSP 자전거 반납 대여소 리스트를 작성합니다. 두 번째로 각 대여소의 시간별 반납 리스트를 작성해 해당 장소의 직장인들 출근 패턴을 파악합니다. 이를 통해 업무지구 대여소와 주거지역 대여소 구분이 가능해집니다. 세 번째로 출근 시간대에 반납이 많은 대여소의 자전거 거치율을 줄입니다. 현재 거치율 기준은 70%로 하고, 최적 거치율 선정을 위한 논리를 도출합니다.

다음으로 퇴근 시간을 분석합니다. 이를 위해 첫 번째로 퇴근 시간(17시~21시) 상위 20개 자전거 반납 대여소 리스트를 작성합니다. 각 대여소의 시간별 반납 리스트를 작성하면, 해당 장소의 직장인들 퇴근 패턴 및 주거지역 파악이 가능해집니다. 이때 퇴근 시간에는 주거지역으로 가는 이용인원과 레저를 위한 이용인원이 나뉠 것으로 예상됩니다. 이용인원을 적절한 기준으로 나누는 것이 중요할 것으로 생각되며, 이는 현재 연구 중에 있습니다.

한강 자전거길이 따릉이에 대해 가지는 의미

주말의 서울은 자전거 타기 아주 좋은 환경을 가지고 있습니다. 저도 가족들과 함께 한강길을 통해 고양시 행신동에서 행주대교를 타고 서울 식물원, 김포 아라뱃길, 서울함 공원 등 여러곳을 다녀본 경험이 있습니다. 실제 서울시가 발표한 자료에 따르면 2021년도 기준 주말 따릉이 대여 반납 최대 대여소는 다음과 같습니다. ▲뚝섬유원지역 1번 출구앞 13만389건 ▲여의나루역 1번 출구 11만9,587건 ▲봉림교 교통섬 6만4,766건 ▲마포구민 체육센터 앞 6만2,741건 ▲당산 육갑문 5만7,210건 등으로, 이들 대부분이 한강 자전거길 주변에 위치하고 있는 것을 알 수 있습니다.

 

그래서 생각해본 부분은, 주말의 따릉이 이용량에 대해 별도의 예측을 진행해보는 것입니다. 예컨대 누적 이용량을 종속 변수로, 한강 자전거길과 대여소와의 거리를 주요 독립변수로 하는 회귀분석을 해보는 것은 어떨까 생각해봤습니다. 물론 날씨(온도·습도)와 같은 변수들도 독립 변수로 추가할 예정입니다.

한강전체지도/사진=서울시

동일한 맥락으로, 주말이 아닌 주중에도 서울 한강길을 통해 주거지에서 업무지구로 출근하는 사람이 많습니다. Part 3에서 알아본 바와 같이, 자전거길이 잘 형성돼 있는 곳이 이용 상위 대여소에 영향을 미칠 것입니다. 특히 제가 출근하는 강서 마곡동만 하더라도 서울 식물원을 끼고 한강길을 통해 출퇴근하는 사람이 많습니다.

논문의 목표

마지막으로 논문의 목표를 요약해보겠습니다. 현재 서울 전역에 40개 팀 149명의 직원들이 70% 거치율을 목표로 매일같이 3교대(7~16시, 16~23시, 23~4시) 재배치 업무를 진행하고 있습니다.

따릉이 사용량 예측을 통해 분배 업무를 3교대에서 1교대로 대폭 감소하고, 재배치 대여소 대상을 별도 선정·축소하며, 재배치 효율화를 통해 운영비용을 최소화하는 것이 이번 논문의 목표입니다.

Similar Posts