당신의 길 끝에 : 강서구 중장년층 1인가구 지원센터 최적 입지 분석

서울특별시 강서구에 다수 분포해 있는 중장년층 1인가구를 위한 지원센터의 최적 입지를 분석하는 프로젝트

목록으로 돌아가기
강서구중년1인가구/main

프로젝트 배경 및 개요

본 프로젝트는 24년 겨울 deep daiv. AI 챌린지 데이터분석 수료 후 오픈세미나를 준비하며 진행된 프로젝트입니다.
수료 기간 3C, SOWT 등 다양한 분석 프레임워크를 익히고 테블로 시각화에 대하여 학습했습니다.
그 후 다이브 매거진을 예제로 분석 연습 후 자율주제 프로젝트로 본 프로젝트를 진행했습니다.
본 프로젝트는 서울특별시 강서구에 다수 분포해 있는 중장년층 1인가구를 위한 지원센터의 최적 입지를 분석하는 프로젝트입니다.

Tableau

프로젝트 내용을 담아 제작된 테블로입니다.

제작된 테블로 바로가기

팀원 소개

함께 프로젝트를 진행한 팀원입니다.

김나영님의 블로그 바로가기

김지민님의 블로그 바로가기



0. 전체적인 흐름

이미지 설명

저희 프로젝트의 전체적인 흐름은 다음과 같습니다. 먼저 프로젝트의 주제를 선정하게 된 배경을 살펴보고, 중장년층 1인가구 센터 건립을 제안하며 해당 타겟과 프로그램을 제시합니다. 이후, 중장년층 주성분 분석(PCA)과 상관분석을 통해 변수를 선택 및 가중치를 결정하여 복지우선지수를 개발했습니다. 이를 바탕으로 MCLP 알고리즘을 적용해 중장년층 1인가구 센터의 최적 입지 분석을 실시했습니다.



1. 문제 정의

1) 1인 가구의 터전 강서구

이미지 설명

우리가 살고 있는 대한민국은 지속적으로 1인 가구 비율이 상승하고 있습니다. 그래프에서 보실 수 있듯이 2022년 기준에는 전체 가구의 34.5%를 차지하고 있습니다.

이미지 설명

그렇다면 강서구는 어떨까요? 강서구는 서울시 내에 1인가구 증가율 1위인 행정구입니다.

이미지 설명

더불어 강서구는 중장년층의 비율이 최상위권에 속하는 행정구임을 확인할 수 있었습니다.

2) 중장년층 1인 가구 문제

그래서 저희 팀은 메인 타겟을 중장년층으로 선정하고 이 집단의 현황을 살펴보고자 했습니다.

이미지 설명

중장년층 1인 가구가 겪는 문제로 2022 서울시 복지실태조사 결과를 살펴보았습니다. 중장년층 1인가구가 혼자 생활할 때 곤란한 점을 조사한 결과, 1위는 경제적 불안감, 2위는 위급 상황 대처 어려움, 3위는 외로움으로 나타났습니다.

저희는 이 중 인과관계가 확실히 드러나지 않은 경제적 불안감과 외로움에 초점을 맞추어보았습니다.

이미지 설명

경제적 불안감 문제를 분석해본 결과, 소득 및 자산의 격차가 전체 가구 대비 1인 가구의 소득 및 자산 규모가 낮음을 확인할 수 있었습니다. 또한, 다인 가구에 비해 미취업률이 높았고, 고용 형태는 50대 1인 가구에서 특히 임시 및 일용직 비중이 41%로 다인가구에 비해 확연히 차이가 남을 확인할 수 있었습니다.

이미지 설명

다음은 외로움 문제를 분석해보았습니다. 외로움의 경우 전체 다인 가구에 비해 18% 높음을 확인할 수 있고, 1인 가구 중에서도 연령층으로 확인한 결과 중장년층이 가장 높은 비율로 확인됩니다.

이미지 설명

또한, 중장년층 1인 가구는 다른 연령층에 비해 사회적 고립감이 높게 나타남도 확인할 수 있습니다.

이미지 설명

따라서 사회적 고립감과 외로움은 맞닿아 있으며, 인간의 상호작용의 부재에서 기인하는 감정이라 예상됩니다.

이미지 설명

또한, 경제적 어려움과 외로움의 경우도 관계가 있습니다. 경제적 여유가 없을수록 여가 시간에 외부 활동을 하는 비율이 줄어들고 동영상을 시청하는 비율이 늘어난다는 결과를 확인할 수 있었습니다.

위의 리서치의 결론은 경제적으로 어려울수록 사회적으로 고립되는 상황이 나타나며, 이는 외로움의 감정으로 이어진다는 것입니다.

다시 말해 외로움 문제를 근본적으로 해결하기 위해서는 경제적 불안감 해소가 필요합니다. 하지만 중장년층에게는 사람을 만나는 것을 추구하기 이전에 주택 무소유, 실업 및 재취업의 어려움, 노후 대비 미흡 등 눈앞에 닥친 여러 상황들이 많습니다.

그렇기에 외로움을 해결하기 위해서는 단순 만남 주선, 데이팅, 밥 친구 모임과 같은 일회성 커뮤니티를 주선하는 것이 아니라 경제적 불안감을 해소할 수 있는 실질적인 지원이 이루어져야 할 것입니다.

3) 1인가구 지원센터 제안

중장년층에게 필요한 지원을 찾아보기 위해 먼저 강서구의 중장년층을 위한 지원 현황을 살펴보았습니다. 현재 강서구에는 1인가구 지원센터가 있습니다.

이미지 설명

운영되고 있는 프로그램은 일회성 체험 위주의 프로그램이 개설되고 있습니다.

이미지 설명

또한, 1인가구 지원센터가 있지만 이는 독립적으로 운영되는 것이 아니라 가족센터에 소속되어 함께 운영되고 있습니다.

각 연령층을 위한 담당 센터의 경우, 청년층은 청년지원센터 ‘강서오랑’이, 노년층은 노인복지센터가 있으나 중장년층을 위한 지원센터는 부재한 상황입니다.

따라서 저희는 중장년층 특화 1인 가구 센터 신설을 제안합니다.

이 기구에서는 중장년층 타겟 복지 프로그램을 독립적으로 운영하고, 중장년층 1인 가구의 물리적 거점 센터로서 기능할 수 있을 것입니다. 또, 여러 기관에 산재되어 있는 지원을 파악해 1인 가구 지원센터의 행정적 중심으로 연령별로 1인 가구를 지원하는 프로그램을 총괄하고 효율적으로 관리하는 센터로서 기능할 수 있을 것입니다.

이미지 설명

진행하는 프로그램은 ‘경제적 불안감 해소’를 키워드로 잡아 보다 중장년층에게 실질적으로 필요한 주제로 구상했습니다.

따라서 요약하자면, 1️⃣ 강서구의 중장년층을 위한 1인가구 센터의 필요성을 확인했고, 이후에는 이를 위한 2️⃣ 최적의 입지 분석을 수행했습니다.



2. 데이터 분석

1) 프로세스

이미지 설명

저희의 분석 프로세스는 다음과 같습니다. 우선, 입지 선정을 위한 관련 데이터를 수집했습니다. 다음으로 데이터를 정제하고, 수집한 변수 중 중장년층 인구수와 관련있는 변수와 가중치를 선정한 후 복지 우선 지수를 개발했습니다.

다음으로 입지 분석을 수행했습니다. 알고리즘의 경우 MCLP를 사용했고, 결과는 태블로 대시보드로 구현했습니다.

❗ 들어 가기 전

저희가 수행한 분석 단계를 설명하기 전, 통계 분석 방법과 알고리즘을 소개하려 합니다.

이미지 설명

2) 데이터 수집 및 정제

이미지 설명

수집한 데이터셋의 정보는 위 내용과 같습니다.

이미지 설명

총 다섯 가지의 카테고리로 나누어 행정동별로 수집했습니다.

먼저, 중장년층 1인 가구의 특성을 확인할 수 있는 관심 집단의 특성입니다. 이 데이터셋은 서울시와 SK텔레콤이 통계청 데이터와 통신데이터 가명결합을 통해 추정한 서울 행정동 단위 성, 연령별 1인가구의 생활특성을 엿볼 수 있는 데이터로 커뮤니케이션지수, 이동지수, 재정지수 등 10개 지수로 구성되어 있습니다.

다음은 인구 특성입니다. 메인이 되는 중장년층 인구 수와 저희의 타겟인 소득 분위가 낮은 집단과 연관있는 기초생활수집자 수로 구성했습니다.

다음은 교통 접근성으로 버스 정류장, 지하철, 주차장 수로 구성했습니다.

다음은 경제적 어려움을 해소할 수 있는 시설인 유료 및 무료 직업소개소 개수, 사업체 수로 구성했습니다.

마지막은 기타 접근성을 고려해 의료시설 개수와 공지시가를 추가했습니다.

3) 변수 선택

3-1) 상관 분석

같은 카테고리에 속하는 관심 집단의 경우, 칼럼을 살펴보면 중복되는 변수들이 상당 부분 있어 이 변수를 대상으로 상관 분석을 시행했습니다.

이미지 설명

확인한 결과는 다음과 같으며, 외출 많은 집단의 경우 상관계수가 0.25로 낮아 추가로 상관 분석을 실시했습니다.

이미지 설명

상관 분석 전, 저희가 확인하고자 하는 데이터는 20개의 소표본으로 정규성 검정을 실시했습니다.

귀무가설 : 정규성을 만족한다.
대립가설 : 정규성을 만족하지 않는다.

정규성 검정 결과, 중장년층 인구수와 외출 많은 집단 데이터는 p-value가 0.01보다 작으므로 유의수준 0.01 하에서 귀무가설을 기각합니다. 따라서 정규성을 만족하지 않는다고 할 수 있습니다.

이에 스피어만 상관분석을 실시했습니다.

이미지 설명

귀무가설 : 상관계수가 0이다. (두 변수가 유의하지 않다.)
대립가설 : 상관계수가 0이 아니다. (두 변수가 유의하다.)

(중장년층 인구수와 외출 적은 집단), (중장년층 인구수와 외출 많은 집단) 간 스피어만 상관 분석을 실시한 결과 p-value가 각각 0.045, 0.2697로 유의수준 0.01 하에서 귀무가설을 기각되지 않습니다. 따라서 상관계수가 유의하지 않다고 할 수 있겠습니다.

따라서 외출 적은 집단과 외출 많은 집단은 1차적으로 삭제했습니다.

상관계수를 살펴보면, 또 다른 특징으로 관심집단 컬럼 간의 상관계수가 매우 높음을 확인할 수 있습니다. 이는 변수 간 의미하는 바가 비슷할 수 있음을 의미합니다. 따라서 중장년층 인구수와의 상관계수를 확인하여 0.8을 기준으로 정해 이보다 작은 값을 가지는 외출/커뮤니케이션 적은 집단, 출근 및 근무시간 많은 집단을 삭제했습니다.

3-2) 주성분 분석

이미지 설명

다음으로는 수집한 모든 변수들의 중요도를 확인하고 이에 근거해 변수를 채택하기 위해 주성분 분석을 실시했습니다. scree plot을 그려 경사가 급격히 완곡해지는 지점의 컬럼 개수를 활용하여 PC3까지를 확인해보고 최종적으로는 PC2까지 잘 설명하는 변수들로 선정했습니다.

이미지 설명

PC3까지의 변수 중요도를 확인해본 결과, 각 PC별 특징을 확인할 수 있었습니다. PC1에서는 관심집단과 관련한 변수들이, PC2에서는 경제 및 교통 접근성과 관련된 변수들이, PC3에서는 이외 공시지가, 주차장, 기초생활수급자 수로 묶여졌습니다. 이를 근거로 PC1과 PC2에서 많은 중요도를 차지하지 못한 공시지가, 주차장, 기초생활수급자 수는 제거하기로 결정했습니다.

4) 중장년층 복지 우선 지수 개발

중장년층 복지 우선 지수는 특정 넓이로 정의된 covering area 기준 복지가 우선적으로 필요한 지수를 나타냅니다.

PC1

PC2

최종적으로 선정한 변수들은 특성이 비슷한 변수끼리 묶어 경제, 사회성, 일자리, 접근성 총 4개의 항목으로 구분했습니다.

이미지 설명

가중치의 경우, 먼저 경제, 사회성, 일자리, 접근성 4개의 항목은 PC1과 PC2의 분산 변동량의 비로 부여했습니다. 항목 하위의 각 변수는 각 PC의 설명력의 비로 부여했고, 최종적으로 0~1 사이의 값을 가지도록 scaling하여 계산했습니다.

5) 최적 입지 분석

MCLP(Maximal Covering Location Problem)

이미지 설명

MCLP의 목적함수 및 제약조건은 다음과 같습니다. 해당 목적함수의 값을 최대화하는 방향으로 알고리즘을 학습했습니다.

이미지 설명

실제 MCLP 프로세스를 단계별로 설명해보았습니다. 먼저 100m*100m로 구성된 격자 데이터를 마련했습니다. 다음으로 지원센터가 현실적으로 들어올 수 있는 위치로 선정하기 위해 중장년층 주거 지역 및 건물 데이터로 중장년층 1인가구 지원센터 수요지역을 필터링하는 과정을 거쳤습니다. 필터링된 격자 데이터는 수요 포인트와 시설물 포인트 지점으로 구성됩니다. 이후 이 격자 데이터마다 복지우선지수에 따른 점수를 부여해줍니다. 알고리즘을 통해 높은 점수가 부여된 수요 포인트를 최대한 커버할 수 있는 지점을 찾습니다. 성인 평균걸음 시속 5km를 고려해 20분 정도 거리인 2,000m를 covering area 반경으로 선정해 5개의 지점을 선정했습니다. 이가 바로 저희가 파악한 중장년층 1인가구의 최적 입지라고 할 수 있겠습니다.



3. 결론

1) 분석 결과 대시보드

이미지 설명

확인하고 싶은 행정동을 클릭하면 강서구 행정동 중 중장년층 복지 우선 지수 순위와 경제, 사회성, 일자리, 접근성 값을 확인할 수 있습니다.

오른쪽 하단에는 각 지표 간 상위 3개의 행정동을 표시했습니다.

이미지 설명

선정된 5개 포인트들의 위치를 확인할 수 있고, 이를 클릭하면 수요 가구 수와 수요 포인트, 수요 지역의 평균 가중치를 확인할 수 있습니다.

여기서 수요 가구 수는 해당 행정동의 중장년층 1인 가구 수와 인접 행정동의 중장년층 1인 가구 수를 의미하며, 수요 포인트는 중장년층 거주 지역의 격자 데이터 수를 의미합니다.

2) 선정 입지 확인

A포인트(화곡4동) : 주택이 밀집해 있음.
B포인트(공항동) : 거주지가 많고, 어린이집 및 학원이 많이 위치해 있음.
C포인트(방화2동) : 공항 근처며, 교통 접근성이 좋은 지역임.
D포인트(화곡본동) : 주변에 상가가 많이 위치해 있음.
E포인트(화곡2동) : 교통 접근성이 좋고 주변에 회사가 많음.


3) 의의 및 한계

의의

한계