본문 바로가기

정부지원

데이터 사각지대 해소를 위한 비정형 복지데이터 활용 사례

복지 행정은 데이터를 기반으로 움직인다.
그러나 여전히 수많은 국민이 ‘데이터에 존재하지 않는다’는 이유로
복지의 혜택을 받지 못한다.
정부가 수집하는 공식 통계에는 잡히지 않는
비정규직, 프리랜서, 단기 노동자, 1인 자영업자,
그리고 고립된 노년층이 그 대표적인 사례다.
이들은 소득이나 재산이 불안정해 행정 데이터로 포착되지 않지만,
실제 생활 위기는 통계보다 훨씬 앞서 찾아온다.
이 문제를 해결하기 위해 정부는 2025년부터
‘비정형 복지데이터(Unstructured Welfare Data)’를 활용하기 시작했다.
이 글에서는 데이터 사각지대를 해소하기 위한
비정형 데이터의 정의, 수집 방식, 실제 적용 사례,
그리고 향후 과제를 구체적으로 살펴본다.

데이터 사각지대 해소를 위한 비정형 복지데이터 활용 사례

비정형 복지데이터란 무엇인가: 기존 행정데이터의 한계를 넘어

‘비정형 복지데이터’란
기존의 표준화된 통계자료(소득, 재산, 고용기록 등)에 포함되지 않는
생활 패턴, 사회 신호, 이용 행동 데이터를 말한다.
즉, 행정기관이 직접 신고받지 않아도
개인의 위기 상황을 간접적으로 보여주는 생활지표형 데이터다.

① 정형데이터 vs 비정형데이터

구분정형 복지데이터비정형 복지데이터
형태 표준화된 수치, 표, 코드 텍스트, 이미지, 로그, 행태 데이터
수집 주체 행정기관 (신청 기반) 공공기관 + 민간데이터 협력
예시 주민등록, 소득신고, 재산세 납부 전력 사용량, 통신비 연체, 의료비 폭증, SNS 게시물 패턴
특징 객관적이지만 느림 비공식적이지만 빠름

비정형 데이터는 개인의 위기 징후를 조기 탐지하는 데 강점을 가진다.
예를 들어, 한 달 전까지 정상 납부하던 전기요금이 두 달 연속 연체되고,
의료비 지출이 급증하며, 통신비 사용량이 급격히 줄었다면
그 가정에 위기가 닥쳤을 가능성이 높다.
이 정보를 조합하면 복지 사각지대를 신속하게 발견할 수 있다.

② 비정형 데이터 활용의 필요성

한국의 복지 행정은 여전히 ‘신청 중심 구조’다.
즉, 도움이 필요한 사람이 먼저 손을 들어야 지원이 시작된다.
하지만 위기 가구일수록 정보 접근성이 낮고, 신청 자체를 포기하는 경우가 많다.
이때 비정형 데이터는 “신청하지 않아도 발견되는 복지”를 가능하게 한다.
AI가 생활 신호를 분석해 먼저 위험 징후를 포착하고,
행정이 선제적으로 개입할 수 있게 만드는 것이다.


정부가 수집하는 비정형 복지데이터의 주요 유형

정부는 2025년부터 비정형 데이터를 4가지 축으로 분류하여 관리하고 있다.
이는 ‘AI 복지조기경보체계(Welfare Early Warning System)’의 기반 데이터로 사용된다.

① 공공요금 데이터

  • 전기·수도·가스 요금 연체 패턴
  • 통신비 납부 지연 및 사용량 감소
    이 데이터는 한국전력공사, 한국수자원공사, 통신 3사와 협약을 통해 수집된다.
    전력이나 통신 사용량이 급감한 세대는
    실직, 질병, 이주 등의 위기를 겪고 있을 가능성이 높다.

② 소비·의료 패턴 데이터

  • 의료비 청구 건수 급증
  • 약국·병원 방문 빈도 변화
  • 카드 결제 패턴 급감
    이 정보는 건강보험공단, 카드사, 금융위원회가 공동으로 제공한다.
    AI는 이러한 지출 패턴을 학습하여
    “평소 대비 이상 지출이 30% 이상 증가”한 가구를 위험군으로 분류한다.

③ 주거·이동 데이터

  • 전출입 신고 급증 지역
  • 공공임대 연체율
  • 이사 빈도와 지역 이동 거리
    이 데이터는 국토교통부와 지방자치단체의 주거행정시스템에서 추출된다.
    특히 최근에는 공공임대주택의 전출 사유를
    AI가 자동 분류하여 ‘경제사정 악화형’, ‘건강 악화형’ 등으로 분석한다.

④ 디지털 신호 데이터

  • SNS 감정어 분석
  • 복지 포털 접속 패턴 변화
  • 상담봇 대화 로그
    AI는 특정 지역의 온라인 게시물에서
    ‘실직’, ‘공과금’, ‘병원비’, ‘퇴거’ 등의 부정 단어가
    평소보다 20% 이상 증가하면
    해당 지역을 ‘심리적 위기 지역’으로 표시한다.
    이 데이터는 개별 인식이 아닌 집단 통계 기반의 사회 신호 데이터(Social Signal Data)로 활용된다.

이러한 비정형 데이터는 각각은 단편적이지만,
AI가 이를 종합 분석하면 복지위기의 ‘패턴’을 추적할 수 있다.


실제 적용 사례: 데이터가 발견한 위기

① 서울시 ‘데이터 기반 복지 발굴사업’

서울시는 2025년부터 ‘데이터 복지지도’를 운영 중이다.
전력, 수도, 건강보험 납부정보를 결합한 AI 모델이
위험 징후 가구를 자동 탐지해 구청 복지담당자에게 알림을 전송한다.
그 결과 1년간 총 3,800가구가
별도의 신청 없이도 긴급복지 또는 생계비 지원을 받았다.
특히, 독거노인이나 고시원 거주자 등
기존 행정망에서 놓쳤던 사례가 대폭 감소했다.

② 부산시 ‘에너지 데이터 연계 복지 시범사업’

부산시는 한국전력과 협업해
전력 사용량이 한 달 평균 대비 40% 이상 급감한 가구를 분석했다.
그 결과, 실제로 해당 세대의 70% 이상이
건강악화나 실직 등 경제적 위기를 겪고 있었다.
이 정보를 바탕으로 복지공무원이 직접 방문해
의료비·공과금 지원을 제공했다.

③ 경기도 ‘AI 심리위기 감지 프로젝트’

경기도는 SNS 공개 게시물의 감정어를 분석해
청년층의 심리적 불안 수준을 지역별로 측정했다.
AI는 특정 시·군에서 ‘불안’, ‘퇴사’, ‘돈 없음’ 등의 단어 빈도가 급증하면
그 지역 청년복지센터에 알림을 보낸다.
실제로 2025년 8월, 한 지역에서 감정어 변화가 급증하자
센터가 긴급 심리상담을 진행했고,
20여 명의 청년이 자살위험군으로 분류되어 사전 개입이 이루어졌다.

이처럼 비정형 데이터는
‘행정이 발견하지 못한 사람’을 찾아내는 데 강력한 효과를 발휘하고 있다.


비정형 데이터 활용의 과제와 윤리적 고민

① 개인정보 보호와 공익의 균형

비정형 데이터는 개인의 생활 정보를 포함한다.
전력 사용량, 통신비 납부 정보 등은 민감한 개인정보로 간주될 수 있다.
따라서 정부는 모든 데이터를 비식별화(De-identification)하여
개인 신원을 식별할 수 없게 처리한다.
또한 데이터 결합은 행정기관 내부망에서만 수행되며,
AI는 통계적 패턴만 분석한다.
그럼에도 “내 생활이 감시당한다”는 불안은 여전히 존재한다.
이를 해소하기 위해 정부는
데이터 사용 내역을 시민이 직접 조회할 수 있는
‘복지데이터 이용 이력 공개제도’를 2026년 도입할 예정이다.

② AI 편향 방지

비정형 데이터는 사회·지역·계층에 따라 생성량이 다르다.
예를 들어, 인터넷 사용이 적은 고령층은
SNS나 온라인 데이터에서 잘 포착되지 않는다.
따라서 AI가 이 데이터를 그대로 학습하면
청년층 중심의 복지예측으로 왜곡될 수 있다.
이를 막기 위해 정부는 ‘데이터 대표성 보정 알고리즘’을 개발 중이다.
즉, 데이터의 불균형을 자동으로 보정해
모든 연령과 계층을 균형 있게 반영하도록 설계하는 것이다.

③ 현장 연계의 한계

AI가 위기 가구를 탐지해도,
실제 지원이 이루어지려면 공무원의 현장 확인이 필수적이다.
즉, 비정형 데이터는 ‘발견’까지만 가능하고,
‘판단’은 여전히 사람이 담당해야 한다.
이 과정에서 행정 부담이 늘어나는 만큼,
AI 알림의 정확도 향상이 지속적인 과제가 된다.


결론: 데이터 밖의 사람을 데이터 안으로

비정형 복지데이터는 복지행정의 사각지대를 줄이기 위한
가장 현실적이고 강력한 도구로 자리 잡았다.
AI가 전력, 소비, 이동, 디지털 신호를 분석해
행정이 놓친 사람을 찾아내는 시대가 열린 것이다.

그러나 기술이 아무리 발전해도,
복지의 목적은 여전히 ‘사람을 데이터 안으로 끌어오는 일’이다.
비정형 데이터는 숫자가 아니라,
보이지 않던 사람들의 신호를 읽어내는 언어다.
따라서 데이터 활용의 핵심은 기술이 아니라 공감과 윤리다.

복지의 미래는 신고에서 탐지로,
탐지에서 예측으로,
예측에서 이해로 나아가야 한다.
AI와 비정형 데이터가
행정의 속도를 높이는 동시에
사람의 삶을 더 세밀하게 포착할 수 있다면,
그것이야말로 진정한 ‘데이터 복지사회’의 출발점이 될 것이다.