AI · Data · Semiconductor
한양대 연구팀, ‘설명가능한 AI’ 활용해 범죄 취약 지역 예측
“강남역·강북구·수유역·경의선숲길·송리단길일대 범죄 가능성 커”
-
도시 범죄 관련 학술 이론 중엔 ‘깨진 유리창 이론’이라는 게 있다. 깨진 유리창과 같은 사소한 무질서를 방치하면 나중엔 지역 전체로 범죄가 확산될 가능성이 높다는 의미다. 이 때문에 도시 치안 유지는 사소한 범죄 발생을 예방하는 것이 핵심 과제로 꼽힌다.
하지만 도심 지역 범죄는 그 종류가 매우 다양하고, 발생 지역별 특성도 각각이라 이를 사전 예측하는 것은 쉽지 않은 일이다. 이 가운데 국내 연구진이 인공지능(AI) 기술로 도심 내 범죄 취약 지역을 예측하는데 성공했다.
이수기 한양대 도시공학과 교수팀은 ‘설명 가능한 인공지능(XAI)’을 이용해 서울시 도심지역 환경을 분석한 결과, 각 환경별 범죄 유형 및 취약성이 다르다는 사실을 확인했다고 17일 본지에 처음으로 밝혔다. 이번 연구는 AI·공간데이터 기업 ‘빅밸류’ 데이터기획개발팀 김선재 연구원과 공동으로 진행했다. 이 연구결과는 국제 토목학술지 '서스테이너블 시티 앤 소사이어티 '에 1월 24일자로 게재됐다.
뛰어난 분석능력을 가진 머신러닝(ML) 기반 AI는 도심 지역 범죄 유형 분석 연구에 자주 사용되는 기술이다. 하지만 데이터 분석 결과값만 도출하는 AI특성상, ‘어떤 근거로 해당 지역이 범죄로부터 위험한가’를 알 수가 없었다.
이 같은 문제를 해결하기 위해 떠오르는 기술이 XAI다. 이는 자신의 판단 결과를 사람이 이해할 수 있도록 해석해 제공하는 AI모델이다. 연구팀은 이 XAI 기술 중, ‘섀플리 판단 기법(SHAP)’이 적용된 XAI모델을 고안했다. SHAP는 각 데이터가 서로에게 얼마나 영향을 미치는지 계산할 수 있는 AI알고리듬이다. 일반적으로 XAI 모델 개발에 사용되는 랜덤포레스트나 XG부스트 등의 AI알고리듬보다 데이터 간 연관성을 찾는데 더 효과적이다.
-
◇범죄 위험, 소매점 많으면 높고 사무실 많은 곳은 낮아
연구팀은 이 SHAP 기반 XAI모델로 범죄 발생률과 도시환경 간 연관성을 분석하고자 했다. AI학습에 사용된 데이터는 서울시 전체에서 수집한 것으로, 250㎡ 단위별 거리 이미지 데이터, 관심 지점(POI), 민원 발생 사례 등으로 구성됐다. 또 5대 범죄(폭력, 절도, 성폭행, 살인, 강도)의 유형별 발생밀도 데이터도 학습시켰다. 해당 데이터들은 네이버 가로경관 이미지와 생활안전지도 범죄발생 등급 데이터를 활용했다.
분석 결과, 소매점, 인구, 지하철역 비율이 높은 곳에서 모든 유형의 범죄 가능성이 높은 것으로 나타났다. 특히 XAI는 소매점이 많은 지역일수록 범죄발생 기댓값이 높다고 판단했다. XAI의 분석에 따르면 250㎡ 범위 내에 소매점 수가 7개 이상일 경우, 범죄발생 기댓값은 0개였을 때보다 약 75% 증가했다.
‘차량도로’가 많은 지역도 범죄 발생과 연관이 깊었다. XAI는 250㎡ 내에 도로 비율이 15.3%~25.9%인 지역을 범죄 취약 구역으로 선별했다. 이 구간의 경우, 도로가 없는 지역보다 최대 130% 범죄발생 기댓값이 높았다. 연구진에 따르면 이 같은 XAI의 분석은 ‘방어공간이론’에 따른 것이다. 도로가 많으면 외부인의 교통량이 증가해, 범죄 노출 확률이 올라갈 수 있기 때문이다. 또 범죄자의 경우, 도주가 쉬운 도로 근처에서 범죄를 저지를 확률이 높다.
이와 반대로 범죄에 비교적 안전하다고 나타난 곳은 ‘회사 사무실’ 밀집 지역이다. 250㎡ 범위 내에서 사무실이 19개 이상 있을 경우 범죄발생 기댓값이 감소하기 시작했으며, 100개 이상 사무실이 고밀집 된 곳의 범죄발생 기댓값은 0개인 곳보다 700%나 줄었다. 사무실 외엔 CCTV 설치율, 녹지 비율이 높은 곳에서 범죄발생 기댓값이 낮았다.
뿐만 아니라 XAI는 ‘하늘’이 잘 보이는 곳도 도심 내 범죄율 감소에 도움이 된다고 봤다. 탁 트인 지형 덕분에 보는 시선이 많아 범죄 예방에 유리하다는 판단한 것이다. 연구팀은 딥러닝 기반 AI로 64만 6920개의 거리뷰 이미지 데이터를 10m 간격으로 나눠 분석했다. 그 다음 이 데이터와 범죄발생 밀집도 데이터와의 연관성을 XAI로 도출했다. 그 결과, 하늘이 보이는 비율이 19.1% 이상인 지역부터 범죄발생 기댓값 감소가 눈에 띄게 나타났다. 하늘 면적이 30% 이상 보이는 지역은 범죄발생 기댓값이 하늘이 보이지 않는 지역보다 250% 이상 감소했다.
-
◇강남역 및 강북구 지역, 수유역 인근, 송리단길 일대 범죄 가능성 높아
아울러 연구팀은 이 같은 분석 결과를 종합해, 최종적으로 서울시에서 범죄 발생 위험도가 높은 지역을 선별했다. 주요 분석 요소는 △관심시설 다양성 및 가로망 비율 △대규모 주거환경 △유지 관리 부실 지역 △활동성 △ 상가 밀집도 등 5가지로 구성됐다.
분석 결과, 강남역 및 강북구 지역, 수유역 근처엔 소매점, 주점, 음식점이 많아 범죄 유발 가능성이 높을 것으로 예측됐다. 마포구 경의선 숲길과 송리단길 일대는 사무실이 적고, 골목 비율이 높아 범죄 가능성이 높을 것으로 예상됐다. 또 광진구 구의동, 홍대 인근의 경우, 불법 주정차, 쓰레기 투기 등 경범죄 행위가 자주 발생하는 ‘유지관리 부실지역’으로 판별됐다.
김선재 연구원은 “이번 연구는 도시 환경이 범죄 발생에 미치는 상호작용을 AI로 밝혀낸 의미 있는 성과”라며 “안전한 도시 환경 조성 및 지속가능한 사회를 위한 공공정책과 안전지침 개발에 기여할 수 있을 것”이라고 기대했다.
이수기 교수는 “연구에 활용한 XAI는 전통적 통계 분석 방식과 달리, 여러 데이터를 비선형 관계를 모델링하고, 관계를 찾는데 특화됐다”며 “이 AI모델을 활용해 연구팀은 범죄 발생 위험과 도시 환경간 연관성을 정확히 찾아낼 수 있었다”고 밝혔다.