Journal of the Korean Institute of Landscape Architecture
The Korean Institute of Landscape Architecture
Article

도시공원 운영 및 관리를 위한 VQA 딥러닝 기술 활용 연구 - SNS 이미지 분석을 중심으로 -

이다연*, 박서은*, 이재호**
Da-Yeon Lee*, Seo-Eun Park*, Jae Ho Lee**
*서울시립대학교 조경학과 학사과정
**서울시립대학교 조경학과 조교수
*Undergraduate Student, Dept. of Landscape Architecture, College of Urban Science, The University of Seoul
**Assistant Professor, Dept. of Landscape Architecture, College of Urban Science, The University of Seoul

이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(RS-2022-00166223).

Corresponding author : Jae Ho Lee, Assistant Professor, Dept. of Landscape Architecture, College of Urban Science, The University of Seoul, Seoul 02504, Korea, Tel.: +82-2-6490-2842, E-mail: jaeho19@uos.ac.kr

© Copyright 2023 The Korean Institute of Landscape Architecture. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Jul 17, 2023; Revised: Aug 02, 2023; Accepted: Sep 05, 2023

Published Online: Oct 31, 2023

국문초록

본 연구는 공원 이용자의 수요 변화에 맞춰 공원 운영 및 관리를 개선하기 위한 연구이다. 과거 공원 이용 수요에 관한 조사와 분석은 설문조사에 의존해왔으나, 최근에는 공원 이용 트렌드 및 이용자의 활동을 다각도로 파악할 수 있는 소셜미디어 데이터를 적극적으로 활용하고 있다. 하지만 이러한 연구들은 소셜미디어 데이터 중 텍스트 데이터에만 집중되어 있어 이미지 데이터에 담겨있는 정보를 얻기는 부족한 실정이다. 따라서 본 연구는 소셜미디어 이미지 데이터를 이용하여 공원 이용 특성 분석의 새로운 방법을 제시하고, 실제 도시공원 분석에 적용하여 공원 운영 및 관리 방안을 제안하고자 한다. 연구 방법으로는 Visual Question Answering(VQA) 딥러닝 기술을 활용한 이미지 분석 도구를 구축하였다. 이 도구를 이용해 공원 이용자의 특성과 위치, 이용행태 등의 각 도시공원 이용 특성을 파악하였으며, 이를 기반으로 공원별 운영 및 관리 전략을 마련했다. 연구 결과를 요약하면 다음과 같다. 첫째, VQA 딥러닝 기술을 활용해 도출한 이미지 분석 결과값이 기존의 텍스트 분석 결과값과 유사함을 확인하여 분석 도구의 유효성을 입증했다. 둘째, VQA 딥러닝 기술을 이용한 공원 이용 특성 분석은 기존의 텍스트 분석에서 얻을 수 없는 정보(성별, 연령, 이용시간 등)를 수집할 수 있음을 확인했다. 셋째, VQA 분석을 실제 공원의 이용 특성 분석에 적용하여 기존 공원의 운영 및 관리 방안을 제시했다. 본 연구의 결과를 토대로 VQA 딥러닝 기술을 이용한 공원 이용 특성 분석 방법은 향후 여러 공원 이용 특성 분석 시 중요한 방법론적 시사점을 줄 수 있을 것으로 판단된다.

ABSTRACT

This research explores the enhancement of park operation and management by analyzing the changing demands of park users. While traditional methods depended on surveys, there has been a recent shift towards utilizing social media data to understand park usage trends. Notably, most research has focused on text data from social media, overlooking the valuable insights from image data. Addressing this gap, our study introduces a novel method of assessing park usage using social media image data and then applies it to actual city park evaluations. A unique image analysis tool, built on Visual Question Answering (VQA) deep learning technology, was developed. This tool revealed specific city park details such as user demographics, behaviors, and locations. Our findings highlight three main points: (1) The VQA-based image analysis tool's validity was proven by matching its results with traditional text analysis outcomes. (2) VQA deep learning technology offers insights like gender, age, and usage time, which aren't accessible from text analysis alone. (3) Using VQA, we derived operational and management strategies for city parks. In conclusion, our VQA-based method offers significant methodological advancements for future park usage studies.

Keywords: 소셜미디어; 빅데이터; 도시공원 명소화; 공원이용특성; 인공지능
Keywords: Social Media; Big Data; Urban Park Attraction; Characteristics of Park Use; AI

1. 서론

1.1 연구 배경과 목적

도시공원은 레크리에이션 활동을 비롯하여 지역 주민의 여가활용 공간으로 중요한 위치를 차지하고 있다(이재호와 김순기, 2018). 서울시는 도시공원의 중요성을 인식하고 정책으로 반영하고 있으며, 2023년 서울시 푸른 도시 여가국의 주요 업무 계획에서 도시공원을 개선하고 재조성하는 사업을 추진하고 있음을 확인할 수 있다. 이는 서울시가 단순한 공원의 양적 성장에서 벗어나 각 공원의 질적 성장에 대해 주목하고 있음을 시사한다(이서효 등, 2021). 이러한 공원의 질적 성장을 위해서는 변화하는 실제 이용자의 경험과 수요를 고려한 공원 운영 및 관리가 필수적이다(고하정, 2021).

과거에는 공원 이용자의 경험과 수요 분석을 위해 설문조사를 주로 사용했다. 구민아 등(2018)은 설문조사를 통해 공원 이용자들의 경관 선호도, 시설 이용 만족도, 조성 전후 평가 등을 분석하였으며, 이를 토대로 공원의 특성과 요구사항을 파악하고 새로운 변화를 제안하여 공원을 발전시키는 노력을 기울였다. 하지만 이러한 설문조사 방식은 자료 수집에 많은 시간과 인력이 소모된다는 단점이 있으며(김지은 등, 2019), 설문에 참여하지 않는 사람들이 어떤 목적에 의해서 오는지 또는 어떤 활동을 하는지 명확하게 알지 못하는 경우가 많다. 따라서 소규모의 공원 만족도 조사에서는 공원별 큰 차이점이 발생하지 않으며(김용수 등, 2006), 공원별 차별화된 관리 계획을 수립하고자 하는 노력에 있어서 유의미한 결과를 도출하지 못하고 있다(김지은 등, 2019).

최근 설문지의 한계를 극복하기 위해 소셜미디어와 같은 빅데이터를 적극적으로 활용하는 방법이 많이 사용되고 있다. 이를 통해 단기간에 다양한 자료를 수집하고 다양한 의견을 얻을 수 있다. 페이스북, 구글맵 리뷰 등 다량의 텍스트 분석을 통해 공원별 빅데이터 분석을 수행한 연구를 통해 공원 유형별 상위 키워드를 알아내거나 공원에서 사람들이 느끼는 긍정/부정 감정분석을 수행하기도 한다(채진해, 2020; 심지수, 2020a). 더 나아가 사회 연결망 분석을 통해 뉴욕 하이라인 이용자 바이그램 분석 등을 통해 주 키워드 간 연결성을 파악하는 연구도 있다(심지수, 2020b). 최근에는 제3세대 소셜미디어 텍스트 데이터를 활용하여 공원 유형별 이용 행태, 새로운 이용 행태, 만족도 등을 비교, 분석하고 시사점을 논의하는 등의 연구가 진행되고 있다(김지은 등, 2019).

소셜미디어 텍스트 데이터를 활용한 분석은 설문지에서 볼 수 없었던 공원의 이용 특성을 다양하게 볼 수 있다는 장점이 있다. 하지만 최근 국내에서 가장 인기 있는 SNS인 인스타그램의 경우, 텍스트보다 사진에 중점이 있기에 사진 데이터 분석이 더욱 필요하다(Nobles et al., 2020). 특히, 소셜미디어에 게시된 사진 데이터는 사람들이 환경을 인식하는 방식, 환경과의 상호작용 방식, 특정 장소에 대한 감정 등에 대한 데이터를 제공함으로 텍스트 분석에서 확인할 수 없는 정보가 많이 담겨있는 장점이 있다(Chen and Chen, 2020). 사진 데이터 분석의 대표적인 예시로 소셜미디어 사진 게시물의 딥러닝 활용 이미지 분류모델로 객체 탐지 기법(object detection)을 활용하는 사례도 있다(이주경과 손용훈, 2022). 구글의 머신러닝 알고리즘을 사용하여 사진 속 객체를 감지하고 어떤 물체인지 분류하는 기술을 의미하며, 객체 탐지에 대한 정확률이 높다는 장점이 있다. 하지만, 객체 탐지하는 데에는 효과적이지만 단순히 사진 내의 요소를 파악하는 것에 그치며 탐지 이후에 사진 속 객체 간의 관계에 대한 해석이 어려운 단점이 있다. 특히 국내 인스타그램 사진의 경우 인물 위주의 사진이 많다는 점에서 다양한 객체를 탐지하기에는 어려움이 존재하여 사진 속 객체 탐지의 실효성에 대한 의문이 있다는 단점이 존재한다.

최근에는 객체 탐지 기법을 넘어 이미지 캡셔닝 기법도 이미지 분석 기법으로 많이 활용되고 있다(Zhongliang et al., 2017; Simao et al., 2019). 객체탐지 기법을 활용하여 이미지 내의 물체를 식별하고, 해당 정보를 자연어 처리 모델에 제공, 이미지에 관한 설명을 문장으로 제공해주는 서비스로, 사진 속 물체를 식별하는 것에 그치지 않고 물체가 어디에서 어떤 행위를 하고 있는지 더욱 자세하게 알 수 있다는 장점이 있다(정윤아 등, 2023). 즉, 기존 텍스트 분석에서는 명사 빈도 분석을 주로 하였다면, 이미지 분석에서는 단순 객체 탐지가 아닌 이미지를 전체적으로 파악하고 이미지를 문장으로 묘사하여 “동사 + 목적어”와 같이 더욱 자세한 내용 설명을 할 수 있다. 더 나아가 이미지 캡셔닝 기법이 기존 객체 탐지 기법을 넘어 사진의 전반적인 내용을 알려준다는 장점이 존재하지만, 사진 속 해석 내용은 연구자가 요청하는 질문에 대한 답을 얻을 수는 없다는 단점이 있다.

이러한 문제를 해결하고자 최근 Chat GPT 열풍과 더불어 연구자가 사진에 질문을 던져서 이에 대한 답을 주는 프로그램도 개발이 되고 있다. VQA는 Visual Question Answering의 약자로, 사진에 관한 질문을 줬을 때, 인공지능이 사진을 분석하여 답변을 자동으로 생성해주는 기술이다. 예를 들어, “사진 속 사람들이 공원에서 어떤 행동을 하고 있어?”라는 질문을 주었을 때 “네 명의 어린이가 손을 잡고 둥글게 서 있습니다.”와 같은 답변을 제공하여, 기계에 제시하는 사진에 대한 해석이 아닌 연구자가 제공하는 몇 가지 질문을 통해 다량의 사진을 일관성 있게 해석할 수 있다는 장점이 있는 기술이다.

따라서 본 연구에서는 이 기법을 이용하여 이미지에 질문을 던져 공원 이미지 내에서 위치, 행위를 넘어서 시간대, 감정 상태 등 더욱 자세한 설명을 얻고자 한다. 즉, 기존 텍스트 분석과 객체 탐지 기법을 넘어 본 연구에서는 인스타그램에 게시된 사진 속 공원 이용자의 활동을 더욱 다각적으로 파악할 수 있는 분석 도구 및 방법을 제시하고, 이차적으로 선정된 공원의 이용 특성을 분석하여 공원별 운영 및 관리 방안을 제안하고자 한다.

1.2 연구 수행체계

첫 번째 연구에서는 새로운 공원 분석 도구 및 방법을 제시한다. 즉, 새로운 공원 이용 특성 분석 도구인 VQA 분석의 유효성을 검증하기 위해 북서울 꿈의 숲을 대상으로 텍스트 분석을 진행한 선행연구와 VQA 분석의 결과값을 비교한다. 이때 선행연구에서 제시된 공원 이용 특성인 총 행태와 동반자 유형, 연령, 성별, 이용 시간, 위치 빈도를 대상으로 비교 분석한다. 두 번째 연구에서는 앞서 제시한 공원 분석 도구를 서울숲․서울어린이대공원․여의도한강공원에 적용하여, 공원별 운영 및 관리 방안을 제안하고자 한다. 이때 VQA 분석으로 공원별 이용 시간, 연령대, 위치 등의 이용 특성을 도출한다(그림 1 참조).

jkila-51-5-44-g1
그림 1. 연구수행체계
Download Original Figure

2. 연구방법

2.1 대상공원 선정

첫 번째 연구로 VQA 분석의 유효성을 검증하기 위해 공원 이용 특성에 관해 텍스트 분석을 진행한 선행연구와 VQA 분석의 결과값을 비교한다. 비교 대상 선행연구는 텍스트 분석을 통해 공원 이용 특성을 분석한 ‘제3세대 SNS에 표출된 공원 유형별 이용 특성 분석(김지은 등, 2019)’으로 정하였다. 선행연구에서는 이용행태를 비교 분석하기 위해 일정 이상 해시태그 데이터가 있는 공원을 대상공원으로 선정하였으며, 선정된 공원은 북서울 꿈의 숲, 서울숲, 반포한강공원이었다. 이 중 북서울 꿈의 숲을 VQA 분석과의 비교 대상으로 선정하였다1). 선행연구에서 텍스트 분석의 시간적 연구범위를 2016년 11월부터 2017년 4월로 두었다. VQA 분석의 시간적 연구범위는 선행 연구의 시간적 범위를 포함하고자 하였으며, 특히 인스타그램이 활발해지기 시작한 2017년 1월 1일부터 2017년 12월 31일로 설정하였다. 두 번째 연구로 공원별 운영 및 관리 방안을 제안하기 위해 인스타그램 해시태그 데이터 수가 많은 공원을 대상공원으로 선정하고자 하였다. 따라서 표 1과 같이 서울시 직영 공원 중 데이터 수 상위 3곳에 해당하는 서울숲․서울어린이대공원․여의도한강공원을 대상공원으로 정하였다. 즉, 북서울 꿈의 숲은 선행연구와 VQA 분석 결과값의 유사성을 비교하기 위해 진행되었으며, 본 연구에서는 서울숲․서울어린이대공원․여의도한강공원을 대상으로 VQA 분석을 하여 공원별 관리 및 운영 방안을 제안하고자 하였다.

표 1. 대상공원 인스타그램 데이터 수
변수 데이터 총 양(만 건) 데이터 업로드 수/일
서울숲 146 542
서울어린이대공원 53.1 201
여의도한강공원 36.6 197
Download Excel Table
2.2 데이터 수집(이미지 크롤링)

선행연구에서 공원 이용행태와 동반 유형 분석은 북서울 꿈의 숲의 SNS 해시태그를 이용하여 데이터 자료를 수집하고 텍스트 분석하였으며, 이용 시간대 분석은 구글 인기 시간대 분석 데이터를 수집하고 해석하였다. VQA 분석을 위한 이미지 데이터는 인스타그램의 해시태그를 이용한 이미지 크롤링으로 데이터 수집을 진행한다. 이미지 크롤링은 다음 과정에 따라 진행된다. 크롤링할 이미지의 주제에 해당하는 해시태그인 ‘#북서울꿈의숲’, ‘#서울숲’, ‘#서울어린이대공원’, ‘#여의도한강공원’을 검색창에 입력한다. 검색한 해시태그에 대한 페이지의 HTML 코드를 가져온 뒤, 해당 코드에서 이미지 URL을 추출한다. 추출한 이미지 URL을 사용하여 이미지 파일을 다운로드하고, 해시태그별로 3천 장의 이미지를 크롤링할 때까지 이 작업을 반복한다. 크롤링한 이미지 중에서 반복되는 이미지와 광고 이미지를 필터링하여 제외하고 1천 장의 이미지를 남긴다.

2.3 데이터 분석(VQA 딥러닝)

VQA(Vision Question Answering)는 이미지에 관한 질문에 대답을 생성하는 딥러닝 기술이다. 이 기술은 이미지를 이해하고 질문의 의도를 파악하여 적절한 대답을 생성할 수 있도록 돕는다. 이를 위해서는 이미지를 이해하는 비전 모델과 질문을 이해하고 답변을 생성하는 언어 모델이 필요하다. 비전 모델은 이미지의 객체, 색상, 형태 등을 이해하며, 이미지의 특징을 추출하고 중요한 객체나 영역을 식별한다. 반면, 언어 모델은 질문을 이해하고 답을 생성한다. 딥러닝을 사용하는 VQA 기술은 이미지와 질문을 자동으로 이해하고 처리함으로써, 사람과 컴퓨터 간의 상호작용을 가능하게 할 수 있다(Soravit and Doron, 2022). 이를 통해 컴퓨터가 이미지와 관련된 질문에 대한 답을 제공할 수 있게 되며, 이미지에 대한 이해와 자연어 처리의 발전에 기여하고 있다.

본 연구에서는 Bootstrapping Language-Image Pre-Training for Unified Vision-Language Understanding and Generation(BLIP) 모델을 이용하여 이미지 분석을 진행하였다. BLIP는 새로운 VLP framework로 비전 언어 이해와 생성 작업 모두 유연하게 전환할 수 있다(Srinivas et al., 2023). 이는 LM 손실 함수를 통해 미세 조정되며 약 1억 2,900만 개의 이미지를 사용하여 사전 학습되어 매우 우수한 성능을 제공한다. 또한 질문에 대한 추론은 T5-XXL을 활용한다. 이는 구글에서 제공되는 사전 학습된 자연어 처리(NLP) 모델로 총 11억 개의 파라미터로 구성된다.

본 연구에서 사용된 이미지 분석 모델은 영어로 제공되기에 VQA 분석 결과도 영어로 수집하였다. 본 연구는 위 VQA 딥러닝 모델에 “사진 속 공원이 어떻게 보이는가?(viewing)”, “사진이 찍힌 시간은 오전, 오후, 밤 중 언제인가?(time)”, “사진 속에 어떤 물건들이 있는가?(object)”, “이 공원의 가장 주된 요소가 무엇인가?(special)”, “사진 속 사람이 공원에서 무엇을 하고 있는가?(action)”, “사진 속 사람의 연령대는 무엇인가?(age)”, “사진 속 사람의 감정 상태는 어떠한가?(feeling)”의 7가지 문항을 질문하였으며, 해당 답변을 얻어 엑셀 파일로 수집하였다. “사진 속 공원이 어떻게 보이는가?(viewing)”의 질문에 대해 “It’s a park with a lot of trees and a lake.”, “It’s a beautiful park with a lot of trees, and a pond.”의 답변을 얻었으며, “사진이 찍힌 시간은 오전, 오후, 밤 중 언제인가?(time)”의 질문에 대해 Morning, Afternoon, Evening으로 분류한 답변을 얻었다(그림 2 참조).

jkila-51-5-44-g2
그림 2. 답변 데이터 수집 결과
Download Original Figure

3. 연구 결과

3.1 텍스트 분석과 VQA 분석 결과 비교
3.1.1 이용 행태 분석 비교

선행연구에서 북서울 꿈의 숲의 이용 행태는 기분 전환 행위(44.63%) > 먹는 행위(23%) > 데이트 행위(15.02%) > 보는 행위(10%) > 건강 관련 행위(2.32%) 순으로 도출되었다. VQA 분석에서는 찍히는 행위(45%) > 기분 전환 행위(19%) > 먹는 행위(15%) > 데이트 행위(11%) > 보는 행위(8%) > 건강 관련 행위(2%) 순으로 결과가 나타났다. VQA 분석은 SNS에 업로드한 사진을 대상으로 분석을 진행했기에 선행연구에서는 도출되지 않았던 찍히는 행위(posing)가 가장 높은 순위로 나타난 것을 제외하고는 선행연구 결과와 VQA 분석 결과에서 동일한 순위로 결과가 도출되었다(그림 3 참조).

jkila-51-5-44-g3
그림 3. 이용 행태에 대한 선행 연구 및 VQA 분석 결과 비교
Download Original Figure
3.1.2 동반자 유형 분석 비교

선행 연구에서 북서울 꿈의 숲의 동반 유형은 가족(62%) > 강아지(24.1%) > 애인(10.2%) > 친구(3.1%) > 혼자(0.6%) 순으로 나왔다. VQA 분석 결과에서도 가족(52.4%) > 강아지(44.4%) > 애인(3.1%)으로 동일한 순위가 나타났다. 그러나 VQA 분석의 데이터 이미지에서는 혼자 온 경우 사진에 찍히기 어렵기에 혼자 방문한 비율에서는 차이를 보였다. 하지만 이미지 분석은 사람들이 직접 언급한 정보에만 의존하여 동반자 유형을 포착하는 데에 제한이 있는 텍스트 분석과 달리 동반자 유형을 시각적으로 파악할 수 있어, 보다 종합적이고 다각도로 공원 이용행태를 이해할 수 있는 장점이 있었다(그림 4 참조).

jkila-51-5-44-g4
그림 4. 동반자 유형에 대한 선행연구 및 VQA 분석 결과 비교
Download Original Figure
3.1.3 이용 시간 분석

선행연구에서 구글 인기 시간대 분석 데이터로 공원 주 이용 시간을 해석한 결과 오후 2-6시의 이용률이 높았다고 나타났다. VQA 분석에서 ‘사진이 찍힌 시간은 오전, 오후, 밤 중 언제야?’라는 질문을 통해 사진이 찍힌 시간대를 분석한 결과 주 이용 시간은 오후 > 오전 > 저녁으로 결과가 도출되었다. 북서울 꿈의 숲은 주거지와 인접해 있어서 특히 오후 시간에 인근 주민의 이용이 많은 공원으로, 텍스트 분석에서 나타난 결과와 VQA 분석의 결과가 유사한 것을 확인할 수 있다(그림 5 참조).

jkila-51-5-44-g5
그림 5. 이용 시간에 대한 선행연구 및 VQA 분석 비교
Download Original Figure
3.1.4 VQA로 도출할 수 있는 추가적인 이용 특성 분석
3.1.4.1 연령대․성별 분석 비교

선행연구에서는 SNS 데이터 자료의 특성상 공원 이용자의 연령대나 성별 등 개인 정보를 특정할 수 없다는 한계가 있었다. 그러나 VQA 분석으로는 이미지 속 이용자의 성별과 연령대에 관한 질문을 통해 이를 알아낼 수 있다. 더 나아가 이용 특성과 행태 연결망으로 관계성도 알아볼 수도 있다. 그림 6, 7을 통해 어른과 여성은 posing, taking, sitting 등의 주로 정적인 행태를, 아이와 남성은 playing, walking, riding 등의 주로 동적인 행태를 보이는 것을 확인했다(그림 6, 7 참조). 이러한 어른과 아이의 공원 이용행태 차이 및 성별에 따른 공원 이용 차이는 기존 도시공원의 이용 특성에 대한 특이점이 없는 결과라고 볼 수 있지만, 이미지 분석의 신뢰성을 확인시켜 주는 결과이다.

3.1.4.2 위치 분석

VQA 분석에서 ‘이 공원의 가장 주된 요소가 뭐야?’라는 질문을 통해 공원에서 가장 활발하게 이용되는 요소가 무엇인지 파악했다. VQA로부터 얻은 요소에 대한 답변은 숲(tree), 연못(pond), 사슴(deer), 잔디(grass), 한옥(house)이 있었다. 요소 답변으로부터 요소가 발생하는 위치가 어디인지 직접 대칭을 통해 파악하여 매핑으로 결과값을 나타냈다. 북서울 꿈의 숲에서 가장 활발하게 이용되는 요소는 나무로 희망의 숲이 위치로 나타났다. 이후 연못의 월영지, 사슴의 사슴방사장, 잔디의 청운답원, 한옥의 창녕위궁제사 순으로 활발하게 이용되는 요소와 위치의 결과값이 도출되었다(그림 8 참조).

jkila-51-5-44-g6
그림 6. 연령대에 대한 VQA 분석 결과
Download Original Figure
jkila-51-5-44-g7
그림 7. 성별에 대한 VQA 분석 결과
Download Original Figure
jkila-51-5-44-g8
그림 8. 위치 빈도에 대한 VQA 분석 결과
Download Original Figure
3.1.4.3 위치-행태-요소 분석

더불어 위치, 행태, 요소를 도출하여 의미연결망 분석을 시행하면 특정 위치에서 일어나는 이용행태와 행위 요소까지 파악할 수 있었다. 즉, 북서울 꿈의 숲에 있는 희망의 숲(viewing-tree)에서 나타나는 행태(action)가 무엇인지와 행태의 목적어(special)가 무엇인지 파악했다. 희망의 숲(tree)에서는 taking이라는 이용행태에 picture 행위 요소의 연관성이 긴밀하게 나타나 사진을 많이 찍는 것을 알 수 있었으며, walking이라는 이용행태에 dog 행위 요소의 연관성이 긴밀하게 나타나 강아지와 산책을 많이 하는 것을 알 수 있었다(그림 9 참조).

jkila-51-5-44-g9
그림 9. 위치-행태-요소에 대한 VQA 분석 결과
Download Original Figure

종합하면 북서울 꿈의 숲을 대상으로 텍스트 분석을 진행한 선행연구와 VQA 분석을 진행한 본 연구의 공원 이용 특성 결과값을 비교하여, VQA 분석의 유효성을 확인하였다. VQA 분석은 텍스트 분석에서 확인할 수 없는 이용자의 성별과 연령대를 쉽게 파악할 수 있었으며, 특정 시간대나 위치에서의 이용 경향도 파악할 수 있었다. 즉, VQA 분석을 이용하면 공원 이용 특성에 관해 다양하고 상세한 분석 결과를 얻을 수 있으며, 공원 운영과 관리에 대한 의사결정에 도움을 줄 수 있다고 판단했다(그림 10 참조).

jkila-51-5-44-g10
그림 10. 선행 연구 및 VQA 분석 비교
Download Original Figure
3.2 공원 이용 및 운영방안 분석

위 첫 번째 연구에서 유효성을 입증한 VQA 분석으로 공원별 이용 특성을 도출하고 이를 반영한 공원 운영 및 관리 방안을 제시하고자 하였다. 인스타그램 해시태그 수가 많은 상위 3곳인 서울숲․서울어린이대공원․여의도한강공원을 대상 공원으로 선정하였으며, 공원별 해시태그로 크롤링한 약 1,000장의 이미지 데이터를 이용해 이용행태, 시간, 연령대, 인기 공간 등의 공원 특성을 도출하는 VQA 분석을 진행하였다. 이 분석의 결과값을 해석하여 공원 운영 및 관리 방안을 제시한다.

3.2.1 서울숲 VQA 분석 및 해석

서울숲 해시태그로 크롤링한 1,005장 사진의 VQA 분석 결과 총 행태는 posing(22.9%) > sitting(19.2%) > taking(17.5%) > jogging(11.9%) > walking(8.2%) 순으로 나타났다. 이용 시간은 오후(76.8%) > 밤(11.7%) > 오전(11.5%) 순으로 나타났다. 연령대는 20-30대(69.8%) > 0-10대(26.5%) > 40대 이상(3.7%) 순으로 나타났다. 서울숲에서는 사진을 찍는 행위나 앉아있는 행위가 많이 나타나며 주 이용 시간은 오후가 압도적으로 높았다. 또한, 주 이용 연령대는 20-30대가 전체 이용 연령대의 70%를 차지했다(그림 11 참조).

jkila-51-5-44-g11
그림 11. 서울숲 이용 행태, 시간, 연령대 VQA 분석 결과
Download Original Figure

VQA 분석으로 SNS 인스타그램 속 인기 공간을 추출하고 구역별 이미지 빈도수를 매핑했다. 위치 빈도는 벚꽃길(48.6%) > 연못(13.4%) > 잔디밭(4.3%) 순으로 나타났으며, 서울숲에서 인스타그램 이용자들이 가장 사진을 많이 찍는 위치는 벚꽃길임을 알 수 있었다. 위치(벚꽃길)와 행태 연결망 분석을 통해 인스타그램 이용자들은 벚꽃길에서 taking(picture) > posing > walking 순의 행태를 보임을 알 수 있었다(그림 12 참조). 상식적인 수준에서 실제 공원에서는 산책, 휴식 등의 일상적이고 보편적인 공원 이용행태가 가장 많이 나타났을 것이나, 이용객들은 벚꽃처럼 인상이 강한 정물이나 풍경에 대해서 사진을 많이 촬영하였을 것이기에 ‘벚꽃길에서 사진을 많이 찍는다.’라는 이용행태가 가장 높은 결과로 도출되었을 것이다. 따라서 일상적이고 보편적인 이용행태를 제외한 서울숲만의 차별화된 이용행태는 ‘벚꽃길에서 사진을 많이 찍는다.’로 판단할 수 있다.

jkila-51-5-44-g12
그림 12. 서울숲의 인기 공간 및 행태 VQA 분석 결과
Download Original Figure

분석 결과를 종합하면 서울숲은 20-30대가, 벚꽃길에서, 사진을 찍기 위해 많이 방문한다는 차별화된 특징을 도출할 수 있다. 인스타그램 특성상 포즈를 취하고 사진을 찍은 경우가 많지만, 사진을 찍기 위해 공원을 방문하는 사람이 많은 만큼 서울숲을 더욱 활성화하기 위해 공원의 특징을 강조하여 다양한 포토존 설치, 사진 관련 이벤트 개최 등의 콘텐츠를 마련해야 한다. 한편, 공원 이용객의 연령대가 전체 이용 연령대의 70%에 해당할 만큼 20-30대에 치중되어 있어 다른 여러 연령대를 위한 프로그램 개발도 필요하다고 판단했다. 또한, 벚꽃길은 벚꽃이 만개하는 한 계절에만 집중된 요소로, 벚꽃이 만개하는 시즌뿐 아니라 사계절 내내 벚꽃길 위치를 이용할 수 있는 프로그램 개발도 요구된다.

3.2.2 서울 어린이대공원 VQA 분석 및 해석

서울 어린이대공원을 해시태그로 크롤링한 1,002장 사진의 VQA 분석 결과 총 행태는 posing(26%) > playing(21.8%) > taking(18.7%) > sitting(11%) > walking(8.5%) 순으로 나타났다. 이용 시간은 오후(94.4%) > 밤(3.3%) > 오전(2.3%) 순으로 나타났다. 연령대는 0-10대(60.5%) > 20-30대(23.3%) > 40대 이상(16.2%) 순으로 나타났다. 서울 어린이대공원은 서울숲과 여의도 한강공원과 비교하여 오후 시간대 공원 이용률이 높았으며 0-10대 연령대의 이용자가 많았다(그림 13 참조).

jkila-51-5-44-g13
그림 13. 서울 어린이대공원 이용 행태, 시간, 연령대 VQA 분석 결과
Download Original Figure

VQA 분석으로 SNS 인스타그램 속 인기 공간을 추출하고 구역별 사진 빈도수를 매핑했다. 위치 빈도는 동물원(32.3%) > 놀이터(19.8%) > 연못(16.8%) 순으로 나타나 인스타그램 이용자들이 가장 사진을 많이 찍는 위치는 서울 어린이대공원의 공간은 동물원과 놀이터, 연못임을 알 수 있었다. 특정 위치에서 행위보다 위치 공간 자체가 주요 요소가 되는 곳에서 이용자의 행태를 알아보기 위해 위치(연못)와 행태의 연결망 분석을 진행하였고, 인스타그램 이용자들은 연못에서 playing > eating > posing 순의 행태를 보이며 놀이를 즐기는 동적인 행태로 사진을 찍음을 알 수 있었다(그림 14 참조). 즉, 서울 어린이대공원의 차별화된 이용행태는 ‘연못에서 놀이한다.’로 판단할 수 있다.

jkila-51-5-44-g14
그림 14. 서울 어린이대공원 인기 공간 및 행태 VQA 분석 결과
Download Original Figure

분석 결과를 종합하면 서울 어린이대공원은 0-10대가, 연못에서, 놀이하며 공원을 즐긴다는 차별화된 특징을 도출할 수 있다. 서울 어린이대공원을 더욱 활성화하기 위해 공원의 특징을 강조하여 다양한 캐릭터와 협업, 체험 행사 개최 등의 어린이와 가족을 위한 콘텐츠를 마련해야 한다. 한편, 서울 어린이대공원 주 이용 시간이 94.4%, 오후로 치중되어 있어 오전과 밤 시간대 공원 이용이 적은 이유를 분석하고 이를 개선할 필요가 있다.

3.2.3 여의도 한강공원 VQA 분석 및 해석

여의도 한강공원을 해시태그로 크롤링한 1,000장 사진의 VQA 분석 결과 총 행태는 posing(28.8%) > taking(19.8%) > sitting(13.6%) > eating(11.3%) > jogging(8.5%) 순으로 나타났다. 이용 시간은 오후(63.8%) > 밤(27.6%) > 오전(8.6%) 순으로 나타났다. 연령대는 20-30대(79.2%) > 0-10대(18%) > 40대 이상(2.8%) 순으로 나타났다. 여의도 한강공원은 서울숲과 서울 어린이대공원과 비교하여 밤 시간대 공원 이용률이 월등히 높았다(그림 15 참조).

jkila-51-5-44-g15
그림 15. 여의도 한강공원 이용 행태, 시간, 연령대 VQA 분석 결과
Download Original Figure

VQA 분석으로 SNS 인스타그램 속 인기 공간을 추출하고 구역별 사진 빈도수를 매핑했다. 위치 빈도는 강변(49.3%) > 잔디밭(11.2%) > 다리(11%) 순으로 나타나 인스타그램 이용자들이 가장 사진을 많이 찍는 여의도 한강공원의 위치는 강변임을 알 수 있었다. 위치(강변)와 행태의 연결망 분석을 통해 SNS 이용자들은 강변에서 posing > taking(picture) > sitting > eating 순의 행태를 보임을 알 수 있었다. 즉, 여의도 한강공원에서는 ‘강변에서 사진을 찍는다.’는 차별화된 이용행태를 보였다. 더불어, 여의도 한강공원의 행태 분석에서 서울숲과 서울 어린이대공원과 달리 eating 행태가 순위권에 있다는 것이 차별점이었다(그림 16 참조).

jkila-51-5-44-g16
그림 16. 여의도 한강공원 인기 공간 및 행태 VQA 분석 결과
Download Original Figure

분석 결과를 종합하면 여의도 한강공원은 20-30대가, 강변에서, 사진을 찍기 위해 공원을 방문한다. 특히, 밤 시간대 이용률이 상대적으로 높으며 먹는 행태가 나타난다는 차별화된 특징을 도출할 수 있다. 여의도 한강공원을 더욱 활성화하기 위해 공원의 특징을 강조하여 미디어아트쇼 등 밤 시간대와 사진을 위한 콘텐츠를 마련해야 한다. 한편, 공원 이용객의 연령대가 전체 이용 연령대의 80%에 해당할 만큼 20-30대에 치중되어 있어 다른 여러 연령대를 위한 프로그램 개발도 필요하다고 판단했다.

4. 결론

본 연구는 공원 이용자의 수요 변화에 맞춰 공원 운영 및 관리를 개선하기 위한 연구로, 새로운 공원 이용 특성 분석 도구 및 방법을 제시하고 이를 실제 공원에 적용하여 공원별 운영 및 관리 방안을 제안하였다.

기존에는 조경계에서 공원 이용행태를 분석할 때 주로 설문조사 방식을 사용하였으나, 특정 시간과 특정 인원에 한정되는 한계점이 있었다. 이에 대한 대안으로 소셜미디어 데이터를 활용한 연구가 등장하였으나, 여전히 부족한 점이 있었다. 따라서 이번 연구에서는 소셜미디어 이미지 데이터를 분석하는 Visual Question Answering(VQA) 딥러닝 기술 도구를 제시하였고, 선행연구와의 비교를 통해 해당 도구의 유의미한 활용성을 확인하였다.

이후 도구를 활용하여 인스타그램 해시태그 수 상위 3곳에 해당하는 서울숲, 서울어린이대공원, 여의도한강공원의 이용 특성을 분석하였다. 공원 내에서 가장 사진을 많이 찍는 곳은 서울숲에서 벚꽃길, 서울어린이대공원에서 연못, 여의도한강공원에서 강변으로 나타났다. 즉, 소셜미디어 이용객들은 세 공원에서 모두 나무, 물 등 자연물과 함께 사진을 찍는 것을 선호했다. 특히, 강과 연못 같은 수변 시설이 소셜미디어에서 큰 인기를 끌었다. 더불어 공원별 주 이용 시간, 연령대, 이용 행태 등의 이용 특성을 분석하였으며 서울숲에는 사계절 관련, 서울어린이대공원에는 어린이 관련, 여의도한강공원에는 밤 시간대 관련 콘텐츠를 추가가 필요하다는 운영 및 관리 방안 관련 제안을 했다.

이 연구의 의의는 소셜미디어에서 활발하게 공유되는 이미지를 활용한 공원 이용행태 분석의 유의미함을 확인한 것이다. 이를 통해 텍스트 분석에서 하기 어려운 개인의 특성과 위치 등을 파악할 수 있었으며, 공원 모니터링의 도구로서의 활용 가능성을 제시하였다. 또한, 실제 공원의 이용특성 분석에 적용하여 향후 여러 공원 이용 특성 분석 시 중요한 방법론적 시사점을 줄 수 있을 것으로 판단했다.

하지만, 소셜미디어의 특성상 여타 다른 연구와 마찬가지로 연령층이나 성별 등에 편향된 한계가 있을 수 있다. 또한, 인스타그램 이미지 분석의 특성상 이미지가 중복되거나 공원 이용의 자연스러운 모습을 담기보다는 인위적인 사진이 많은 경향이 있었다. 본 연구는 이미지 분석을 위한 초기 시험 단계로 이미지를 직접 필터링하여 질을 향상하는 과정을 거쳤지만, 더 정교한 분석을 위해서는 이미지 데이터 자체의 질이 좋아야 할 것으로 판단된다. 향후 연구에서는 자동 필터링 방법을 개발 및 사용하여 이미지 데이터의 질이 향상되거나 양이 방대해지면 더 정확하고 신뢰할 수 있는 분석 결과를 얻을 수 있을 것으로 생각된다.

Notes

서울숲은 인스타그램 데이터 수가 많아 연구의 말미에 강화 대상공원으로 선정했고, 반포한강공원은 한강공원이라는 특수성이 있어 북서울 꿈의 숲을 비교 대상으로 선택함.

References

1.

고하정(2021) 도시공원 유형별 특성 및 유지 관리 방안에 관한 연구. 재단법인 숲과 나눔. 2020 인재양성 프로그램 연구자 최종 결과 보고서.

2.

구민아, 엄붕훈, 한예서(2018) 도심공원 이용 후 평가를 통한 이용 만족도와 이미지 평가 -대구 2․28기념중앙공원을 대상으로-. 한국조경학회지 46(4): 11-20.

3.

김용수, 이동훈, 박찬용(2006) 어린이공원 이용행태 조사․분석 -대구광역시 택지개발지구를 중심으로- . 한국조경학회지 34(3): 32-40.

4.

김지은, 박찬, 김아연, 김호걸(2019) 제3세대 SNS에 표출된 공원 유형별 이용 특성 분석. 한국조경학회지 47(2): 49-58.

5.

심지수(2020a) 소셜미디어 분석을 통해 본 선형공원의 이용행태: 미국 뉴욕 하이라인 이용자를 중심으로. 국토연구원 연구보고서.

6.

심지수(2020b) 빅데이터를 통한 공원 설계 전략이 지역 경제에 미치는 영향 확인: 서울 경의선 삼림공원 사례 연구. 국토연구원 연구보고서.

7.

이서효, 김해리, 이재호(2021) 한강공원의 질적 서비스와 이용자 영향권의 상관관계 분석. 한국조경학회지 49(6): 27-36.

8.

이재호, 김순기(2018) 도시공원의 필수 설계요소 추출 -2017년 서울시 공원이용 만족도 조사의 결과 분석을 바탕으로-. 한국조경학회지 46(6): 41-48.

9.

이주경, 손용훈(2022) 소셜미디어 사진 게시물의 딥러닝을 활용한 도시공원 이용자 활동 이미지 분류 모델. 한국조경학회지 50(6): 42-57.

10.

정윤아, 김세하, 김동희(2023) 객체 탐지 기술을 이용한 돌발해충 감지 및 분류 시스템 구현. 한국통신학회논문지 48(6): 704-711.

11.

채진해, 조민준, 김복영(2020) 텍스트 빅데이터 분석을 통한 COVID-19 전후 서울시 주요 도시공원의 시민 이용행태 및 관심도 변화. 서울연구원 보고서.

12.

Chen, H. and H. Chen(2020) Understanding the relationship between online self-image expression and purchase intention in SNS games: A moderated mediation investigation. Computers in Human Behavior 112: 106477.

13.

Nobles, A. L., E. C. Leas, S. Noar, M. Dredze, C. A. Latkin, S. A. Strathdee and J. W. Ayers(2020) Automated image analysis of instagram posts: Implications for risk perception and communication in public health using a case study of #HIV. PloS One 15(5): e0231155.

14.

Herdade, S., A. Kappeler, K. Boakye and J. Soares(2019) Image Captioning: Transforming Objects into Words. In Proceedings of the 33rd Conference on Neural Information Processing Systems (NeurIPS 2019). Vancouver, Canada.

15.

Changpinyo, S. and D. Kukliansky(2022). All you may need for VQA are image caption. Google Research.

16.

Srinivas, P. V. V. S., K. Gayathri, K. Bhavitha and K. D. Sarath(2023, July). BLIP-NLP Model for sentiment analysis. In Proceedings of the 2023 2nd International Conference on Edge Computing and Applications (ICECAA) (pp. 468-475). IEEE.

17.

Z. Yang, Y. J. Zhang, S. Rehman and Y. Huang(2017) Image Captioning with Object Detection and Localization. Cornell University, Berkeley.