1. 서론
도심 속 하천 공간은 생태계 보전 및 쾌적한 환경을 제공하는 등의 다양한 생태계서비스를 제공하는 주요한 공간으로 블루인프라스트럭쳐 자원으로써 역할을 수행하고 있다(Gilvear et al., 2013). 우리나라의 다양한 하천 중에서 한강은 동-서를 가로지르는 하천으로써 하천변을 따라서 11개의 한강공원이 조성되어 있다. 한강공원은 서울의 대표적인 공공공간으로 생태적인 가치뿐 아니라 시민의 문화와 여가생활을 지원하며, 공공의 이용 증진을 위해 조성된 공간이다(유연환과 양병이, 2016). 특히, 주변 거주민에게는 일상적으로 이용되는 생활권공원의 역할을 수행한다. 2023년 서울 시민의 사회지표 조사에 따르면, 한강은 서울의 대표 랜드마크로 48.3%의 지지를 받았으며, 시민의 68.6%는 수변 공간에서 여가생활을 즐기는 것으로 나타났다(서울특별시, 2023). 또한, 한강과 한강공원은 내국인만 자주 찾는 장소가 아닌 외국인 방문객도 생태관광과 같은 관광적 측면 및 한강 유람선, 배달음식, 한강라면 등과 같은 한국 문화를 체험하고 경험하는 관점에서 하나의 매개체로써 관심을 가지고 계속해서 방문하는 공간이다(https://www.ttlnews.com; https://www.donga.com). 이처럼 한강공원은 단순한 근린 생활권에서 접할 수 있는 공원의 의미를 넘어 서울의 상징적 공간이자 여가와 문화를 담는 장소로 자리 잡고 있다.
복합적인 가치를 가지고 있는 한강공원은 일반적인 근린공원과는 다른 이용 행태를 보인다. 휴식, 산책과 같은 일상적 이용뿐만 아니라, 불꽃놀이, 도깨비야시장과 같은 도시민이 특별한 여가를 위해 즐겨 찾는 목적형 공원으로 비일상적 활동이 활발히 이루어지며, 이는 같은 한강공원이라 하더라도 공원에서 제공하는 서비스에 따라 역할과 기능이 다르게 나타난다(우경숙과 서주환, 2020). 또한, 프로그램에 국한되지 않고 이용자의 자발적 활동이 빈번하게 발생하며, 다양한 이용 행태가 관찰된다(박상희, 2018). 특정 공원에서만 나타나는 독특한 ‘공원 이용 문화’는 공원의 이용과 운영에 영향을 미치며(우경숙과 서주환, 2020), 공원 이용 문화에 따라 이용자의 수요를 반영한 공원 관리와 운영이 요구되고 있다(Warnock and Griffiths, 2015).
한강은 과거 한강 르네상스 프로젝트(2007)에서 현재의 그레이트 한강 프로젝트(2023)에 이르기까지 끊임없이 변화하였으며, 인접 지역의 토지 이용 및 시민의 공원 이용 패턴 등을 반영한 개별 사업의 사업 계획에 따라 해당 한강공원의 속성 및 특징도 함께 변화하고 있다(송지연, 2014). 한강공원은 모두 한강변에 위치한다는 지리적인 조건은 동일하지만, 공원별 주요 프로그램과 인접 지역의 특성이 달라 각 공원의 이용자 행태와 인식 또한 상이할 것으로 예상된다.
본 연구의 목적은 서울시 한강공원 중에서 망원한강공원, 반포한강공원, 여의도한강공원, 잠실한강공원 4개의 한강공원을 대상으로 구글맵 리뷰 데이터를 활용하여 각 한강공원 이용자의 주요 행태 및 활동을 파악하고 이를 통해 공원의 특성 및 매력적인 공간 특성을 도출하고자 한다. 이용자의 인식은 공간을 실제로 이용한 경험을 바탕으로 형성되며, 공간에 대한 매력도의 경우에도 이용자의 판단과 태도에 의해서 평가된다(박소영과 전현모, 2023; 이병언과 김신원, 2023). 따라서, 공간에 대한 방문 경험을 바탕으로 작성된 구글맵 리뷰 데이터는 이용자의 인식과 매력도를 파악하는데 용이한 데이터라고 판단된다. 특히, 한강공원의 경우 내국인과 외국인 모두 자주 방문하는 공간으로 이에 따른 이용 특성의 차이가 나타날 수 있으며, 텍스트로 작성된 이용자의 리뷰 데이터와 이미지 형태로 작성된 리뷰 데이터를 비교 분석함으로써 개별 한강공원의 매력적 공간은 어디이며, 해당 공간이 가지는 특성을 파악하고자 한다. 기존 연구는 주로 이용자 행태와 만족도에 초점을 맞춰 시설 및 프로그램에 대한 만족도 분석(이서효 등, 2021) 등 공간의 단편적인 요소에 초점을 두고 있다. 따라서 본 연구에서는 서울의 명소인 한강공원에 대해서 텍스트와 이미지 데이터를 결합하여 보다 심도 있는 공간 특성 도출 및 매력적인 요소를 발굴하고자 한다.
텍스트마이닝을 활용한 연구들은 녹지 공간의 사회적·문화적 기능을 심층적으로 이해하는 데 기여한다. 사광균(2024)은 텍스트마이닝 기법으로 한강변 도시공원(서울숲공원, 선유도공원, 여의도공원)의 키워드를 분석하여 시민의 인식과 관심사를 파악하고 공원별 특화 방안을 제시하였다. 심주영 등(2024)은 신도시 공원(일산호수공원, 분당율동공원, 광교호수공원, 동탄호수공원)의 이용자 경험을 분석하여 공원별 주요 활동과 사용자 그룹(가족, 연인, 친구 등)의 특성을 도출하고, 사용자 중심의 개선 방안을 제안하였다. 김신성(2023)은 블로그 데이터를 기반으로 뚝섬한강공원의 이용 행태를 체험경제 관점에서 분석하며 공원의 유지관리 방식을 유연하고 다양화해야 할 필요성을 강조하였다. 이러한 연구들은 텍스트마이닝을 통해 공원의 개선 방향과 사용자 중심의 관리 방안을 제안하여 공원 이용 행태를 이해하는 데 기여하고 있다.
구글맵 리뷰를 활용한 연구는 온라인 리뷰 데이터를 바탕으로 공원 이용자의 인식과 평가를 분석하는 데 초점이 맞춰져 있다. 문보라와 김용은(2024)는 공공체육시설 리뷰를 분석하여 이용자의 만족과 불만족 요인을 파악하고 이를 기반으로 공공체육시설 활성화를 위한 방향을 제안하였다. 이병언과 김신원(2023)은 유휴산업시설 재생공원을 대상으로 구글맵 리뷰 데이터를 활용해 방문자의 평가와 인식을 분석하고, 도시의 성공적인 그린인프라 조성 방안을 도출하였다. 이주경과 손용훈(2021)은 구글맵 리뷰를 통해 공원서비스에 대한 수요와 이용자 인식을 다각적으로 파악하며, 리뷰 데이터를 활용한 공원 서비스 개선 가능성을 제시하였다.
텍스트마이닝을 활용한 연구의 경우 기존 인터뷰 및 설문조사가 가지는 한계점인 많은 표본 수를 확보하기 어렵다는 점을 보완할 수 있다는 장점을 가진다(김세령 등, 2019; 김승 등, 2022). 구글맵 리뷰의 경우에는 국내에서는 해외에 비해 이용률이 낮기 때문에 상대적으로 리뷰 데이터 수가 적을 수 있지만, 네이버와 다음과 같은 다른 플랫폼과 다르게 외국인 리뷰 데이터를 수집할 수 있다는 장점이 있으며, 리뷰 데이터의 경우에는 블로그나 카페와 다르게 본인이 직접 경험한 내용을 바탕으로 작성하는 것을 기반으로 하고 수익성을 위한 광고 글이 없다는 점에서 장점을 가지고 있다(이주경과 손용훈, 2021). 공원 이용 및 특성과 특정 공간을 도출하기 위하여 소셜 빅데이터를 활용하는 연구에서 구글맵 리뷰 텍스트와 이미지 데이터를 함께 활용한 연구는 아직 부족한 실정이다. 따라서 본 연구에서는 텍스트 데이터의 빈도분석을 통하여, 공원별 이용자의 주된 이용 행태 차이를 도출하고 텍스트 데이터에서 도출된 공간 및 행태 키워드와 이미지 데이터에서 분석을 통해 도출된 공간 및 행태를 결합하여 공원 내에서도 이용자가 매력을 느끼는 공간을 도출하였다.
2. 연구 방법
본 연구의 대상지는 서울 중심부를 가로지르는 한강과 접한 한강공원을 대상으로, 입지적·공간적 특성이 어우러진 공간에서의 이용 행태 및 매력적 공간의 특성 등이 어떻게 이루어지는지를 이해하고자 한다. 한강공원은 총 11개의 공원이 조성되어 있어, 각 공원이 가지는 공원 이용 행태 및 공간 특성의 차이점과 유사점을 파악하기 위해 4개 공원을 선정하였다. 연구 대상지는 망원한강공원, 반포한강공원, 여의도한강공원, 잠실한강공원으로 선정하였다. 한강공원의 이용자 경험과 인식을 분석하기 위하여 구글맵 리뷰 데이터를 활용하였으며, 연구 대상지는 구글맵 리뷰 데이터가 많으면서 평점이 높은 공원을 대상으로 선정하였다. 이에 따라 여의도한강공원(17,207개), 반포한강공원(7,602개), 망원한강공원(5,186개), 잠실한강공원(4,290개)이 선정되었다. 또한, 한강을 크게 강서대권역, 중심대권역, 강동대권역으로 나누었을 때, 망원한강공원은 강서대권역, 여의도한강공원과 반포한강공원은 중심대권역, 잠실한강공원은 강동대권역에 분포하고 있어, 하나의 권역에 편중되지 않고 연구를 진행할 수 있다고 판단되었다(서울특별시, 2007).
본 연구에서는 Beautiful Soup 4, Selenium 파이썬 패키지를 사용하여 Python web crawler Code를 제작하여 직접 구글맵 리뷰 데이터를 수집하였다. 데이터 수집은 가능한 많은 양을 확보하는 것을 목표로 하였으며, 이를 위하여 리뷰 데이터 정렬 방식을 최신순, 관련도순, 평점 높은 순, 평점 낮은 순으로 변경하면서 진행하였다. 수집한 데이터를 바탕으로 오류 데이터 및 중복 데이터를 삭제하여 활용하였다. 수집한 데이터 중 오류 데이터는 리뷰가 작성되지 않은 경우 즉, 빈칸 처리된 데이터를 의미하며, 중복 데이터는 정렬 방식을 통해 데이터를 수집하였기 때문에, 작성자와 작성 내용이 동일한 리뷰를 의미한다. 공원 내에서의 행태와 특정 공간에 대한 분석을 위해 본 연구에서는 명사만을 대상으로 분석을 진행하였다. 작성자가 해당 공원에서 매력적으로 느낀 순간이라고 볼 수 있는 주관적 인식을 대변하는 이미지 데이터도 함께 수집하였다(심영석과 김홍범, 2016). 따라서, 본 연구에서는 구글맵에서 대상지 공원명을 검색한 후에 작성자, 각 공원의 평가(별점), 작성 날짜, 내용을 포함한 모든 리뷰 텍스트 데이터와 이미지 데이터를 수집했으며, 구글맵 리뷰 데이터의 형태는 그림 1과 같다.
특정 공간에 대한 텍스트 리뷰는 형식의 제약이 없는 자유 형식 작성되고 일상적으로 사용하는 어투를 사용한다(이주경과 손용훈, 2021). 따라서, 텍스트 데이터에 대한 분석을 진행할 때, 유의미한 결과를 도출하기 위해 고유어(defined word), 유의어(thesaurus), 불용어(exception) 사전을 만들어서 작업을 수행했다. 우선 고유어, 유의어, 불용어 사전을 적용하지 않은 원데이터를 불러와 단어와 문단의 구조를 파악하고 각 공원에서 많이 작성된 단어 및 연구에 필요한 이용행태, 시설명, 장소명 등을 중심으로 고유어를 설정하여 추출하였다. 그 후, 띄어쓰기와 유사 단어 등을 고려하여 주요 용어를 바탕으로 유의어 사전(한강라면, 편의점 라면, 한강 라면, 한강편의점라면을 편의점라면으로 통합 등)을 적용하고, 불필요한 단어 및 당연하게 텍스트 데이터에서 출현 빈도가 높을 것으로 예상되는 대상지 공원명 등과 같이 분석에 불필요한 단어를 고려한 불용어 사전(장소, 공간, 시간, 서울 등과 같은 공원 이용 행태 및 특정 공간에 대한 정보가 없는 단어)을 적용하였다.
이미지 데이터는 Google Cloud Vision API를 통해 도출되는 각 이미지에 대한 라벨링과 신뢰도 점수를 활용하였다. 신뢰도 점수가 0.8 이하인 라벨은 이미지의 설명 능력이 떨어진다고 판단하여 분석에서 제외하였고, 유사한 의미를 가진 라벨은 하나의 라벨(Leisure, Recreation, Vacation과 같이 의미적으로 유사한 단어는 Leisure로 통합 / City, Urban Area, Metropolitan Area, Metropolis를 City로 통합)로 통합하여 정제하였다.
텍스트 마이닝은 데이터 마이닝의 한 분야로, 자연어로 구성된 방대한 비정형 텍스트 데이터를 분석하여 유의미한 패턴이나 관계를 발견하는 정량적인 방법이다(김세령 등, 2019). 즉, 정제되지 않은 서로 다른 문서 자원에서 정보를 자동으로 추출하여 기존에는 알려지지 않았던 새로운 정보를 계산적으로 발견하는 것을 의미한다(Yang et al., 2012).
본 연구에서 활용한 텍스트 데이터 분석 기법은 TF-IDF(Term Frequency-Inverse Document Frequency)를 활용하여 단어의 빈도분석(Frequency Analysis)을 진행하였다. 단어의 빈도를 나타내는 TF(Term Frequency)는 특정 단어가 문서 내에 얼마나 자주 등장하는지를 보여주는 값으로, 값이 높으면 문서에서 중요한 단어로 볼 수 있다. 하지만 단어 자체가 문서 집합 내에서 자주 사용되는 경우에는 해당 단어가 흔하게 사용된다는 것을 의미한다. 이것을 문서의 빈도를 나타내는 DF(Document Frequency)라고 하며, 이 값의 역수를 역문서 빈도인 IDF(Inverse Document Frequency)라고 한다. TF-IDF는 TF와 IDF를 곱한 값으로 특정 문서 내에서 단어의 연관성과 중요성을 나타내는 정량적 수치를 의미한다(Aizawa, 2003).
중심성 분석(Centrality Analysis)은 네트워크 안에서 단어 간의 연결 정도를 측정하면서 해당 단어가 얼마나 중심적인 위치를 차지하는지 분석하는 방법이다. 중심성의 종류 중 연결 중심성(Degree Centrality)을 활용하였으며, 연결 중심성(Degree Centrality)은 직접 연결된 인접 단어의 수로 측정하여 이웃한 단어가 많을수록 연결 중심성이 높다고 할 수 있고, 영향력의 크기를 측정하는데 용이한 방법이다(이주경과 손용훈, 2021). 이를 통하여, 텍스트 구조 속에서 어떤 단어가 핵심 개념으로 기능하는지를 파악하였다.
응집성 분석(Cohesion Analysis)은 단어 간의 문맥적 연관성을 기반으로 그룹을 형성하며, 그룹 간 관계를 통해 네트워크의 특징을 분석할 수 있다. 어떤 단어가 그룹을 이루는지, 그룹 내 단어가 얼마나 밀접하게 연관되어 있는지, 그리고 각 그룹의 속성이 무엇인지 파악할 수 있다. 또한 네트워크의 연결 구조를 시각적으로 표현하기에도 적합하다(강욱건 등, 2018). 네트워크 분석은 Networkx 파이썬 패키지를 사용하였으며, 시각화는 Gephi 0.10.1을 활용하였다. 이를 통하여, 단어 간의 관계성을 파악하고 네트워크 구조에 의해 그룹화된 단어를 바탕으로 단순히 개별 공원 이용 행태가 아닌 어떠한 행태 혹은 공간이 연계되어서 이루어지는지를 해석하였다.
이미지 데이터의 경우에는 먼저, Google Vision API를 활용해서 각 이미지에 대한 라벨링 및 신뢰도 점수를 활용하여, K-means 군집분석을 통해 유사한 공간적 특성을 가진 이미지를 그룹화하였다. 이때, 군집의 개수를 설정하기 위하여, Elbow 방법과 Silhouette 방법을 활용하였다. 다음으로, 군집분석 결과를 바탕으로 이미지의 세부 공간적 특성을 질적으로 탐색했다. 이미지의 공간적 특성을 앞선 텍스트 데이터를 통해 도출된 장소 키워드와 통합하여 한강공원을 찾는 이용자의 주요 공간을 도출하였다. Google Cloud Vision API는 구글의 기계 학습 모델을 활용하여 이미지의 내용을 분석하고 이해하는 서비스로 개발자는 애플리케이션에 이미지 레이블링, 얼굴 및 랜드마크 감지, 광학 문자 인식(OCR), 부적절한 콘텐츠 태깅 등 다양한 비전 기능을 손쉽게 통합할 수 있다. 본 연구에는 구글맵 리뷰 데이터에서 수집한 이미지를 이미지 라벨링(Label Detection) 방법을 사용하였으며, 이는 이미지의 콘텐츠를 분석하여 해당하는 라벨(태그)을 반환하고 신뢰도 점수의 경우 식별된 라벨이 해당 이미지에서 얼마나 주요한 부분인지에 따른 가중치 값이다.
3. 연구 결과
표 1은 한강공원 이용자의 이용 행태 및 매력적 공간을 분석하고 파악하기 위해, 구글맵 리뷰 데이터를 바탕으로 단어의 사용 빈도를 파악하고 이 중에서 상위 10개 단어를 도출하였다. 또한, 한강공원이 외국인이 자주 찾는 공간이라는 점을 토대로 구글맵 리뷰의 특성 중 번역된 리뷰인지 아닌지를 파악할 수 있다는 점을 통해 외국인의 인식도 함께 도출하였다. 공원별 전체 데이터 중 외국인 방문객 데이터가 차지하는 비율은 약 10% 정도로 많지는 않았지만 이를 통해 한강공원을 이용하는 외국인 관점에서 어떠한 특성이 주요한 요소로 작용하는지 파악하고자 하였다. 전체 이용자 관점에서 한강공원은 ‘산책’, ‘자전거’, ‘운동’과 같은 주거지 인근의 근린공원 같은 여가 활동이 주요 이용 행태로 나타났지만, 일반적인 근린공원과의 차별점은 ‘돗자리’, ‘텐트’와 같은 물품 대여와 같은 행태에 대한 수요가 나타난다는 점을 파악하였다. 또한, ‘치킨’, ‘맥주’, ‘라면’과 같은 특정 먹거리가 키워드로 도출되었으며, 이와 같은 먹거리를 즐기는 행태가 한강공원을 즐기는 하나의 문화로 자리매김하고 있음을 파악하였다. ‘전망’, ‘야경’, ‘일몰’ 등의 키워드를 통해서 한강공원의 경관적 가치를 파악하였으며, 낮 시간대보다 오후 혹은 저녁 시간대에 이용자가 경험하는 시각적 매력도가 높다는 것을 알 수 있다. 망원한강공원에서는 ‘스타벅스’, 반포한강공원에서는 ‘세빛섬’, ‘무지개분수’와 같이 특정 공간이 키워드로 도출되었지만, 여의도한강공원과 잠실한강공원에서는 특정 공간 키워드는 도출되지 않았다. 외국인 방문객의 리뷰 글에서 도출된 키워드를 분석한 결과, 도출된 상위 10개의 키워드 중 전반 이상이 전체 이용자와 유사하게 나타났다. 이는 외국인 방문객의 경우에도 대중적인 한강공원 이용 행태와 유사하다는 것을 나타낸다. 예를 들어 ‘무지개분수’와 같은 특정 공원에서만 경험할 수 있는 독특한 요소 역시 외국인 방문객에게 주목받고 있음을 확인할 수 있다. 외국인 방문객 리뷰와 전체 이용자 리뷰 간에 도출된 키워드 차이도 존재하였다. 전체 이용자 리뷰에서는 특정 장소나 시설과 관련된 단어가 높은 빈도로 나타났지만 외국인 방문객 리뷰에서는 공원 내에서의 활동과 관련된 키워드가 상대적으로 더 높은 빈도를 보였다. 또한, 외국인 방문객의 경우에는 ‘전망’이라는 키워드가 모든 한강공원에서 공통으로 나타나는 특징을 보인다.
네트워크 분석을 바탕으로 공원별 Clustered Map을 도출하였다. Clustered Map은 연결 중심성 값을 기준으로 설정하였으며, 연결 중심성 값이 높은 단어일수록 노드의 크기는 커진다. 응집성 분석을 함께 수행하여 공원별로 도출된 키워드들의 그룹을 형성하여 해석하였다. Clustered Map의 시각화는 Gephi라는 프로그램을 활용하였으며, 이는 단어 간의 네트워크 분석 및 시각화를 위한 오픈소스 프로그램으로 데이터 시각화에 특화되어있어 본 연구에서는 활용하였다.
그림 2는 망원한강공원의 네트워크 구조로 그룹0은 ‘망원시장’, ‘피크닉’, ‘음식’, ‘친구’ 등을 중심으로 연결망이 형성되어 있다. 공원 내에서 ‘피크닉’을 즐기며 먹거리를 소비와 관련된 단어로 구성되어 있으며, ‘망원시장’의 경우에는 망원한강공원 인근의 주요한 공간으로 공원 이용자가 공원과 연계하여 방문하는 형태로 볼 수 있다. 그룹1은 ‘텐트’, ‘돗자리’, ‘화장실’과 같은 단어가 연관되어 있으며, 한강공원의 경우 텐트 설치 가능 구역에서 해당 장비를 이용한 공원 행태를 파악할 수 있다. ‘화장실’의 경우 관련하여 시설의 쾌적성 및 불편 사항과 관련된 내용이 포함되어 있다. 그룹2와 그룹3은 공통으로 야외에서의 동적인 여가 활동을 나타내는 단어로 구성되었으며, 그룹2는 ‘산책’, ‘스타벅스’, ‘운동’, ‘일몰’과 같이 개인이나 연인 단위에서 선호하는 활동이 나타났다. 반면, 그룹3에서는 ‘자전거’, ‘가족’, ‘놀이터’와 같이 가족 단위의 야외 활동과 관련해서 구성되었다. 그룹4는 이용자가 망원한강공원 방문을 위한 편의시설과 더불어 방문자 유입에 기여할 수 있는 주요 유입 요소와 관련된 단어로 ‘편의점’, ‘성산대교’, ‘야경’, ‘서울함공원’ 등이 나타났다.
그림 3은 반포한강공원의 네트워크 구조로 그룹0은 ‘도깨비야시장’, ‘푸드트럭’, ‘편의점’ 등을 중심으로 그룹이 형성되어 있다. 이는 공원 내에서 방문객이 이용하는 먹거리와 관련한 단어로 이와 연결되어 ‘돗자리’, ‘텐트’, ‘맥주’와 같은 연관 단어가 있다. 그룹1과 그룹2는 반포한강공원 내에서의 볼거리 및 일반적인 행태를 중심으로 나타난다. 그룹1의 경우에는 ‘무지개분수’, ‘반포대교’, ‘조명’, ‘전망’ 등과 같이 시각적인 볼거리와 ‘자전거’, ‘산책’, ‘피크닉’과 같이 일반적인 공원에서의 행태가 혼합하여 나타난다. 이는 반포한강공원에서 ‘무지개분수’는 볼 수 있는 날짜가 정해져 있는 이벤트가 아닌 일상적으로 볼 수 있는 경관으로 인식되면서 일반적인 공원 행태와 연결되어 나타난다고 볼 수 있다. 그룹2는 ‘세빛섬’, ‘잠수교’, ‘행사’, ‘축제’ 등이 묶여서 나타나며, 이는 해당 공간의 경우 기존에 볼 수 없는 특별한 콘텐츠와 관련하여, 경험을 중심으로 한 단어가 나타나는 것으로 볼 수 있다.
그림 4는 여의도한강공원의 네트워크 구조로 그룹0과 그룹1은 유사한 성격을 가진다. 그룹0은 ‘피크닉’을 중심으로 연결성을 보이고 그룹1는 ‘텐트’를 중심으로 연결성을 보인다. 그룹0은 ‘피크닉’, ‘음식’, ‘대여’ 등과 같이 ‘피크닉’이라는 특정 활동을 중심으로 이와 관련한 단어가 연관되어서 나타나며, 그룹1은 ‘텐트’를 중심으로 ‘돗자리’, ‘잔디’, ‘지하철역’ 등과 연결되어 나타나고 있다. 여의도한강공원의 경우 ‘피크닉’ 혹은 ‘텐트’와 잔디밭을 이용하여 머무르고 먹거리를 즐기는 행태가 정체성으로 나타난다고 볼 수 있으며, 공원 방문객이 즐기는 중요한 활동으로 볼 수 있다. 그룹2는 ‘자전거’, ‘산책’, ‘달리기’와 같은 동적인 신체 활동과 ‘감상’, ‘휴식’ 등의 정적인 행태가 혼재되어 공원에서 일반적으로 나타나는 행태로 그룹이 형성된다. 그룹3은 ‘편의점라면’, ‘편의점’, ‘이랜드크루즈’ 등이 그룹으로 형성되는데 이는 여의도한강공원에 여러 편의점이 있지만 ‘이랜드크루즈’라는 특정 공간의 편의점 이용과 함께 그 주변에서 ‘버스킹’, ‘공연’을 즐기는 활동이 같이 그룹으로 나타난다.
그림 5는 잠실한강공원의 네트워크 구조로 그룹0과 그룹1은 경관적 측면에서 ‘잠실대교’, ‘드론쇼’, ‘하늘’, ‘사진’ 등과 같은 잠실한강공원에서 주변 경관을 감상할 수 있는 요소와 관련된 키워드가 나타났으며, ‘벌레’, ‘코로나’, ‘공사’ 등과 같은 경관을 즐기는 행위에 방해되는 요소가 함께 도출되었다. 그룹2에서는 ‘산책’, ‘운동’, ‘전망’ 등과 같이 야외 공간에서 이루어지는 동적인 활동으로 ‘전망’의 앞선 그룹0과 그룹1과는 다르게 특정 시설 및 이벤트에 대한 시각적 인식이 아닌 활동 중에 보여지는 풍경 및 경관과 연계되어 나타난다고 볼 수 있다. 그룹3은 연인과 가족 단위에서 함께 즐길 수 있는 야외 활동으로 ‘자전거’, ‘편의점’, ‘가족’, ‘아이’, ‘데이트’ 등의 키워드가 연계되어서 나타났다. 그룹4는 ‘텐트’, ‘피크닉’, ‘일몰’, ‘감상’ 등과 같이 잔디마당이라는 특정 공간에서의 정적인 활동 중심의 단어로 구성되어 있다.
매력적 공간은 이용자의 공간 방문 경험을 바탕으로 인식하거나 시각적으로 표현하는 공간으로, 다수의 방문자가 동일한 공간에 대해서 반복적으로 언급하거나 시각적 내용물(사진, 동영상 등)을 공유하는 행위를 통해 발현될 수 있다고 판단된다(Zhou & Zhang, 2016). 매력적 공간 도출을 위하여, 빈도분석을 기준으로 대상지 내의 공간과 관련한 단어를 추출하고 구글맵 리뷰에서 이미지 데이터를 추출하여 Google Cloud Vision API를 활용한 결과를 비교 분석하여, 공통으로 언급되고 있는 공간을 이용자가 느끼는 매력적인 공간으로 정의하여 분석을 진행하였다. 이는 텍스트 데이터의 경우에는 경험에 의한 서술 형식의 데이터이고 이미지 데이터의 경우 이용자가 공간을 인식하고 이를 매력적으로 판단하여 업로드하는 데이터이기 때문에 두 가지 데이터에서 중첩되는 공간을 중심으로 분석하였다. 이를 통하여, 텍스트만으로는 파악하기 힘든 공간의 구체적인 장면을 이미지로 보완하고, 이미지로는 알기 어려운 특정 공간의 이용 패턴을 텍스트를 통해 분석함으로써 상호 보완할 수 있다. 텍스트 데이터와 이미지 데이터를 결합하는 경우 공간에 대한 이용자 경험과 인식을 보다 포괄적으로 이해할 수 있다(Liu et al., 2023). 예를 들어, 텍스트 분석을 통해 망원시장과 같은 주변 공간이 한강공원과 연계되어 이용하고 있음을 확인하였으나, 이미지 데이터에서는 해당 장소와 관련된 사진이 나타나지 않았다. 이는 이용자가 한강공원을 이용하며 ‘망원시장’과 같은 주변 공간을 경험하지만, ‘망원시장’의 경우 망원한강공원에서 시각적 연결성이 떨어지기 때문에 사진 촬영이 어려워서 독립된 다른 공간으로 인식한다고 해석할 수 있다. 반대로, 이미지 데이터에서만 도출된 공간 중 아이서울유와 같은 시설물은 분석에서 제외하였다. 이는 한강공원의 주요 행태 및 매력적 공간 도출에 초점을 두어 실제로 공간의 이용 및 사진을 촬영하는 공간을 중심으로 분석하였다.
표 2는 대상 공원별 텍스트 데이터에서 도출된 공간 키워드의 빈도와 이미지 데이터에서 도출된 공간 사진의 데이터 수를 분석한 것이다. 공원 내에서의 매력적 공간을 파악하기 위해 공통으로 언급되는 공간을 중심으로 연구를 진행하였다.
그림 6과 그림 7은 공원별 매력적 공간의 위치를 맵핑한 것이다. 또한, 공원별 매력적 공간에서 촬영된 이미지 데이터 일부와 공간에 대한 키워드 중 연결 중심성 상위 10개 키워드 그리고 Google Cloud Vision API를 활용하여 이미지 라벨링을 자동화하여 도출된 결과 중 신뢰도 점수 상위 키워드이다. Google Cloud Vision API의 경우 영어로 라벨링을 실행하기 때문에 유사한 의미를 가진 라벨의 경우에는 하나의 단어로 결합하여 분석하였다.
망원한강공원의 경우 성산대교와 그늘막 등을 설치할 수 있는 텐트 허용 구간(잔디 공간)과 같이 한강공원 전반에서 공통으로 나타나는 공간과 스타벅스, 서울함공원과 같이 망원한강공원에서만 나타나는 고유한 공간이 구분되어 나타났다. 특히, 망원한강공원에서는 스타벅스와 같이 특정 브랜드 공간에 대한 이용이 두드러지며, 과거 군함을 공원의 테마로 활용한 서울함공원을 통해 다른 한강공원과의 차별성을 가지고 있다. 공간과 연결된 키워드와 이미지 라벨링 결과에서는 성산대교, 스타벅스의 경우에는 야경과 일몰과 같은 경관적 부분이 동시에 나타났으며, 텐트 허용 구간에서는 피크닉과 같은 특정 공간에서만 허용되는 활동이 나타났다. 서울함공원의 경우에는 여가, 아이가 공통으로 나타났는데 이는 서울함공원을 찾는 주 이용자는 아이와 동반한 가족 단위라는 것을 알 수 있다.
반포한강공원의 경우에도 반포대교와 텐트 등 그늘막을 설치할 수 있는 텐트 허용 구간(잔디 공간)과 같은 공통적인 공간과 무지개분수, 세빛섬, 서래섬, 야시장 등 반포한강공원에서만 볼 수 있는 특정 공간이 분리되어 나타났다. 반포대교와 텐트 허용 구간의 경우 대부분의 한강공원과 유사하게 야경, 피크닉이 공간 키워드와의 연결 중심성과 이미지 라벨링에서 공통적인 단어로 나타났다. 반면, 서래섬, 세빛섬, 무지개분수, 야시장의 경우에는 모든 공원에서 공통으로 나타나는 공간이 아닌 반포한강공원만의 특징으로 볼 수 있다. 그중에서도 서래섬은 공간 키워드와의 연결 중심성과 이미지 라벨링 결과에서 공통으로 나타나는 단어는 나타나지 않았으며, 세빛섬과 무지개분수의 경우에는 야경과 조명 등 경관적 측면과 축제, 공연과 같은 이벤트적인 측면이 부각되어서 나타났다. 야시장의 경우에는 야시장 특성상 야경, 푸드트럭, 음식과 같은 단어가 공통으로 나타났다.
여의도한강공원의 경우 마포대교, 텐트 허용 구간이 다른 한강공원과 같이 나타났으며, 더현대서울, 야시장, 이랜드크루즈와 같은 여의도한강공원만의 공간이 분리되어 나타났다. 마포대교와 텐트 허용 구간의 경우 다른 한강공원과 마찬가지로 야경, 잔디, 나무와 같은 단어가 나타났으며, 더현대서울의 경우 여의도한강공원에서 볼 수 있는 랜드마크의 속성을 가지는 장소로 피사체를 촬영하는 것을 목적으로 활용되었다고 볼 수 있다. 하지만, 텍스트 데이터와 이미지 데이터에서 동시에 나타나는 이유는 여의도한강공원 이용자 중 일부는 공원 외부 공간인 더현대서울을 공원과 연계하여 경험하고 인식한다는 것을 의미한다. 야시장의 경우에는 앞선 반포한강공원과 동일하게 푸드트럭, 음식과 같은 단어가 나타났으며, 이랜드크루즈의 경우에는 야경과 함께 공연 및 버스킹이 공통 단어로 나타났다. 이랜드크루즈의 경우 크루즈 선착장으로 활용되고 있지만, 선착장 앞에서 공연 및 버스킹이 빈번하게 열리고 있어서 동일한 공간이지만 다양한 역할을 수행하는 공간으로 볼 수 있다.
마지막으로 잠실한강공원의 경우에는 상대적으로 다른 한강공원에 비해 사진의 수는 적지만, 잠실대교와 텐트 허용 구간은 다른 한강공원과 마찬가지로 나타났다. 앞선 여의도한강공원과 같이 이랜드크루즈가 매력적 공간으로 도출되었지만 키워드 연결 중심성과 라벨링 결과에서 차이가 나타났다. 잠실한강공원의 경우에는 배, 보트와 같은 시설물에 대한 단어가 나타났는데, 이는 여의도한강공원의 경우에는 이랜드크루즈 앞에 광장과 같이 넓은 공간에서 공연 및 버스킹이 이루어진다면, 잠실한강공원의 경우에는 이와 반대로 상대적으로 이랜드크루즈 앞에 공간이 좁고 특별한 활동을 하기에는 협소하여, 동일한 공간이지만 주변 여건에 따라 이용자의 이용 행태가 조금은 다르다는 것을 알 수 있다. 물놀이장의 경우에는 잠실한강공원에서만 나타나는 공간으로 아이, 운동과 같은 단어가 공통으로 나타나는 것으로 보아 여름철 아이를 위한 공간으로 활용되고 있음을 알 수 있다. 롯데타워의 경우에는 여의도한강공원에서 더현대서울이 도출된 것과 동일하게 잠실한강공원에서 랜드마크의 속성을 가진 경관 요소로 인식하고 있다.
4. 결론
본 연구는 구글맵 리뷰를 활용하여, 망원한강공원, 반포한강공원, 여의도한강공원, 잠실한강공원에 대한 이용자 인식과 공원 내 공간의 매력도를 파악하였다. 텍스트 데이터를 바탕으로 빈도분석과 단어 간의 중심성 분석 및 네트워크 분석을 실시하였다. 이를 통하여, 한강공원 내에서 이용자의 주요 행태를 파악하였으며, 주요 행태 및 공간 간의 관계성을 도출하였다. 공원 내에서도 매력도가 높은 공간을 파악하기 위하여, 텍스트와 이미지 데이터를 결합하여 분석을 진행하였다. 이를 통하여, 공원 이용자가 어떤 공간을 주로 이용하는지 해당 공간에서 어떤 행태가 이루어지는지 파악하였다.
구글맵 리뷰 텍스트마이닝을 통하여 한강공원에 대한 이용자의 주요 행태 키워드 및 외국인 리뷰에서 나타나는 주요 키워드를 추출하였다. 이를 통해 기존의 다른 플랫폼을 통해서 파악하기 어려운 외국인 방문객의 한강공원 이용 행태를 파악할 수 있었다. 외국인 방문객과 전체 방문자와 한강공원에서의 경험이 유사한 측면이 많지만, 활동 중심의 키워드가 두드러진다는 점에서 외국인 방문객의 관점에서 한강공원 이용 경험에 대한 차별적 특성을 확인할 수 있다. 이는 외국인 방문객은 한강공원 내에서의 활동에 집중하는 경향이 있으며, 시설 및 공간 자체보다는 공원을 활용하는 방식과 경험을 더 중요하게 여긴다는고 볼 수 있다. 또한, 외국인 리뷰 데이터에서 4개의 공원에서 ‘전망’이라는 키워드가 공통으로 도출되었는데, 이는 한강이라는 다른 도시에서 보기 힘든 하천의 공간적 스케일이 주는 경관적 측면이 외국인 방문객에게 매력적인 요소로 작용하고 있다고 볼 수 있다.
연결 중심성 값을 기반으로 네트워크 분석 결과, 모든 공원에서 공통으로 ‘자전거’, ‘운동’, ‘산책등’과 같은 여가 활동과 ‘라면’, ‘치킨’, ‘편의점’과 같이 먹거리 관련 단어가 그룹으로 묶여서 도출되었으며, 반포한강공원을 제외한 공원에서는 ’텐트’, ‘대여’, ‘돗자리’와 같은 단어가 그룹으로 도출되었다. 이는 전반적인 한강공원에서 이루어지는 활동이 유사한 점을 가진다는 것을 의미하지만, 공원별로 특색 있는 공간 혹은 이벤트 요소에서 차별성을 나타낸다. 망원한강공원은 ‘스타벅스’, 반포한강공원은 ‘무지개분수’, 여의도한강공원은 ‘불꽃·벚꽃 축제’, 잠실한강공원은 ‘드론쇼’, ‘수영장’이 대표적인 예시이다. 따라서 개별 공원에서 나타나는 차별성은, 한강공원이라는 동일한 공간적 범주 안에서 각 공원이 지닌 고유한 특성으로 해석될 수 있다. 이러한 특성은 이용자의 방문 동기와 목적성에 따라 공원 선택에 영향을 미치는 요인이 될 수 있으며, 동일한 한강공원 체계 내에서도 이용자의 수요에 따른 공원 선택을 유도할 수 있다. 실제로 망원, 반포, 여의도, 잠실한강공원은 각각 상이한 공간적 매력 요소를 지니고 있으며, 이는 이용자 인식 및 이용 행태에 있어 공원 간 차별성을 발생시키는 주요 요인으로 작용할 수 있다.
한강공원의 포괄적인 이용 공간을 파악하기 위하여, 이미지 데이터와 텍스트 데이터를 통해 도출된 한강공원의 매력적인 공통된 공간으로는 각 공원에서 볼 수 있는 주요 다리인 ‘성산대교’, ‘반포대교’, ‘마포대교’, ‘잠실대교’가 나타났으며, 주로 야경, 일몰을 한강과 함께 조망하는 것으로 나타난다. 공원별 대표적으로 나타나는 다리는 공원 외부에 위치하여 있지만, 이용자의 인식 및 경험에서는 공원 내의 공간으로 나타나고 있음을 시사한다. 또한 모든 한강공원에서 공통으로 나타나는 공간인 ‘텐트 허용 구간’은 주로 피크닉, 음식을 즐기기 위해 찾는 공간으로 활용되고 있다. 다리와 텐트 설치가 가능한 잔디밭이 한강공원의 대표적인 공간이라는 것을 의미한다. 한강공원에는 공통으로 나타나는 공간 외에 특정 공원에서만 나타나는 공간도 존재한다. 이는 한강공원의 경우 한강변에 위치한다는 동일한 지리적 특성을 보이고 있지만, 개별 공원이 가지고 있는 공원 내의 매력도, 이용자의 공원을 이용하는 방식에서 차이가 나타나는 것을 확인하였다.
이러한 결론을 바탕으로, 본 연구의 시사점은 연구의 대상지가 되었던 네 곳의 한강공원의 공통된 인식과 행태를 파악하는 동시에 공원별 차별화된 특성과 행태를 도출하였다. 여가, 휴식, 경관 감상 등 공통된 행태를 통해 한강공원이 사람에게 보편적인 도시 여가 공간으로 자리 잡고 있음을 확인하였다. 반면, 공원별 차별성 도출을 통하여 한강공원이 이용자에게 모두 동일하게 인식되고 이용되는 것을 확인하였다. 이를 통하여 공원별 특화된 프로그램과 공간 기획의 필요성을 제시하는 근거를 제공하였다. 이는 공원의 독창성을 제공할 수 있으며, 서울의 주요한 녹지 거점으로써 이용자에게 다양한 녹지 서비스를 제공할 수 있는 공간으로 활용할 수 있다. 또한, 망원한강공원과 여의도한강공원과 같이 주변의 다른 공간과의 연계를 기대할 수 있다. 망원한강공원의 경우 텍스트 데이터를 통해 도출된 ‘망원시장’, 여의도한강공원의 경우 이미지 데이터를 통해 도출된 ‘더현대서울’와 같이 주변 상업시설과의 활용적 연계는 공원이 복합 여가 시설로서 가치가 높다는 것을 보여주며, 이를 바탕으로 공원과 상업시설 간의 상호보완적 관계를 강화하고 접근성 개선을 통해 이용자의 만족도를 높이며 지역 경제를 활성화하는 방향으로 정책과 전략을 수립할 필요가 있다. 기존의 서울숲이 성수동과 경의선숲길이 연남동과 연계되고 활용되는 것과 같이 한강공원의 경우에도 유사한 특징을 보이고 있으며, 이를 적극적으로 활용할 수 있는 계획이 요구된다.
본 연구의 한계점은 구글맵 리뷰는 국내에서 보편적으로 활용하지 않고 있으며, 다른 포털사이트를 활용하는 경우가 많기 때문에 상대적으로 리뷰의 수가 많은 한강공원을 대상으로 연구를 진행하였다. 따라서, 특정 한강공원이 아닌 한강공원의 전반적인 행태 및 매력적인 공간을 파악하기 위해서는 국내에서 활용도가 높은 포털사이트를 이용할 필요가 있다. 하지만 구글맵 리뷰의 경우에도 데이터가 축적된다면, 구글맵 리뷰가 가지고 있는 외국인 데이터 분류 등의 장점을 활용한 한강공원의 이미지 및 이용자 인식 등을 파악하기에는 적절하다고 생각한다. 또한, 구글맵 리뷰의 경우 작성자의 연령 등의 정보가 제공되지 않기 때문에 데이터가 특정 계층에 편중될 수 있다는 한계를 가지고 있다. 마지막으로, 소셜미디어 데이터의 경우 작성자의 기억에 의존하여 작성되기 때문에 기억이 왜곡될 수 있다. 따라서, 연구자의 객관적인 시각이 요구되며, 주의 깊은 해석이 필요하다.
본 연구에서 확인된 구글맵 리뷰 데이터의 한계를 보완하기 위해, 국내 주요 포털사이트인 네이버 리뷰와의 비교 분석이 요구된다. 아울러 한강공원 이용자에 대한 설문조사를 실시하여 연령, 이용 동기, 방문 경험 등 플랫폼 기반 데이터에서 확인할 수 없는 정보를 통합적으로 분석하는 후속 연구가 필요하다.