1. 서론
인간과 자연환경의 상호작용을 이해하는 것은 생태계 보전을 가능하게 할 뿐만 아니라 인간의 삶의 질을 높이고, 지속가능한 보전 방향을 모색하는데 중요한 역할을 한다(Bennett et al., 2017). 특히 산림 및 자연자원은 생물다양성 보존과 기후변화를 완화할 뿐만 아니라(FAO, 2020), 생태계서비스에서 물질적 혜택과 비물질적 혜택을 제공하는 등 육지 생태계에서 중요한 역할을 수행한다(MEA, 2005).
이와 같은 녹지공간의 가치는 이용자의 활동 및 이용패턴 등에 따라 민감하게 반영되기 때문에(Yu et al., 2019), 이용자의 관심과 선호도를 이해하는 것이 지속 가능한 녹지공간 개발 및 활성화에 필수적이다(Plieninger et al., 2015;Knoke et al., 2021). 따라서 산림 및 녹지공간을 평가하고 관리하기 위해서는 생태‧물리학적 데이터뿐만 아니라 실제 공간을 사용하는 이용자 참여 데이터를 활용할 필요가 있다.
이용자의 의견 및 선호도를 조사하는 전통적인 방법으로는 설문조사, 인터뷰, 현장평가 등이 있다. 그러나 이와 같은 방법으로 수행되는 평가는 일반적으로 시간적, 비용적 측면에서 많은 비용이 요구되며(Plieninger et al., 2013; Waldron et al., 2013; Sinclair et al., 2020), 시공간적 스케일에서의 조사결과를 도출하기 어렵다(Gosal et al., 2019).
이러한 기존 조사방법의 어려움을 보완하는 방법 중 하나로 소셜미디어 데이터를 활용하고 있다. 소셜미디어 데이터에는 위치정보, 사진, 텍스트 및 기타 메타데이터가 포함될 수 있다(Toivonen et al., 2019; Zhang and Li, 2019; Schirpke et al., 2021). 이러한 속성정보들은 방문객들의 선호도, 행동패턴 및 경험에 대한 풍요로운 지식을 제공할 수 있으며, 넓은 지역에 대한 방문객의 인식을 파악할 수 있는 유용한 데이터이다. 이렇듯 소셜미디어 데이터는 경관평가 및 문화서비스 분석 등 다양한 측면에서 대중의 인식을 파악하는 자료로서 입증되었으며, 현재까지 소셜미디어의 다양한 데이터를 활용한 연구들이 수행되고 있다(Dunkel, 2015; van Zanten et al., 2016; Tenerelli et al., 2016; Hausmann et al., 2017; Fisher et al., 2018; Cheng et al., 2019; Wood et al., 2020). 따라서 많은 대중이 이용하고 있는 소셜미디어에서 해당 녹지 또는 지역을 이용하는 이용자들이 얼마나 관심을 갖고 있는지, 그리고 방문 후에 어떤 견해를 갖고 있는지 살펴보아야 한다.
특히 블로그 데이터는 일반적으로 텍스트로 작성되는 소셜미디어 데이터이며 사용자가 특정 주제에 대하여 자유롭게 서술하고 있어, 작성된 글을 통해 이용자의 인식을 파악하는 데 효과적인 데이터이다(Lee and Son, 2018; Lee and Son, 2021).
다만 소셜미디어에서 나타나는 인식 및 견해는 일부 특정 연령층의 의견이 지배적일 수 있다는 우려도 있었으나, 최근 다양한 연령층이 폭넓게 이용한다는 결과가 나오기도 하였다(Lee and Son, 2021). 또한 선행연구들을 통해 각 공간 및 장소에 대한 소셜미디어 데이터가 실제 이용자 또는 방문객 통계와 일정 수준 일치하는 결과를 확인하였다(Sonter et al., 2016; Donahue et al., 2018; Kim and Son, 2021). 따라서 소셜미디어에 나타난 이용자의 인식이 대중의 인식을 일정 부분은 대변 가능하다고 볼 수 있다.
최근에는 이와 같은 특징을 활용하여 소셜미디어 데이터를 기반으로 지도화 등의 정량적인 연구 결과를 도출하고자 하는 노력이 이어지고 있다(Ghermandi and Sinclair, 2019; Wood et al., 2020; Kim and Son, 2021). 소셜미디어 데이터를 객관적이고 정량화된 결과물로 도출한다면, 기존의 생태‧생물학적 데이터와 함께 공간분석 및 평가 지표로서 활용가능하다.
이에 본 연구에서는 수도권에 위치하고 있는 보전지역 및 자연자원을 대상으로 하여, 작성된 블로그 데이터를 활용하여 이용자들에게 인지되는 자연자원을 도출하고자 하였다. 이를 통해 각 장소별 이용자의 분포를 살펴보고, 관심 정도를 지표로 활용하여 평가하고 그 특성을 도출하고자 하였다.
2. 연구의 범위 및 방법
본 연구는 수도권(서울‧경기‧인천)에 위치하고 있는 보전지역과 자연자원의 일부이면서 사람들의 이용이 활발한 도시공원을 대상으로 연구를 수행하였다. 이에 한국보호지역 통합 DB인 KDPA(Korean Database on Protected Area)와 각 지자체에서 제공하는 보전지역과 도시공원 리스트를 연구 대상으로 설정하였다. KDPA에 따르면 2021년 기준 현재 전국 보호지역은 국립공원, 도립공원, 명승, 시‧도 생태경관보전지역, 천연기념물, 야생생물보호구역, 경관보호구역 등 33유형의 3,439개이며, 전체 면적으로는 중복 면적을 제외하여 총 16,904km2이다. 이 중 수도권에 위치한 보전지역은 총 348개이며, 이곳을 분석 대상지로 연구를 수행하였다.
도시공원 데이터는 공공데이터 포털에서 제공하는 전국 도시공원 정보 표준데이터를 활용하였으며, 누락된 부분에 대해서는 각 지자체에서 제공하는 도시공원 데이터 파일을 참고하여 수정 및 추가하였다. 그 결과 수도권에 위치한 공원은 총 1,987개이며, 이를 분석 대상으로 선정하였다.
본 연구에서는 자연환경에서 사람들이 인지하고 경험한 내용을 바탕으로 작성된 소셜미디어 블로그 데이터를 활용하여 보전지역 및 자연자원에 대하여 얼마나 인지하고 있는지 살펴보고자 하였다. 연구방법은 다음과 같다.
본 연구에서는 수도권(서울‧경기‧인천)지역의 보전지역 및 도시공원 리스트를 활용하였으며, 분석에 앞서 수집된 리스트 중 도면화 및 평가 가능한 대상을 구별하는 과정을 수행하였다. 이 과정에서 천연기념물 중 공간으로 이루어진 것이 아닌 특정 수목이나 대상을 지칭할 경우와 수원함양보호구역 등의 광범위한 지역을 전체적으로 포함할 경우 등 분석이 어려운 대상은 제외하였다.
또한 본 연구에서는 보전지역 및 자연자원에 대한 블로그 게시물 빈도값을 활용하여 연구를 수행하기 때문에, 위의 조건에는 부합하지만 각 공간에 대하여 작성된 블로그 게시물이 없는 곳에 대해서도 분석 대상에서 제외하였다.
사찰, 계곡부 등 보전지역에 해당되는 곳이 산림의 일부분일 경우에는 보전지역이 위치하고 있는 전체 산림을 분석 대상으로 설정하여 포함하였다.
주요 공원녹지를 포함한 자연자원에 대해서는 많은 사람들이 이용 가능한 일정 크기(10ha) 이상의 공원을 포함하도록 필터링하였다. 그 이유는 어느 정도의 규모를 가진 공원에서 사람들의 다양한 행태가 일어날 것이고 사람들에게 인지될 확률이 높을 것으로 판단하였기 때문이다. 따라서 소공원과 어린이공원은 제외하고 근린공원 이상의 규모를 대상으로 하였다. 또한 공원부지가 산림에 포함되어 있을 경우에는 공간적 범위가 더 넓은 산림으로 치환하였다.
분석 대상에 대한 폴리곤은 기본적으로 KDPA에서 제공하는 폴리곤을 기준으로 작성하였으나, 누락되거나 지도에 맞지 않게 작성된 폴리곤을 확인하였다. 이에 대해서는 토지이용현황도와 위성지도를 활용하여 수정 및 추가하였다. 도시공원 폴리곤의 경우에는, 대부분 점 데이터로 공원의 위치만 표시되어 있어서 새로 작성하는 단계가 필요하였다. 따라서 앞서 보전지역 폴리곤 작성과 마찬가지로 각 지자체에서 제공하는 공원 폴리곤 데이터와 연속수치지형도, 토지이용현황도 및 위성지도를 기반으로 하여 도출하였다.
도출된 보전지역 및 도시공원에 대하여 블랙키위(blackkiwi)를 활용하여 각 장소에 대한 경험 인지값으로 도출하였다. 블랙키위는 빅데이터 기반 키워드 분석 플랫폼으로 검색량, 콘텐츠 발행량 및 연관키워드 등의 정보를 제공하고 있는 트렌드 분석 플랫폼이다. 해당 사이트의 월 방문자 수가 30만 명에 이르며, 검색엔진에서 특정 키워드와 관련되는 데이터를 수집 및 분석하여 마케팅 등에 활용할 수 있는 인사이트를 제공하는 데이터 서비스이다(http://www.dt.co.kr/contents.html?article_no=2022012302109970821001&ref=naver, 2022.07.25.).
이를 통해 사람들이 관련 검색어에 대하여 얼마나 많은 게시물을 작성했는지 파악할 수 있다. 해당 플랫폼에서 제공하는 데이터가 아직까지 학술적으로 활용된 적은 없으나, 앞으로 소셜미디어 데이터 수치를 활용하여 정량적 지표로서 평가할 때 유의미한 자료가 될 것으로 기대할 수 있다.
블랙키위는 플랫폼 특성상 2016년 1월 1일을 기점으로 데이터 수집이 시작되었기 때문에 네이버에서 이전부터 검색되거나 기록된 데이터라도 2016년 1월 1일 이후에 작성된 데이터의 수를 보여주고 있다. 따라서 본 연구에서는 2016년부터 키워드 검색 시점까지의 전체 누적 콘텐츠 발행량을 데이터로 활용하였으며, 본 연구에서 활용한 데이터 수치는 2021년 11월 4일에 검색된 결과이다. 이를 통해 각 보전지역 및 도시공원에 대하여 사람들이 얼마나 인지하고 경험했는지 정도를 파악하고, 해당 값을 가중치로 적용하여 평가하고자 하였다.
수집된 장소별 누적 콘텐츠 발행량은 데이터의 편차가 크기 때문에 표준화하는 단계를 수행하였다. 따라서 누적 콘텐츠 발행량에 대하여 로그(Log) 변환을 수행했으며, 이를 가중치값으로써 분석에 활용하였다. 이는 데이터의 정규분포를 형성하고 모든 변수가 동일한 가중치를 갖도록 하며, 분석에서 결과 및 해석의 신뢰도를 향상시키기 위함이다(Güler et al., 2002; Wang et al., 2015).
도출된 보전지역 및 도시공원의 인지적 경험 가중치를 적용하여 수도권 지역에서의 보전지역 및 도시공원을 평가하고자 하였다.
이를 위해서 수도권 전역에 대하여 250 * 250m 그리드로 변환하였다. 이후 각 그리드에 앞서 도출한 로그(Log) 변환 가중치를 적용하였다. 적용된 가중치는 수도권 전체 그리드에서 10단계로 구분하여 분석 대상별 이용자 인지 정도를 파악하는데 활용되었으며, 인지적 경험이 높은 장소와 낮은 장소의 분포를 살펴보았다.
마지막으로 높게 인지되는 곳들에 대하여 이용자가 작성한 블로그 원문을 함께 살펴봄으로써, 보전지역 및 도시공원 중 인지적 경험이 높은 곳들의 주된 이유 및 특징을 도출하고 해석하였다.
본 연구에서는 이용자에게 인지되는 보전지역 및 도시공원 폴리곤 도출과 인지값 도면화를 위하여 Qgis 3.16.4를 사용하여 분석을 수행하였다.
3. 연구결과
수도권에 위치하고 있는 보전지역 348개, 도시공원 1,987개 중 연구에 활용 가능한 대상지에 대하여 앞서 수행한 데이터 정제 과정을 거친 결과, 보전지역은 61곳, 도시공원은 서울 74곳, 경기 202곳, 인천 38곳으로 총 312곳이 분석 대상으로 선정되었다(Figure 1 참조).
보전지역 중 제외된 곳들은 양평 용문사 은행나무, 이천 신대리 백송, 서포리 소나무림 등과 같이 하나의 대상이나 군락을 이루고 있는 천연기념물 또는 산림유전자원보호구역이거나, 야생생물보호구역, 시‧도 생태경관보전지역, 수원함양보호구역 등 넓은 지역에 걸쳐 있어서 블로그 검색 키워드에 부합하지 않은 곳들이 주를 이루고 있었다.
이와 같은 장소 및 구역을 제외하고 도출된 보전지역 및 도시공원은 단일 대상이 아닌 일정 수준 이상의 공간적 규모를 가지며 각각의 공간 안에서 이용자들의 다양한 행태가 일어날 수 있는 곳이다. 따라서 본 연구에서는 선정된 대상지에 대하여 블로그에 얼마나 많은 게시물이 작성되었는지 검토하여, 이용자가 경험하고 주로 인지하는 장소가 어디인지 살펴보았다.
각 장소에 대한 블로그 누적 콘텐츠 발행량을 통해 보전지역 및 도시공원의 실제 이용자가 인지하는 장소를 도출하였으며, 그 결과는 Table 1, 2와 같다.
보전지역에 대하여 가장 많은 블로그 게시물이 작성된 장소는 남산으로 총 1,480,000건이며, 북한산(778,000건), 관악산(335,000건), 남한산성‧남한산(325,000건), 청계산(230,000건), 수락산(222,000건) 순으로 나타났다.
분석 대상으로 선정된 보전지역에는 무의도, 광릉크낙새서식지(광릉수목원), 서오릉, 창덕궁 후원, 청평호, 시흥 갯벌 등 다양한 자원이 포함되어 있지만, 대중에게 가장 많이 인지되고 있는 곳은 산림이었다. 분석 결과에서도 볼
수 있듯이 전체 보전지역 중 상위 10% 이상이 산림으로 나타났으며, 누적 블로그 게시물 수에서도 산림 외의 장소들과 상당한 차이를 보이고 있었다.
도시공원의 경우에는 경복궁이 866,000건으로 가장 많은 블로그 게시물이 작성되었으며, 이후로는 올림픽공원(490,000건), 여의도공원(437,000건), 서울숲(434,000건), 석촌호수(349,000건), 오이도(344,000건) 순으로 블로그 누적 데이터가 높은 것으로 나타났다.
도시공원에 대해서는 묘지공원, 문화공원, 역사공원, 수변공원 등 다양한 공원들이 사람들에게 주요 장소로서 인식되고 있는 것으로 나타났다. 특히 석촌호수, 일산호수공원, 광교호수공원, 서울 탄천, 물왕저수지 등 녹지공간과 수변공간이 함께 조성된 수변공원에 대하여 이용자들은 주요 장소로 인식하고 있었다. 이러한 공원들은 외부인 및 관광객이 이곳을 목적지로 하여 방문하는 경우도 있지만, 지역 주민들에게 접근성이 높고 언제든 편하게 이용 가능한 장소로서 더욱 크게 인지되고 있으며, 이러한 내용은 ‘드라이브’, ‘피크닉’, ‘산책하기 좋은 곳’, ‘운동’, ‘야경’ 등 블로그 원문에서 주요 키워드로 등장함으로써 알 수 있었다.
또한 사람들이 인지하는 주요 장소에는 조성 시기, 대중성 등의 요인과 관계없이 새로운, 그리고 공원 조성이 비교적 오래되지 않은 곳들이 나타나기도 하였다. 그 예로 서울식물원은 2019년 5월에 개장하여 약 3년밖에 되지 않았음에도 불구하고, 이에 대한 블로그 게시물이 167,000건에 달하고 있었다. 송도 센트럴파크도 이와 마찬가지로 경희궁, 낙산공원, 선정릉 등 오랜 시간 역사성을 지닌 다른 공원들에 비해 조성된 지 얼마 되지 않았음에도 많은 수의 블로그 게시물이 작성되었으며, 이용자에게 주로 인지되는 공원으로 나타났다. 이러한 장소들은 ‘나들이’, ‘데이트’, ‘가볼 만한 곳’, ‘핫플레이스’, ‘추천’ 등의 키워드와 함께 작성되고 있으며, 사람들이 해당 공간에서 다양한 경험을 하고 경관을 향유하는 장소임을 보여주고 있다.
본 연구에서는 2016년 이후 블로그 누적 게시물 수에 따른 이용자에게 인지되는 주요 자연자원을 파악하고, 이를 인지적 경험 지표로 설정하여 평가하고자 하였다. 이를 위해 앞서 수집한 보전지역 및 도시공원에 대한 누적된 블로그 수에 대하여 로그(Log) 변환하고 이를 가중치로 적용하였다(Table 1, 2 참조). 이후 전체 분석 대상을 10단계로 구분하여 도면화하였다(Figure 2 참조).
전체적인 분포양상을 보면 서울을 중심으로 경기 북부지역, 인천지역 등 주로 서울과 인접한 곳에 밀집하여 분포하고 있으며, 경기 남부지역에는 상대적으로 적게 분포하는 것을 확인하였다.
인지값에 대하여 10단계로 평가한 결과에서는, 가장 높은 인지값을 가진 그룹에 해당되는 곳은 남산(6.170), 경복궁(5.938), 북한산국립공원(5.891), 올림픽공원(5.692), 여의도공원(5.640)이고, 두 번째 그룹에는 서울숲(5.637), 석촌호수(5.545), 관악산‧남한산성(5.525), 어린이대공원(5.521), 창덕궁(5.407) 등이 포함되어 있다. 주로 서울에 위치한 산림과 공원이 인지성이 높은 것으로 나타났으며, 이는 자연자원에 대한 접근성이나 거주 환경에 따른 자연에 대한 수요가 달랐을 것으로 볼 수 있다. 남산, 북한산국립공원, 여의도공원 등 서울 내에 위치하고 있는 산림과 도시공원들은 자연자원으로서, 그리고 하나의 관광지로서 인지되고 있으며, 산책로 및 등산로와 같은 접근성이 높은 특징을 가지고 있다. 도시지역에서 자연자원에 대한 접근성이 높아짐에 따라 다양한 목적으로 방문하고 있으며, 이에 각 공간에서의 행태가 보다 다양해진다. 즉, 도시지역 거주자에게 숲과 공원 등 도시녹지공간에 대한 높은 수요가 있는 점(Bates and Santerre, 2001; Tajima, 2003; Zheng et al., 2009)을 본 연구를 통해서도 다시 확인할 수 있었다. 이는 최근 생태계가 제공하는 문화서비스에 대해서 수요자 기반의 연구가 관심을 받고 있으며, 특히 도시 인근의 자연이 가지는 가치가 더 높은 관심을 받고 있는 것과 같은 맥락으로 이해된다.
또한 서울에 위치한 자연자원에 대한 인지성은 전체적으로 높게 나타나는 반면에, 경기도 지역과 인천 지역의 경우에는 각 지자체의 랜드마크 역할을 하는 공원들에 대한 인지성이 높게 나타났다. 그 예로 송도 센트럴파크(5.199), 인천대공원(5.083), 광교호수공원(5.124), 일산호수공원(5.170) 등이 있으며, 이는 블로그 제목과 원문에서도 ‘송도의 랜드마크’, ‘광교의 랜드마크’ 등의 각 지역에 ‘랜드마크’라는 키워드가 함께 언급되고 있는 것을 확인할 수 있었다.
4. 결론
본 연구에서는 소셜미디어 데이터 중 블로그 데이터의 누적 콘텐츠 발행량을 활용하여 보전지역 및 자연자원에 대한 사람들의 인지성을 평가하고 특성을 분석하였다. 이에 따라 평가 가능한 보전지역과 일정 규모 이상의 도시공원을 구분하고 각 장소에 대해 사람들이 작성한 블로그 게시물 수를 토대로 종합하여 10단계 구분하여 평가하였다. 본 연구의 결과는 다음과 같다.
첫째, 사찰, 호수, 갯벌 등 여러 보전지역 중 사람들에게 가장 많이 인지되고 있는 자연자원은 산림이었다. 산림의 경우 전체 보전지역 중 상위 10% 이상이 산림일 정도로 다른 보전지역 종류에 비해 사람들에게 인지성이 높게 나타났다. 이는 각 장소별 누적 블로그 게시물 수에서도 상당한 차이를 보이고 있었다. 그에 비해 도시공원의 경우에는 근린공원, 역사공원, 수변공원, 문화공원 등 다양한 공원을 전반적으로 모두 주요 장소로 인지하고 있었으며, ‘산책’, ‘피크닉’, ‘나들이’ 등 각 공원 안에서의 일어날 수 있는 여러 행태들이 공원의 특성에 크게 구애받지 않는 점을 이유로 볼 수 있다.
둘째, 서울 수도권 주변에 접근 가능한 산림과 공원이 많이 존재하며, 사람들의 인지성 또한 높게 나타나고 있음을 알 수 있었다. 서울 외곽에서부터 경기 남부지역으로 멀어질수록 장소에 대한 인지성이 점차 낮아진다. 이는 서울 수도권 주변에 위치하는 보전지역은 보전의 대상임과 동시에 자연 관광지로서의 역할을 수행하고 있으며, 도시권에 있을수록 인지성이 더 높고 따라서 생태계 문화서비스의 기능이 매우 높음을 알 수 있다.
기존의 자연환경에 대한 이용자의 인지 정도를 측정하고 평가하기 위해서는 대면설문 또는 인터뷰를 통해 데이터를 수집하고 분석해야 했다. 이와 같은 조사방법에는 시간적, 비용적 어려움이 요구된다. 본 연구에서는 이용자의 인식을 파악하는 기존 연구방법과는 다르게 소셜미디어 데이터 발행량을 활용하여 수도권 지역에서의 보전지역과 자연자원에 대하여 수치화하여 평가함으로써, 위와 같은 어려움을 해결하고 정량적인 평가 방법을 제시하였다. 또한 본 연구는 2016년도부터 현재까지 누적된 콘텐츠 발행량을 활용함으로써 한시적인 데이터가 아니라 장기적으로 누적된 데이터를 활용하였기에, 일시적으로 일어나는 요인으로 인한 데이터의 특수성이 나타나지 않는다는 점에서도 의의가 있다.
단, 본 연구에서는 블로그 콘텐츠 발행량을 기반으로 평가를 진행함에 있어 각각의 블로그가 가진 내용에 대해서는 파악하기 어렵다는 한계가 발생한다. 연구 과정에서 해석을 위하여 등장 키워드로 인한 동향은 파악 가능했으나 세세한 내용을 분석하지는 못했다. 또한 본 연구에서는 산림 영역에 포함되어 있는 사찰, 계곡 등과 같은 문화 및 역사자원을 하나의 산림으로 포괄하여 분석대상으로 설정하였으며, 이에 대해서는 각각의 자원에 대한 해석이 축소되거나 혹은 더 큰 범위로 확대 해석이 될 수 있는 한계가 있다. 이런 점들은 향후 추가적인 연구를 수행하여 세세한 연구 결과 도출이 필요하다. 공원에 대한 인지성에 있어서도 인구 밀집도가 높고 다양한 자원에 대한 인지 정도가 높은 서울과는 다르게 경기도와 인천의 경우, 대규모 도시와 소규모 도시의 인구분포가 다르고 이에 따라 공원의 규모나 인지정도가 다를 수 있으며, 인구분포와 인지정도의 상관성을 함께 살펴볼 필요가 있다.
또한 보전지역이나 도시공원 특성상 개발, 부동산 등의 이슈에 대한 내용이 동반되는 블로그 게시물이 존재할 수 있으나, 이에 대하여 필터링하지 못했다는 점에서 한계가 발생한다. 이에 대해서는 해당 블로그 데이터를 활용한 키워드 분석 및 내용 분석 등의 추가적인 보완작업이 함께 수행될 필요가 있을 것이다.
그럼에도 본 연구의 결과는 향후 도시녹지공간에 대한 대중의 관심 및 인지 정도 고려하여 관리방안을 마련하거나 인지성을 높이기 위하여 발전방안을 수립할 수 있는 기초 자료로 활용될 수 있을 것으로 기대할 수 있다. 또한 연구에 활용된 연구방법은 녹지공간에 대한 이용자의 관심을 파악하고 트렌드를 읽어내는 데 사용함으로써, 이용자들의 인식과 반응을 모니터링 할 수 있을 것이다.