Journal of the Korean Institute of Landscape Architecture
The Korean Institute of Landscape Architecture
Article

소셜미디어 빅데이터의 개체명 인식을 활용한 옥외 힐링 장소 인식 분석

성정한*, 이경진**
Junghan Sung*, Kyungjin Lee**
*공주대학교 대학원 조경·환경계획학과 박사수료
**공주대학교 조경학과 교수
*Ph.D. Candidate, Dept. of Landscape Architecture & Environmental Planning, Graduate School of Kongju National University
**Professor, Dept. of Landscape Architecture, Kongju National University
Corresponding author : Kyungjin Lee, Professor, Dept. of Landscape Architecture, Kongju National University, Yesan 32439, Korea, Tel. : +82-41-330-1445, E-mail : lkj@kongju.ac.kr

© Copyright 2022 The Korean Institute of Landscape Architecture. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Aug 23, 2022; Revised: Sep 16, 2022; Accepted: Sep 16, 2022

Published Online: Oct 31, 2022

국문초록

최근 힐링에 대한 관심이 증가함에 따라 힐링을 콘셉트로 하는 옥외 공간이 조성되고 있다. 보다 전문적이고 심층적인 옥외 힐링 장소 계획․설계․디자인을 위해 88,155건의 블로그 게시글 텍스트 데이터를 개체명 인식하여 텍스트 마이닝을 진행했다. 옥외 힐링 장소의 인식과 특징을 파악을 위해 출현 빈도 분석과 응집 분석을 진행하였다. 선행연구 고찰을 통해 힐링 장소의 6가지 요소를 도출하였으며, 시간과 인원을 추가한 총 8가지 요소를 통해 인식과 특성을 살펴보았다. 분석 결과 사람들은 힐링 장소를 방문하는 데 있어 장소적요소, 시간적요소, 사회적요소, 활동요소를 인원, 식물, 색상․형태, 심리적 요소보다 중요하게 생각하였다. 상위 출현 키워드를 통해 여러 가지 인식과 특성을 파악할 수 있었다. 응집 분석 결과를 통해 장소적요소, 시간적요소, 사회적요소의 키워드들이 응집되어 나타나 주로 어떤 장소, 어떤 시간대, 누구와 함께 방문하는지 구체적으로 살펴볼 수 있었다. 연구를 통해 실제 사람들이 작성한 인식 데이터를 대량 분석하여 힐링 장소의 인식과 특성을 도출하였으며, 계획과 마케팅적으로 활용할 수 있는 구체적인 요소가 나타남을 확인했다.

ABSTRACT

In recent years, as interest in healing increases, outdoor spaces with the concept of healing have been created. For more professional and in-depth planning and design, the perception and characteristics of outdoor healing places through social media posts were analyzed using NER. Text mining was conducted using 88,155 blog posts, and frequency analysis and clique cohesion analysis were conducted. Six elements were derived through a literature review, and two elements were added to analyze the perception and the characteristics of healing places. As a result, visitors considered place elements, date and time, social elements, and activity elements more important than personnel, psychological elements, plants and color, and form and shape when visiting healing places. The analysis allowed the derivation of perceptions and characteristics of healing places through keywords. From the results of the Clique, keywords, such as places, date and time, and relationship, were clustered, so it was possible to know where, when, what time, and with whom people were visiting places for healing. Through the study, the perception and characteristics of healing places were derived by analyzing large-scale data written by visitors. It was confirmed that specific elements could be used in planning and marketing.

Keywords: 텍스트 마이닝; 블로그 포스트; 넷마이너; 키워드 분석; Clique
Keywords: Text Mining; Blog Post; NetMiner; Keyword Research; Clique

1. 서론

사회의 과도한 경쟁, 업무의 고도화, 대인 관계에 대한 상실감, 1인 가구 확산으로 인한 사회적 고립 및 우울감, 경제적 불안정 등 여러 가지 사회적인 문제들은 오늘날 인간의 삶의 질을 저하시키고 있다. 최근에는 코로나19 바이러스의 후유증으로 인한 육체적․정신적 건강의 저하도 나타나고 있다. 이러한 문제점들은 개인적인 문제점을 넘어 시대적인 문제로도 대두되고 있다.

사회에서 지속적으로 받은 스트레스 해소와 삶의 질 밸런스를 유지하기 위해 많은 사람들이 힐링 장소를 찾으면서 힐링에 대한 관심과 관련 산업의 수요가 증가하고 있다. 개인이 운영하는 카페에서는 옥외공간을 적극적으로 활용하여 힐링 장소를 만들고 있으며, 각 지방자치단체에서는 도심 속 힐링 공간을 조성하거나 민간정원을 유치하는 등 힐링을 콘셉트로 하거나 힐링 활동을 제안하는 많은 옥외 장소들이 생겨나고 있다.

이처럼 힐링 장소에 대한 관심과 공간들이 증가하고 있는 추세지만, 일상 공간 힐링 장소에 대한 학문적 연구는 미비하게 진행되고 있는 것으로 나타났다. Jang and Cho(2021)의 연구에 따르면 환경, 공간, 시설 분야에서 힐링과 치유환경 키워드로 KCI에 등재된 130편의 선행연구 분석 결과 힐링을 키워드로 한 논문은 4편에 불과하였고, 가장 최근의 연구논문은 2014년에 등재되었다. 그나마 힐링과 관련된 4편의 연구조차도 대부분 산림이나 의료시설 및 요양 시설과 같은 실내 환경에 치중되어 있어 일상생활에서 주로 접하는 물리적인 힐링 환경에 대해 연구하거나 디자인적으로 제안하지 못하고 있는 것으로 나타났다.

따라서 본 연구에서는 특정 환경이 아닌 일상생활에서 접할 수 있는 옥외 힐링 장소에 대한 이용자들의 인식과 특성을 파악하여 조성 시 고려해야 할 요소를 살펴보고 이를 통해 보다 전문적이고 심층적인 옥외 힐링 장소를 제공하고자 한다.

일상생활 내 힐링 장소에 대한 연구가 이루어짐으로써 부족했던 분야의 연구가 이루어짐은 물론 기존의 힐링 및 치유환경 관련 선행연구에서 문제시되었던 물리적인 환경 디자인 제안이 가능한지 살펴보고자 한다.

또한 이번 연구에서는 힐링을 주제로 연구를 진행했지만, 향후 낭만, 감성과 같이 추상적인 단어나 설계 가이드라인이 필요한 특정 콘셉트에 동일한 연구 방법으로 진행될 수 있도록 소셜미디어 빅데이터를 활용한 장소 계획․설계․디자인 연구의 초석을 다져보고자 한다.

2. 이론적 고찰

2.1 옥외 힐링 장소 특성 요소 도출

힐링 장소의 특성 요소를 파악하기 위해 힐링 장소 및 치유환경과 관련된 선행연구를 고찰하였다.

Olds(2001)의 보육 시설의 디자인 가이드를 제시하는 연구에서는 환자들에게 치유환경에 대한 시각적 표현을 하도록 하였는데 그 결과 환자들의 75%가 외부환경을 그렸으며, 나머지 25% 환자도 외부공간과 관련되는 요소들을 포함하는 실내환경을 표현하였다. 이는 외부환경이 치유환경에 영향을 한다는 것을 시사하고 있다. 또, Oh and Park(2019)의 연구에서는 공간 사용자를 건강한 상태로 회복되도록 돕는 물리적, 심리적으로 긍정적인 영향을 주는 환경을 치유환경이라 정의하고 있다.

Tyson(1998)은 힐링에는 체험이나 활동을 동반해야 하며, Kim and Nah(2019)의 연구에서는 현장체험이 치유효과에 직․간접적으로 영향을 준다고 주장하고 있다. 또한 Weng and Chiang(2014)의 연구에서는 걷기와 같은 적당한 여가활동은 정신건강을 개선하며, 대화 또한 불안을 줄이고 주의회복 효과가 있는 것을 연구를 통해 밝혀냈다.

Ulrich(1983)Tyson(1998)의 연구에서는 치유 및 힐링환경이 사회적 관계를 가지며 사회 교류적 상호작용이 이루어져야 한다고 주장한다. Kim(2019)의 연구에서도 치유환경은 개방적 공간구성, 외부공간과 내부 공간의 연계, 자연적 요소의 적극적 활용으로 이용자들의 심리적․사회적 치유에 기여는 물론 상호작용을 통해 사회적 교류를 지원해야 한다고 하고 있다.

Ulrich(1984, 1991)의 연구에서는 자연적 요소가 건강을 증진하고 스트레스 저감에 효과를 보이며 긍정적인 주의를 이끌어내는데 효과를 보이는 것을 연구를 통해 밝혀냈다.

Malkin(1992)은 병원의 힐링 환경 인테리어에 빛, 온도, 소음, 환기, 재질감, 색채 등의 요소가 고려되어야 한다고 주장했다.

Leather et al.(2003)의 연구에서는 스트레스 해소를 위해서 편안함과 안락함이 느껴져야 하는데, 이는 심리적 요소와 관련이 있다고 주장한다.

선행연구를 통해 힐링 장소에는 장소적요소, 활동요소, 사회적요소, 자연과 식물요소, 색상 및 형태, 심리적 요소 총 6가지 요소가 작용하는 것을 알 수 있었다.

또한 선행연구에서 치유․힐링 환경을 정의한 것을 살펴보면 힐링 장소는 공간적으로 현실에 존재하는 장소이기 때문에 날짜나 계절 등 시간적인 요소가 있으며 사람들의 이용 및 방문이 일어난다. 따라서 선행연구를 통해 도출되었던 6가지 요소에 날짜, 계절, 시간과 같은 시간적요소와 혼자, 같이, 여럿과 같은 인원에 대한 요소를 포함하여 총 8가지 요소로 보고자 한다.

위와 같은 요소들을 본 연구에서 옥외 힐링 장소 특성 요소로 지정했다(Table 1 참조).

Table 1. Healing place elements with literature review
Authors Healing place elements
Olds(2001), Oh and Park(2019) Places
Tyson(1998), Kim and Nah(2019), Weng and Chiang(2014) Activity
Ulrich(1983), Tyson(2007), Kim(2019) Social
Ulrich(1984, 1991) Nature, plants
Malkin(1992) Color, form & shape
Leather et al.(2003) Psychological
*Addition by researchers Day & time
*Addition by researchers Personnel
Download Excel Table
2.2 텍스트 마이닝 문제점 고찰

텍스트 마이닝은 대량의 비정형 텍스트 데이터들에서 키워드를 도출해 내어 관계성이나 집합성을 분석하기 때문에, 텍스트 데이터가 가진 전체적인 이슈를 파악할 수 있다(Lee and Son, 2018). 이러한 장점 때문에 최근에는 이용자가 작성한 리뷰나 소셜미디어 데이터를 활용하여 특정 대상의 인식이나 이미지를 파악(Han and Kim, 2017)하거나 현상이나 경향을 도출하는 연구(Jang and Yoon, 2016)가 주로 이루어지고 있다.

또, 소셜미디어 빅데이터를 활용한 텍스트 마이닝은 다수를 대상으로 하는 설문조사 방법에 비해 이용자가 작성하여 축적된 인터넷 정보를 활용함으로써 보다 상세하고 구체적인 특성을 도출할 수 있다(Park et al., 2019).

하지만 텍스트 마이닝의 과정에서 키워드에 범주가 구분되지 않으면 해당 키워드가 장소명인지, 사람명인지, 문화매체명인지 연구자가 직접 대량의 키워드들에 대해 각각 범주를 구별해 분석하고 결과를 도출해야 한다. 이 경우 대량의 키워드를 다루는 과정에서 연구자의 실수나 주관적 분류가 발생할 수 있는 문제점이 존재한다. 따라서 객관적인 분류 기준을 사용하여 키워드들의 범주를 분류할 필요가 있다.

2.3 텍스트 마이닝에서의 개체명 인식(NER, Named Entity Recognition) 활용성 고찰

개체명(named entity)이란 특정 개체를 다른 것들과 구별하여 부르기 위해 이름을 붙인 실제 세계에 존재하는 개체들의 명칭이다. 대부분의 고유명이 포함되나, 인명, 지명, 작품명, 단체명 등 특정 범주에 속하는 개체명들로 고유명으로 제한된다(NIKL, 2021). 개체명과 유사어로 개체 명사가 있는데, 국립국어원 표준국어대사전에서는 이를 한정된 속성으로 단독의 사물, 단일적이며 개별적인 사물을 나타내는 개념으로 정의하고 있다. 따라서 개체명이란 오직 하나의 개별적이며 고유한 성질을 가진 개체의 명칭으로 볼 수 있다.

국립국어원(National Institute of Korean Language, NIKL)에서는 인공지능의 한국어 처리 능력 향상을 위해 모두의 말뭉치라는 인공지능 학습 자료 데이터를 제공하고 있다. 그중 개체명 분석 말뭉치는 문어나 구어를 활용하여 구축된 개체명을 JSON 파일 형식으로 제공하는 데이터이다. 2021년 12월에 배포된 개체명 말뭉치는 총 600만 어절(문어 300만, 구어 300만 어절)에 대한 개체명 데이터를 제공한다. 문어나 구어를 통해 단어에 대한 범주가 분류되었기 때문에 해당 단어의 범주가 자세하게 구분된다. 따라서 텍스트 마이닝 시 국립국어원에서 제공하는 개체명 말뭉치를 사용한다면 키워드에 대한 범주를 보다 객관적이고 정확하게 분류 가능하다.

국립국어원에서 제공하는 개체명 말뭉치는 총 15개 범주, 150개의 세분류로 분류된다(Figure 1 참조).

jkila-50-5-90-g1
Figure 1. NIKL(2021) – Table of named entity recognition
Download Original Figure

3. 연구방법

옥외 힐링 장소의 인식과 특징 분석을 위해 블로그 게시글들을 수집하여 분석하였다. 선행연구 고찰을 통해 인식 및 특성 분석을 위한 8가지의 힐링 장소 특성 요소를 도출했다. 이후 텍스트 마이닝 방법을 활용하여 분석했다. 텍스트 마이닝을 위해 수집된 데이터의 전처리 과정을 진행하였으며, 기존 텍스트 마이닝 분석방법의 문제점을 보완하고자 국립국어원에서 제공하는 개체명 말뭉치를 활용하여 개체명 인식을 추가적으로 진행하였다. 이후 개체명 인식을 통한 키워드 분석과 키워드 응집 분석을 진행하였다. 분석된 결과를 통해 힐링 장소의 인식 특성을 도출하였다(Figure 2 참조).

jkila-50-5-90-g2
Figure 2. Research process
Download Original Figure
3.1 석 데이터 수집

옥외 힐링 장소 인식 분석을 위해 블로그 데이터를 활용하였다. 블로그 게시글은 개인의 경험과 생각, 감정 등이 담겨 있는 정보이기 때문에 공간이나 장소를 대상으로 작성된 게시글은 해당 인식을 조사하는 데 있어 중요한 자료가 될 수 있다(Sung and Lee, 2020). 2011년부터 2020년까지 10년간 Daum 검색서비스에서 ‘힐링’으로 검색되는 Daum, Naver, Tistory 블로그들의 요약 게시글을 수집했다.

요약 게시글이란 포털사이트에서 해당 단어를 검색했을 때 검색 결과로 나타나는 요약문으로, 검색자가 블로그에 들어가지 않고도 요약 게시글을 통해 블로그에서 게시한 내용을 볼 수 있다. 요약 게시글은 제목이나 본문 내용에 해당 검색 단어를 포함하고 있고 2~3줄(100음절 이내)로 짧게 요약되어 나타난다.

Python을 활용한 크롤링(crawling) 방법은 검색 결과를 txt 형식이나 csv 형식의 데이터로 저장 가능하다. Daum에서 1회 검색 시 블로그의 검색 결과는 최대 약 1,000건의 검색 결과만 보여주기 때문에 검색 기간을 별도로 설정하지 않는다면 약 1,000건의 검색 결과밖에 저장되지 않는다. 따라서 수집되는 자료의 양을 늘리기 위해서는 검색 기간을 지정해 주어야 한다.

‘힐링’을 검색했을 때 10년간 게시된 블로그 게시글을 1일 단위로 수집 시 약 220만 건, 1개월 단위로 수집 시 약 9만 건, 1년 단위로 수집 시 약 9천 건의 데이터가 수집이 되었다. 데이터의 양이 늘어날수록 단어 간 관계를 세부적으로 알 수 있고 결과의 신뢰성 또한 높일 수 있다. 하지만 데이터의 양이 늘어나는 만큼 분석 시간도 늘어나며, 불용어나 스팸 단어의 유입도 많아지게 된다. 따라서 pilot study를 통해 적절한 분석 시간을 가진 데이터의 수집 단위를 선정하고자 하였고, 그 결과 1개월 단위로 수집한 88,155건의 검색 결과를 분석 대상으로 사용하기로 하였다.

3.2 데이터 정제 및 전처리

수집된 텍스트 데이터의 정제를 위해 Excel을 활용하여 수집된 데이터의 중복 확인과 특수문자, HTML 소스 코드 등을 제거하였다.

이후 데이터 분석을 위해 NetMiner 프로그램을 사용하여 데이터를 전처리하였다. 수집된 데이터는 문장의 형태를 가지고 있어 단어 간의 관계성을 파악하기 어렵다. 따라서 문장을 형태소 단위로 나누어주는 전처리 과정이 필요하다. NetMiner는 사회연결망 분석 소프트웨어 중 하나로, 비정형 텍스트 데이터의 전처리는 물론 연결망 분석, 군집 분석, 데이터 시각화 기능 등을 제공하고 있다.

NetMiner의 형태소 분리 기능을 사용하여 문장을 단어로 분리하였다. 형태소 중 명사(noun)와 형용사(adjective)만 추출하였다. 동사의 경우 NetMiner상에서 ‘~다’로 끝나는 것을 대부분 동사로 분류하고 있어 추출에서는 제외하였다.

추가로 형태소 분리 과정에서 스팸 단어 목록, 유의어 목록, 지정어 목록, 제외어 목록을 추가하여 데이터를 정제하였다. 스팸 단어는 ‘힐링 타이 마사지’, ‘챠크라 힐링 명상’, ‘숲속 힐링 빌라 분양’ 등과 같이 검색 결과 중 옥외 힐링 장소와 관련 없는 단어가 포함되거나 광고성이 있는 검색 결과를 스팸 목록으로 지정하여 분석에서 제외했다.

3.3 개체명 인식

국립국어원에서 제공하는 개체명 분석 말뭉치를 사용하여 전처리된 텍스트 데이터에 개체명 인식을 진행하였다.

이후 개체명이 인식된 키워드들을 선행연구 고찰을 통해 도출된 8가지 옥외 힐링 장소 특성 요소를 중심으로 분류하여 옥외 힐링 장소 인식을 구체적으로 분석했다.

3.4 출현 키워드 분석

8가지 요소로 분류된 개체명들의 출현 빈도를 분석하여 어떤 유형의 개체명의 출현이 우세하게 나타나며, 어떤 힐링 장소 특성 요소의 비중이 높은지 출현 빈도를 통해 파악하였다.

3.5 응집(Clique) 분석

응집 분석은 네트워크 분석 방법 중 하나로 네트워크상에서 강한 연결 정도를 갖는 커뮤니티를 찾는데 활용된다. 여기서 clique은 결합력을 가지는 최소 3개의 노드(node)로 구성된 집합을 뜻한다. Kim et al.(2016)의 연구에 의하면 clique 분석은 키워드 네트워크의 community 분석보다 매우 구체적이고 세부적인 영역을 지칭하는 키워드의 응집이 나타나기 때문에 특정 그룹을 찾는데 유용하게 활용될 수 있다고 하였다.

기존 텍스트 마이닝을 활용한 연구에서는 주로 cohesion분석이나 community분석을 활용하여 키워드 관계를 나타낸다(Lee and Son, 2018, Kim et al., 2019). 본 연구에서는 기존 사용되던 군집방법보다 구체적이고 세부적인 영역을 나타낼 수 있는 응집 분석을 사용하고자 한다.

4. 연구결과 및 고찰

4.1 개체명 인식 및 분류

NetMiner를 활용하여 수집된 88,155건의 데이터를 정제한 결과 명사와 형용사로 구분되는 8,207개의 단어가 정제되었다.

정제된 8,207개의 단어들에 대해 국립국어원에서 제공하는 개체명 말뭉치를 적용했을 때, 2,936개(35.8%)의 단어들이 개체명이 인식되었으며, 5,271개(64.2%)의 단어는 개체명이 인식되지 않았다. 개체명이 인식되지 않은 단어들은 개체명 말뭉치에 등록되지 않는 단어들이다. 예를 들어 ‘좋다’, ‘시간’, ‘많다’, ‘생각’, ‘날씨’와 같은 단어들의 개체명이 인식이 되지 않는데, 이러한 대부분의 단어들은 보통명사, 형용사, 동사들로 구성되어 있다. 국립국어원에서 제공하는 개체명 말뭉치에는 고유명사를 제외한 보통명사, 형용사, 동사는 개체의 유형을 명확하게 분류하기 어렵기 때문에 개체명이 등록되어 있지 않다고 명시되어 있다(NIKL, 2021).

국립국어원에서 제공하는 개체명 중 옥외 힐링 장소와 밀접한 관계가 있는 개체명과 세부 개체명이 무엇인지 선행연구를 통해 도출된 옥외 힐링 장소 특성 요소를 기준으로 분류하였다.

그 결과 국립국어원에서 제시한 150개의 세부 개체명 중 인명, 학문분야, 이론 등 옥외 힐링 장소와 관련 없는 세부 개체명을 제외한 23개가 옥외 힐링 장소의 개체명인 힐링 장소 세부 개체명으로 사용되었다(Table 2 참조).

Table 2. Detail named entity outdoor healing place
Named entity Healing place detail named entity Healing place elements
6. Location(LC) 지역, 장소, 지형, 지리 6.2 LCP_Province 도, 지역명 Place elements 장소적요소
6.3 LCP_County 행정구역명(군, 면, 읍, 리)
6.4 LCP_City 도시명
6.5 LCP_Capitalcity 수도명
6.6 LCG_River 강, 호수, 연못
6.7 LCG_Ocean 해양, 바다
6.8 LCG_Bay 반도, 만
6.9 LCG_Mountain 산, 산맥, 능선, 고개
6.10 LCG_Island 섬, 제도
7. Civilization(CV) 문명, 문화 7.9 CV_Art 예술의 분류 Activity elements 활동요소
7.10 CV_Sports 스포츠,레저
7.14 CV_Relation 가족, 친족관계 Social elements 사회적요소
8. Date(DT) 기간, 계절, 시기 8.1 DT_Duration 기간 Date&time 시간적요소
8.2 DT_Day 날짜
8.6 DT_Season 계절
9. Time(TI) 시계, 시각, 시간 9.1 TI_Duration 기간
10. Quantity(QT) 수량, 순서 10.5 QT_Man_Count 인원수 Personnel 인원
13. Plant(PT) 식물 13.2 PT_Flower 꽃 Plants 식물
13.3 PT_Tree 나무
13.4 PT_Grass 풀
15. Term(TM) 기타 개체명 15.1 TM_Color 색상 Color, form & shape 색상 및 형태
15.4 TM_Shape 모양, 형태, 무늬
15.6 TMM_Disease 증상, 증세, 질병 Psychological elements 심리적요소
Download Excel Table

이 중 6.3 LCP_COUNTY 행정구역명(군, 면, 읍, 리), 6.4 LCP_CITY 도시명, 6.5 LCP_CAPITALCITY 수도명은 행정구역으로 동일한 유형의 개체명이기 때문에 분석 결과에서는 이를 같은 세부 개체명 그룹으로 보았다.

4.2 출현 빈도를 통한 우세 특성 요소 및 키워드 분석

개체명을 활용하여 옥외 힐링 장소 인식 분석을 위해 8가지의 옥외 힐링 장소 특성 요소의 백분율과 23개의 세부 개체명들의 백분율을 구하고, 출현 빈도가 평균값 이상인 키워드를 상위 출현 키워드로 명명하였다.

8가지의 옥외 힐링 장소 특성 요소의 백분율의 합은 각 특성 요소에 포함된 옥외 힐링 장소 세부 개체명 백분율의 합이다. 힐링 장소 특성 요소의 백분율 평균값은 12.5%였으며, 힐링 장소 세부 개체명의 백분율 평균값은 4.3%이다. 8가지 옥외 힐링 장소 특성 요소의 백분율이 높은 순으로 표를 나열하였으며, 백분율 평균값 이상의 요소나 개체명들은 굵은 글씨로 표시하였다.

첫 번째로, 가장 비중이 높은 옥외 힐링 장소 특성 요소는 장소적 요소로 나타났다. 장소적요소 중 행정구역․도시․수도는 서울특별시의 출현 빈도가 가장 높은 것으로 나타났다. 섬․제도에서는 제주도가 가장 높게 나타났으며, 도․지역명에서는 강원도의 출현 빈도가 높게 나타났다. 산․산맥․능선․고개에서는 지리산, 강․호수․연못에서는 한강, 해양․바다에서는 서해, 반도․만에서는 순천만이 높게 나타났다(Table 3 참조).

Table 3. Top frequency keyword of place elements, social elements, date & tiime
Healing place elements Healing place detail named entity Top frequency keyword(above average frequency)
Place elements 장소적요소 (41.2%) County, city, capital city 행정구역, 도시, 수도명(27.1%) Seoul(F=1,051), Busan(F=841), Gyeongju-si(F=466), Gangneung-si(F=337), Damyang-gun(F=346), Daegu(F=337), Daejeon(F=335), Yangpyeong-gun(F=302), Sokcho-si(F=284), Jeonju-si(F=282), Yeosu-si(F=276), Gapyeong-gun(F=238), Namhae-gun(F=211), Sancheong-gun(F=186), Hongcheon-gun(F=173)
Island, archipelago 섬, 제도(7.2%) Jeju island(F=3,462), Ttukseom island(F=156), Udo island(F=155), Nami island(F=154), Anmyeondo island(F=133)
Province 도, 지역명 (3.3%) Gangwon-do(F=741), Jeollanam-do(F=204), Gyeongsangnam-do(F=185), Chungcheongbuk-do(F=144), Jeollabuk-do(F=137), Gyeongsangbuk-do(F=128), Chungcheongnam-do(F=126)
Mountain, ridge, hill 산, 산맥, 능선, 고개(2.3%) Jirisan mountain(F=159), Gyejoksan mountain(F=109), Daegwallyeong(F=97), Misiryeong(F=79), Hallasan mountain(F=76), Namsan mountain(F=68), Odaesan mountain(F=59), Palgongsan mountain(F=59)
River, lake, pond 강, 호수, 연못(0.8%) Han river(F=223), Geumgang river(F=55), Soesokak(F=31), Seomjingang river(F=30), Namhangang river(F=29), Taehwa river(F=22)
Ocean, sea 해양, 바다 (0.2%) West coast(F=50), East coast(F=15), Mediterranean sea(F=11)
Peninsula, bay 반도, 만(0.2%) Suncheon bay(F=81), Byeonsan peninsula(F=38)
Download Excel Table

두 번째로 시간적요소의 비중이 높게 나타났다. 시기적으론 주말과 하루의 키워드가 높게 나타났으며, 계절적으로는 가을이, 시간대별로는 아침이 출현 빈도가 높게 나타났다. 날짜․요일로는 휴일, 토요일, 일요일의 출현 빈도가 높게 나타났다. 세부 개체명 중 날짜․요일의 상위 출현 키워드에서 휴일과 관련된 금요일, 토요일, 일요일 다음으로 월요일이 높게 나타났는데, 데이터의 원문 확인 결과 월요일 아침이나 피곤한 상태를 의미하는 월요병에 대한 내용과 월요일의 피로를 힐링하기 위한 내용, 실제로 일요일부터 월요일까지 휴가를 간 내용이 나타났다. 또, 세부 개체명 중 시간에서 아침 키워드가 높게 나타난 이유도 원문 확인 결과 실제로 아침에 운동을 하거나, 일출을 보거나,

사진을 찍고 산책을 하는 등 힐링을 경험하는 것으로 나타났다(Table 4 참조).

Table 4. Top frequency keyword of date & tiime, social elements, activity elements
Healing place elements Healing place detail named entity Top frequency keyword(above average frequency)
Date & time 시간적요소 (21.4%) Date duration 시기(5.8%) Weekend(F=1,699), day(F=1,030), vacation(F=539), summer vacation(F=188)
Season 계절(5.7%) Fall(Autumn)(F=1,112), summer(F=864), winter(F=842), spring(F=703)
Date & day 날짜 및 요일(5.5%) Holiday(F=679), saturday(F=396), sunday(F=348), friday(F=264), monday(F=242), Chuseok(F=238), weekday(F=209)
Time duration 시간(4.3%) Morning(F=999), dinner(F=447), afternoon(F=351), lunch(F=300), dawn(F=257), ante meridiem(A.M.)(F=220)
Social elements 사회적요소 (11.6%) Family / kinship 가족/친족 관계 명칭(11.6%) Family(F=1,516), child(F=1,334), mom(F=804), husband(F=488), older sister(F=414), dad(F=296), baby(F=255), parents(F=209), younger(F=205), married couple(F=204), married woman’s parents(F=199), older brother(F=188), wife(F=185), son(F=68), boyfriend(F=132)
Activity elements 활동요소 (10.4%) Art 예술활동 (6.5%) Picture(F=1,941), movie(F=855), song(F=319), travelogue(F=176), art(F=101)
Sport, leisure 스포츠․레저활동 (3.9%) Walking(F=898), fishing(F=376), exercise(F=304), tracking(F=229), Bike riding(F=183), climbing(F=86)
Download Excel Table

세 번째로 사회적요소가 비중이 높게 나타났다. 가족/친족 관계 명칭에서는 가족과 아이의 키워드가 높게 나타났다. 주로 힐링 장소를 가족단위로 아이와 함께 방문하는 것을 알 수 있다(Table 4 참조).

네 번째로 활동요소가 비중이 높게 나타났다. 활동은 예술활동과 스포츠․레저활동으로 나누어진다. 예술활동에서는 주로 사진을 찍으며 힐링을 경험하는 것으로 나타났다. 스포츠․레저활동으로는 산책을 통해 힐링을 경험하는 것으로 나타났다(Table 4 참조).

다섯 번째로 인원에 대한 요소의 비중이 높게 나타났다. 힐링은 주로 혼자가 아닌 다수의 사람이 함께 즐기는 것으로 나타났다(Table 5 참조).

Table 5. Top frequency keyword of plants, color, form & shape, psychological elements, personnel
Healing place elements Healing place detail named entity Top frequency keyword(above average frequency)
Personnel 인원 (5.6%) Number of people 인원수(5.6%) Together(F=2,927), alone(F=621)
Psychological elements 심리적요소 (4.3%) Symptoms, disease 증상, 증세, 질병(4.3%) Stress(F=798), exhaustion(F=536), covid-19(F=264), wound(F=191), Depression(F=167), cold(F=128), diabetes(F=61), pregnancy(F=55), anxiety(F=48)
Plants 식물 (3.2%) Tree 나무(1.7%) Maple(F=213), bamboo(F=203), cypress(F=167), pine(F=98), camellia(F=89), birch(F=89), fir(F=79)
Flower 꽃(1.1%) Cherry blossoms(F=195), rose(F=83), lotus(F=67), water lily(F=64), Plum blossoms(F=36), rape flowers(F=32), lavender(F=29), chrysanthemum(F=27), Gujeolcho(Korean Daisy)(F=26)
Grass 풀(0.4%) Grass(F=85), silver grass(F=51), reed(F=47), mint(F=24)
Color, form & shape 색상 및 형태 (2.2%) Color 색상(2.0%) Green(F=614), blue(F=202), white(F=148), red(F=97)
Form & shape 형태(0.2%) Heart(F=50), wave(F=26)
Download Excel Table

여섯 번째로 심리적요소의 비중이 높게 나타났다. 세부 키워드를 살펴보면 스트레스, 피로 키워드의 출현 빈도가 상처보다 높은 것을 알 수 있다. 이는 힐링을 상처를 치유하기보다 일상에서 받은 스트레스와 피로를 해소하며 기분전환을 하는 행위로 해석할 수 있다(Table 5 참조).

일곱 번째로 식물에 대한 요소의 비중이 높게 나타났다. 나무는 단풍과 대나무, 꽃은 벚꽃, 풀은 잔디의 출현 빈도가 높게 나타나 위 식물들이 힐링과 관련이 있는 것으로 볼 수 있다.

마지막 여덟 번째로 색상 및 형태의 요소가 나타났다. 색상 및 형태 중 색상은 초록과 파랑이 힐링과 관련된 색으로 나타났다. Chong et al.(2007)의 연구에 따르면 성인 남녀 각각 50명의 피실험자를 대상으로 색채가 인지 기능에 미치는 환경을 실험하였는데, 한색 계열인 초록색과 파란색에서 부교감신경계가 활성화되어 심리적 안정감과 주의력이 높게 나타난다는 연구결과와 일치하는 것을 볼 수 있다. 형태로는 하트 모양이 힐링과 관련되었다(Table 5 참조).

4.3 키워드 응집(Clique)을 통한 인식 분석

23개의 옥외 힐링 장소 세부 개체명에서 출현 빈도가 평균값 이상인 상위 출현 키워드 총 130개의 키워드를 응집 분석하였다. 그 결과 총 47개의 응집 그룹이 나타났다(Table 6 참조).

Table 6. Outdoor healing places clique analysis
No. Members Cohesion index
1 Ttukseom island, Seoul, Han river 63.5
2 Gangneung-si, Gangwon-do, Daegwallyeong 42.333
3 Ante meridiem(A.M.), afternoon, sunday, saturday 42
4 Friday, morning, dinner 31.75
5 Cherry blossoms, spring, picture 27.214
6 Sunday, morning, saturday, dinner 26.526
7 Vacation, summer, family 19.05
8 Halla mountain, Jeju island, winter 17.318
9 Afternoon, sunday, weekend, saturday 15.273
10 Sunday, morning, saturday, weekend 12.923
11 Together, winter, fall(autumn), spring, summer, Jeju Island 12.61
12 Gapyeong-gun, morning, weekend 11.906
13 Sokcho-si, Gangwon-do, weekend 11.906
14 Together, picture, Jeju island, family, walking, fall(autumn) 10.783
15 Sunday, holiday, weekend 10.583
16 Together, weekend, married woman’s parents, dad, mom 10.417
17 Together, older brother, older sister 10.297
18 Together, picture, Jeju island, spring, fall(autumn) 9.766
19 Together, weekend, kid, dad, mom 9.615
20 Together, parents, married woman’s parents 9.525
21 Together, walking, exercise 9.293
22 Together, baby, mom 9.293
23 Together, weekend, married woman’s parents, dad, family 9.191
24 Together, summer, Jeju island, fall(autumn), family 9.191
25 Together, winter, fall(autumn), Gangwon-do 9.164
26 Together, winter, green 8.86
27 Together, picture, Jeju island, family, kid 8.803
28 Together, weekend, kid, Jeju island, family, holiday 8.753
29 Together, picture, baby 8.659
30 Together, weekend, kid, dad, family 8.562
31 Together, parents, kid 8.467
32 Together, weekend, Busan, Seoul 8.4
33 Together, weekend, kid, Jeju island, husband 8.333
34 Together, weekend, Seoul, older sister 8.262
35 Together, weekend, Gyeongju-si, holiday 8.129
36 Together, walking, Jeju island, morning 8.129
37 Together, fall(autumn), family, Gangwon-do 8.129
38 Together, weekend, kid, Jeju island, mom 8.117
39 Together, picture, day 8.106
40 Together, younger brother, family 7.938
41 Together, weekend, day, holiday 7.754
42 Together, weekend, kid, Jeju island, morning 7.716
43 Together, weekend, Seoul, holiday 7.522
44 Together, weekend, Yangpyeong-gun, family 7.522
45 Together, weekend, saturday, morning 7.412
46 Together, weekend, spring, Jeju island 6.72
47 Together, weekend, Gangwon-do, family 6.72
Download Excel Table

상대적인 응집 지수를 나타내는 Cohesion index의 평균은 13.371이며, 최대 응집 지수는 63.5, 최소 응집 지수는 6.72이다. 응집 지수가 높을수록 해당 키워드 간의 관계가 네트워크상에서 강한 연결을 가진다.

사람들에게 가장 강한 연결성을 가진 응집으로 뚝섬-서울특별시-한강이 나타났다. 사람들에게 한강에 위치한 뚝섬유원지가 힐링 장소로써 중요하게 나타남을 알 수 있다. 그 뒤를 이어 강원도 내 강릉과 지리적으로 옆에 위치한

대관령이 연결 정도가 강하게 나타났다. 세 번째와 네 번째 응집은 오전, 오후, 일요일, 토요일 그리고 금요일, 아침, 저녁과 같은 시기적인 키워드들이 나타났다. 또 봄에 벚꽃 사진을 찍는 행위 또한 힐링 장소에서 강한 연결성을 가진 응집으로 뒤이어 나타났다.

함께라는 키워드가 응집 분석에서 출현 빈도가 높게 나타났는데, 이는 전체 문서의 집합에서 응집력이 강한 키워드로서 다른 그룹과의 매개 역할을 수행한다(Kim et al., 2016).

4.4 요약 및 종합 고찰

블로그 텍스트 데이터의 개체명 인식을 통해 옥외 힐링 장소 인식과 특성을 텍스트 마이닝을 활용하여 살펴보았다. 연구 결과의 내용을 요약하자면 다음과 같다.

개체명 인식 결과 옥외 힐링 장소 특성 요소 중 장소적요소, 시간적요소, 사회적요소, 활동요소 비중의 합이 약 85%로 높게 나타났다. 이는 사람들이 힐링을 하기 위한 장소를 방문할 때 인원의 수, 식물, 색상․형태, 심리적요소 보다 어디에, 누구와, 언제 방문을 하고 장소에서 무엇을 하는지가 중요한 것으로 볼 수 있다. 특히 혼자 방문하기보다는 여럿이서 함께 힐링 장소를 방문하며, 가족단위로 힐링을 즐기는 것을 알 수 있다.

세부 개체명 키워드 중에서는 제주도, 함께, 사진, 주말, 가족과 같은 단어들의 출현 빈도가 높게 나타났다. 장소로는 제주도, 시간적으로는 주말, 사회적요소로 가족, 활동요소로 사진의 키워드들이 우세한 것을 알 수 있다. 도출된 요소와 키워드들은 힐링 장소를 계획․설계․디자인함에 있어 활용할 수 있을 것으로 보인다.

키워드를 분석하면서 새롭게 발견한 점은 색상에서 출현 빈도가 높게 나타난 초록과 파랑이 실제 색채 심리 선행연구의 결과와 일치한다는 점이다. 텍스트 마이닝의 결과와 실제 연구 결과의 정합성이 나타나는 것을 볼 수 있었다.

키워드 응집 분석 결과에서는 키워드 간의 네트워크를 볼 수 있었다. 특히 응집 지수가 높게 나타난 뚝섬-서울특별시-한강의 경우 Kaplan and Kaplan(1989)이 주장한 주의회복이론(attention restoration theory)에서 제시한 요소 중 하나인 벗어남(being away)을 볼 수 있다. 뚝섬유원지의 경우 도심 내에 위치하지만 비교적 일상과는 거리가 있는 장소로 도심 속에서 즐길 수 있는 힐링의 공간 혹은 스트레스 해소를 위한 일상의 도피처로 볼 수 있을 것이다. 그 외 강릉, 제주도, 속초, 가평 등 장소는 주로 일상생활 범위에서 벗어난 장소로 볼 수 있다.

연구결과를 종합해 보자면 다음과 같다. 먼저 키워드 분석을 통해 힐링 장소를 조성함에 있어 위 결과에서 나타난 도시, 섬 등 장소적요소와 주말, 가을, 아침 등 시간적요소를 계획 및 마케팅 요소로 활용할 수 있음을 알 수 있다. 가족단위의 방문을 유도해야 하며 어린아이를 고려한 시설의 설계도 고려해야 할 사항 중 하나로 보인다. 사진 찍기, 걷기 등 힐링을 위한 활동 또한 힐링 장소를 조성함에 있어 고려해야 할 사항 중 하나이다.

응집 분석을 통해서는 키워드 간의 응집 네트워크를 토대로 구체적인 내용들의 집합을 파악하여 힐링 장소를 방문하기 위해 어디로, 누구와, 언제, 무엇을 하는지 인식과 구체적인 내용들을 알 수 있었다.

5. 결론 및 제언

5.1 결론

본 연구는 수집된 키워드들을 개체명 인식을 활용하여 힐링 장소 특성 요소들로 유형을 분류해 구체적으로 키워드들을 분석할 수 있었으며, 응집 분석을 통해 구체적으로 응집되는 키워드들을 파악하여 힐링 장소에 대한 인식과 특성을 분석할 수 있었다.

또한 어떤 요소와 키워드가 우세한지, 어떤 지역이 힐링과 관련이 되어있는지, 방문하는 시기와 계절, 시간대는 어떻게 되는지, 나타나는 활동은 무엇인지, 방문하는 인원의 수는 어떤지, 선호하는 식물은 무엇인지 등 파악이 가능하여 힐링 장소 계획 및 설계 과정에 있어 여러 가지 제안이 가능할 것으로 보인다. 개체명 인식과 응집 분석을 통해 나타난 사항들을 기존 계획 및 설계 프로세스에서 함께 고려한다면 힐링 장소 이용자들의 요구를 만족시킬 수 있을 뿐만 아니라 보다 전문적이고 심층적인 힐링 장소의 조성이 가능할 것으로 사료된다.

특징을 정의하기 어려운 콘셉트에 대해 소셜미디어 빅데이터를 활용한 인식과 특성 분석 방법을 사용하여 특징 요소와 인식을 파악해낼 수 있을 것으로도 보인다. 계획․설계․디자인 과정에서도 본 연구의 방법이 도움이 될 것이라 생각된다.

추가로 힐링 장소 연구 중 의료공간이나 산림에 국한되지 않고 이용자들의 일상생활이 이루어지는 옥외 장소를 배경으로 연구를 진행한 점에서도 의의가 있었다.

5.2 제언

연구를 진행하면서 발견한 몇 가지 시사점에 대해 제언을 하고자 한다.

첫 번째로 NIKL(2019)의 연구에서는 기존의 ETRI(한국전자통신연구원) 지침이나 개체명에 대한 기존 연구에서는 개체명은 ‘고유명사’를 대상으로 한다고 되어있는 것을 연구의 문제점으로 지적하였다. 본 연구에서는 일반명사로 분류되어 언급되지 않았지만 고유명사보다 산, 바다, 섬과 같은 일반명사의 출현 빈도가 상당히 많았으며, 이에 대한 개체명 분리가 이루어지지 않아 일반명사를 어떻게 해석해야 하는지에 대한 어려움이 있었다. 특히 사람들은 어떤 공간에 대해 구체적으로 설명하기보단 일반명사를 주로 사용하여 말하는 경향이 있었다. 예를 들면 “힐링하러 바다 보러 갔어요.”라는 식으로 말이다. 따라서 개체명 인식 내에서 일반명사를 해석하는 방법에 대한 논의나 연구가 필요하다.

두 번째로 공원, 관광지, 광장, 놀이터, 유원지 등 다수의 시설 명칭 또한 일반명사로 분류되어 본 연구에서 분석의 대상으로 고려되지 않았다. 특히 공원이나 광장의 경우 국립국어원에서 제공하는 개체명 말뭉치 분류 표에도 포함이 되어 있지 않아 시설 명칭을 반영한 후속 연구의 진행이 필요하다.

세 번째로 이번 연구에서는 힐링 장소의 주제로 특성을 도출하였다. 하지만 만약 다른 연구 주제에 대해 그 특성을 분석하고자 할 때는 개체명을 연구 주제와 관련된 선행연구 고찰이나 기타 방법을 이용하여 각 특성 요소를 다시 재설정해 줘야 하는 점이 존재한다. 하지만 이러한 유형 설정에 대해 체계적인 방법이 연구되고 구축된다면 연구 주제를 바꾸어 다양한 장소, 위치, 시간, 인원, 행태 등에 대한 연구가 가능할 것으로 전망된다.

위 사항들을 고려하여 소셜미디어에 산재되어 있는 수많은 빅데이터를 활용하여 공간적 특성을 분석해 장소의 계획 및 설계 과정에 기여할 수 있는 많은 후속 연구를 기대한다.

References

1.

Chong, W. S., M. Yu, T. K. Kwon and N. G. Kim(2007) Study on the effect of cognitive function by color light stimulation. Journal of the Korean Society for Precision Engineering 24(10): 131-136.

2.

Han, J. Y. and H. B. Kim(2017) A study on the awareness of destination image using social network analysis based on big data. Journal of Tourism Sciences 41(8): 91-119.

3.

Jang, E. H. and J. Y. Cho(2021) A framework of characteristics of physical environment for healing and therapy. Society of Design Convergence 20(5): 17-37.

4.

Jang M. H. and Y. L. Yoon(2016) Research into changes in government policies and public perceptions on camping via analyses of big data from social media. International Journal of Tourism Management and Sciences 31(1): 91-112.

5.

Kaplan, R. and Kaplan, S.(1989) The Experience of Nature: A Psychological Perspective. Cambridge university press.

6.

Kim, H. H., D. G. Kim and J. N. Jo(2016) Patent data analysis using clique analysis in a keyword network. Journal of the Korean Data & Information Science Society 27(5): 1273-1284.

7.

Kim, J. H. and Y. J. Nah(2019) A study on the impact of escapist motivation on on-site experiences, and perceived healing effect. Journal of Tourism and Leisure Research 31(5): 89-108.

8.

Kim, S. Y.(2019) Design types and environmental elements for open space in healing facility environment. Society of Design Convergence 18(5): 19-35.

9.

Kim, S. R., Y. W. Choi and H. Y. Yoon(2019) The analysis of the visitors’ experiences in Yeonnam-dong before and after the Gyeongui line park project-A text mining approach. Journal of the Korean Institute of Landscape Architecture 47(4): 33-49.

10.

Leather, P., D. Beale and L. Sullivan(2003) Noise, psychosocial stress and their interaction in the workplace. Journal of Environmental Psychology 23(2): 213-222.

11.

Lee, S. H. and Y. H. Son(2018) Identifying landscape perceptions of visitors’ to the Taean coast national park using social media data – Focused on Kkotji beach, Sinduri coastal sand dune, and Manlipo beach -. Journal of the Korean Institute of Landscape Architecture 46(5): 10-21.

12.

Malkin, J.(1992) Hospital Interior Architecture: Creating Healing Environments for Special Patient Populations. Van Nostrand Reinhold Company.

13.

Martha M. Tyson.(1998) The Healing Landscape: Therapeutic Outdoor Environments. McGraw-Hill.

14.

Oh, J. Y. and H. K. Park(2019) A study on the healing effect of the design elements of the healing environment from the environmental stress point of view. The Korean Society of Science & Art 37(5): 215-226.

15.

Olds, A. R.(2001) Child Care Design Guide. McGraw-Hill, PO Box 548, Blacklick, OH 43003.

16.

Park, Y. R., Y. O. Kang, D. E. Kim, J. Y. Lee and N. Y. Kim(2019) Analysis of Seoul image of foreign tourists visiting Seoul by text mining with Flickr data. The Korea Society For GeospatIal Information System 27(1): 11-23.

17.

Sung, J. H. and K. J. Lee(2020) A study on directions of Yedang reservoir landscape management through blog text analysis. Journal of Recreation and Landscape 14(3): 9-20.

18.

Ulrich, R. S.(1983) Aesthetic and Affective Response to Natural Environment. In Behavior and the Natural Environment. 85-125. Springer, Boston, MA.

19.

Ulrich, R. S.(1984) View through a window may influence recovery from surgery. Science 224(4647): 420-421.
,

20.

Ulrich, R. S.(1991) Effects of interior design on wellness: Theory and recent scientific research. In Journal of Health Care Interior Design 3: 97-109.

21.

Weng, P. Y. and Y. C. Chiang(2014) Psychological restoration through indoor and outdoor leisure activities. Journal of Leisure Research 46(2): 203-217.

22.

National Institute of Korean Language(2019) Analysis of Named Entity and Corpus Construction.

23.

National Institute of Korean Language(2021) Corpus Research and Analysis 2021: Named Entity Tagging and Entity Linking.