Slowalk Datalab

Navigate back to the homepage

헤드라인으로 분석하는 코로나19 타임라인

Datalab
June 5th, 2020 · 3 min read

설 연휴를 앞둔 2020년 1월 20일, 국내 첫 신종코로나바이러스 확진자가 발생하였습니다. 현재(2020.06.01 기준) 국내 확진 11,503명, 사망 271명, 국외 확진 6,092,816명, 사망 371,655명을 기록하면서 삶의 근간을 바꾸고 있는 코로나19 팬데믹의 지난 5개월을 헤드라인을 통해 돌아보고자 합니다.

분석에 사용된 데이터는 빅카인즈를 통해 수집되었습니다. 2020년 1월부터 5월까지의 기사를 대상으로 “코로나”를 키워드로 검색하여 총 169,704개의 기사를 수집하였습니다. 중앙지인 조선일보, 중앙일보, 동아일보뿐 아니라 매일경제, 한국경제 등의 경제지, 지역 종합지와 방송사, 전문지를 합쳐 총 54개 언론사의 기사를 대상으로 1월 6,857개, 2월 43,555개, 3월 45,350개, 4월 37,886개, 5월 36,056개 기사가 수집되었습니다.

수집된 기사의 제목만을 추출하여 KR-Word Rank 알고리즘*을 적용하였으며, 도출한 월별 키워드를 워드 클라우드로 나타내어 코로나 사태의 주요 변화를 살펴보았습니다.

월별 키워드 순위



순위1월2월3월4월5월
1신종신종확진극복확진
2우한확진극복지원포스트
3중국중국마스크확진극복
4폐렴확산지원한국지원
5확진대구대구정부이태원
6바이러스마스크확산위기시대
7확산감염기부총선대통령
8감염우한대응온라인경제
9대응환자방역경제감염
10마스크대응신천지대통령한국
11비상지원성금마스크정부
12발생정부정부대응클럽
13국내사망감염1분기방역
14환자바이러스한국대구등교
15정부신천지연기감염위기
16교민방역우한방역개최
17전세기연기피해피해대응
18공포추가전달기부온라인
19우려한국사망트럼프확산
20WHO취소위기사망1분기
21사망피해추경긴급마스크
22연기발생추가성금트럼프
23입국입국긴급지급서울
24격리지역트럼프세계중국
25취소격리환자전달이후
26대통령비상대통령사회적기업
27한국방문비상이후추진
28긴급대통령서울포스트기부
29방역우려중국위한세계
30중단국내발생기업지역

--
붉은색 글씨는 순위가 하락하는 주요 키워드
파란색 글씨는 순위가 오르내리는 주요 키워드
초록색 글씨는 순위가 오르는 주요 키워드

*KR-Word Rank 알고리즘 : Word Rank 알고리즘은 Kim, H. J., Cho, S., & Kang, P. (2014)에서 제안된 알고리즘입니다. 정제되지 않은 텍스트에서 단어를 추출하기 위한 알고리즘으로 chen et al.(2011)의 연구에서 일본어, 중국어를 대상으로 제안한 아이디어를 한국어에 맞춰 적용한 것입니다. 단어를 추출하기 위한 알고리즘이지만, 문서 내의 빈도를 기반으로 하고 있어 상위 랭크일수록 학습 대상 문서 전체의 주제와 연관성이 높다고 판단하였습니다.
검색 키워드인 `코로나`는 결과에서 제외하였습니다.

1월 신종 코로나바이러스

jan-wordcloud-in-keyword-covid19

상위 5개의 키워드는 신종, 우한, 중국, 폐렴, 확진입니다. 아직 코로나바이러스 감염증-19(COVID-19)라는 정식 명칭이 발표되지 않았던 1월에는 우한폐렴이 상위에 랭크되었습니다. 발원지로 추정되는 중국도 상위에 자리를 잡고 있습니다. 감염대응, 마스크, 비상, 국내 등의 키워드가 발견되며 그 뒤를 교민정부, 전세기가 잇따르고 있습니다. 전세기를 통한 교민의 입국이 화제의 중심이었다는 것을 알 수 있습니다. 전세기교민, 공포 그리고 WHO는 1월에만 상위 키워드로 등장하고 이후에는 상위 30위권 내에 등장하지 않습니다. 공포는 최소 코로나19 사태 발발 시 사람들의 심리를 드러내 줍니다. 이후 이 키워드가 상위권에 랭크되지 않았다는 것은 그만큼, 코로나19에 대한 최초의 공포와 패닉이 수습되고 그에 대한 대처를 차분히 해나갔다는 증거일 것입니다. WHO에 대한 언급이 시간의 흐름에 따라 상대적으로 적어진 것은 이번 코로나19 사태에서 세계보건기구(WHO)의 역할이 미흡했기 때문일까요? 1월의 기사에는 연기, 취소, 중단, 긴급과 같이 예기치 못했던 상황에 대한 대처와 관련된 단어가 상위 키워드로 랭크되었습니다. 연기, 취소는 2월에도 상위에 랭크되었으며 3월 연기가 15위에 랭크되며, 도쿄올림픽 개최 연기 확정에 따르는 것으로 보입니다.

2월 늘어나는 확진자

feb-wordcloud-in-keyword-covid19

2월 18일에 31번 확진자가 신천지 교인으로 밝혀졌습니다. 전체 확진자 중 대구 지역 확진자의 비율이 59.8%를 차지하는 원인이 되기도 한 이 사건이 키워드를 통해서도 드러납니다. 2월 중순 이후 벌어진 사태임에도 5위에 대구가 랭크되었으며, 신천지는 15위에 랭크되었습니다. 1월에 10위를 기록했던 마스크는 6위로 올라서면서, 수급이 불안정했던 당시의 상황을 보여주고 있습니다.

3월 극복

mar-wordcloud-in-keyword-covid19

3월부터 새롭게 등장한 키워드는 극복으로 2위를 기록하였습니다. 공포, 우려 등 부정적인 어휘가 다수 등장했던 1, 2월과 달리 긍정적인 방향으로 변화하기 시작했다는 것을 알 수 있습니다. 3월 5일에 마스크 5부제가 등장하면서 마스크가 3위의 키워드가 되기도 하였습니다. 대구의 신천지 교인 집단 감염 사태를 수습하고 진정하기 위한 노력이 이어졌던 가운데, 대구, 기부, 성금, 신천지 등의 키워드가 10위 안으로 랭크되었습니다. 또한 코로나19 사태의 장기화가 전망되면서 경제를 살리기 위한 추경, 긴급 등의 키워드가 등장하기 시작하였습니다. 지역별 긴급 재난지원금 신청이 시작되면서 지원대응 같은 키워드 역시 새롭게 등장하였습니다. 신천지로 인해 급속도로 확진자 수가 증가하였던 국내의 사정이 진정되는 한편, 북미와 유럽의 확진자 수가 증가하면서 트럼프 대통령도 키워드로 등장하기 시작합니다.

4월 경제 지원

apr-wordcloud-in-keyword-covid19

4월에는 긴급재난지원금이 첨예한 이슈로 떠오르면서 지원이 2위 키워드가 되었습니다. 이에 따라 지급이라는 키워드도 4월에 유일하게 랭크됩니다. 이는 4월 15일 치러진 총선의 영향으로 각 당의 정책적 핵심 논의 사항이 되었고, 한국정부가 높은 순위를 기록하게 되었습니다. 또한 연기되었던 초중고의 개학이 온라인을 통해 4월 9일부터 순차적으로 시행되면서 온라인도 새롭게 키워드로 등장하였습니다. 3월 22일부터 시작되어 연장된 바 있는 사회적 거리 두기의 완화 여부가 논의되면서 이후포스트가 키워드 순위에 진입합니다. 코로나19에 대한 긴급한 대응을 넘어서 코로나19로 인해 야기된 변화를 어떻게 받아들일지에 대한 논의가 시작된 시점이라고 볼 수 있습니다. 포스트 코로나는 사람들 간의 대면 접촉을 피하는 언택트 문화, 원격교육 및 재택근무의 도입으로 일어난 혁신적인 사회 변화 현상을 말합니다.

5월 포스트 코로나

may-wordcloud-in-keyword-covid19

5월에는 꾸준히 30위 안에 들었던 대통령이라는 키워드가 7위를 차지했는데요. 문재인 대통령은 5월 10일 취임 3주년을 맞이해 대국민 특별연설에서 “선도형 경제로 포스트 코로나 시대를 개척하겠다.”고 밝혔습니다. 이런 흐름이 키워드에도 반영되어 포스트가 2위를 기록하였으며 시대라는 말이 새롭게 차트에 등장함과 동시에 경제의 중요도가 상승하였습니다. 4월의 1, 2위 키워드였던 극복지원 역시 여전히 상위에 있습니다. 진정 국면에 들어서는 것처럼 보였던 코로나19가 5월 황금연휴 이후 급격한 확산세를 보였는데요. 5월 6일에 확진이 된 용인 66번 확진자가 방문하면서 지역감염의 확산의 주된 원인으로 지목된 이태원 클럽 관련 키워드가 상위에 자리를 잡게 되었습니다. 개학이 미뤄지면서 관련 키워드인 온라인등교가 높은 순위를 기록하였습니다. 또한 기업인에 한해 출입국 제한을 해제하고자 하는 논의가 국가 간에 진행되면서 이 또한 키워드로 떠오른 것을 확인할 수 있습니다.

마치며

코로나19 이후 너무나 많은 것이 변화하고 있습니다. 백신과 치료제에 대한 뉴스가 심심치 않게 흘러나오고 있지만, 개발이 언제 성공할지는 알 수 없습니다. 우리는 코로나19와 함께하는 포스트 코로나 시대를 살아가게 된 것입니다. 코로나19로 인한 변화를 지속적으로 관찰하면서, 이러한 변화를 받아들이고 더 나은 방향으로 이끌어갈 수 있도록 해야 합니다.

<시사IN>과 KBS에서 공동으로 기획한 기사는 한국의 포스트 코로나 시대를 짚어주고 있습니다. 성공적이라는 평가를 받고 있는 한국의 코로나19 방역은 과연 일부의 시선처럼 순응적이고 수직적인 문화로 인해 효과적이었던 걸까요? 이 조사 결과를 보면 민주적 시민성이 높은 사람일 수록 방역 참여 점수가 높았습니다. 귄위주의나 순응 성향, 집단주의는 방역 참여 점수 및 통계에서 유의미한 결과를 보여주지 않았다고 합니다.

한편 신뢰도에 있어서, ‘한국 국민’에게는 상승(+21)했고 ‘낯선 사람’에게는 하락(-36)했음을 알 수 있습니다. 그런데 ‘한국 국민’과 ‘낯선 사람’은 서로 얼마나 다른 집단일까요? 나와 너, 우리와 너희를 구분하는 것이 얼마나 가능할까요? 적어도 그런 분리와 타자화가 우리 모두에게 또다른 위협이 된다는 것을 우리는 알고 있습니다. 코로나19 국면과 더불어 ‘공동체’에 대한 정의가 더욱 깊고 넓어지길 바라 봅니다.

의견 보내기

작성 | 슬로워크 데이터랩

© 2020 Slowalk