이슈 리포트
뉴스 데이터에 관한 최신 정보 리포트를 제공하는 공간입니다.
코로나19로 인해 반중(反中) 정서는 심해졌을까?
정치학계의 오랜 연구들에 따르면 일반적으로 인접 국가 간의 인식은 서로 좋지 않은 편이며, 우리나라 역시 예외가 아닙니다. 특히 최근에는 중국에 대한 부정적 인식이 심화되고 있는데요, 한국리서치의 <국가 감정 온도 정기 조사 > 에 따르면, 2021년도 상반기 기준 중국에 대한 평가는 100점 만점에 평균 26.4점으로 북·중·미·일 네 개 국가 중 가장 낮게 나타납니다.
왜 반중 정서를 데이터로 측정할 필요가 있을까?
그래프에서 확인할 수 있듯, 설문 데이터만으로 분석했을 때에는 코로나19가 반중 정서 심화에 특별히 중요한 분기점으로 작용하지는 않은 것처럼 보입니다. 그러나 설문에서 태도(attitude)를 물었을 때와 달리, 평상시의 실제 행동(behavior)에는 이와 다소 차이가 존재할 수 있습니다. 가령 설문에서 중국에 관한 이미지를 ‘다소 부정적’이라고만 평가한 사람이, 평상시에는 중국 관련 인종 차별적인 악성 댓글을 반복적으로 작성하는 사람일 수도 있습니다. 대부분의 사람들에게는 사회적으로 민감한 주제에 대해 자신의 솔직한 의견을 말하기보다는, 좀 더 순화해서 표현하거나 아예 솔직하게 응답하지 않는 사회적 바람직성 편향(social desirability bias)이 존재하기 때문입니다.
온라인 뉴스 댓글을 활용해서 어떻게 반중 정서를 측정했을까? 1) 클릭
설문조사와 달리, 뉴스 포털에서는 유저가 작성한 댓글 이력을 추적 조사할 수 있고, 또 익명화 되어 있다 보니 유저들 역시 자신의 의견을 숨김 없이 작성한다는 특징이 있습니다. 그렇다면 온라인 뉴스에 달린 댓글 분석을 통해 중국 우한에서 시작된 코로나19 감염병 유행이 반중 정서에 어떤 영향을 미쳤는지 살펴보면 어떨까요?
분석을 위해 먼저, 빅카인즈를 활용해 우리나라의 인접 국가인 중국과 일본 관련 키워드 2) 클릭 를 제목에 포함한 기사들을 수집했습니다. 수집한 기사들과 포털 뉴스와의 매칭을 통해 최종적으로 35,536건의 기사를 선택한 다음, 이들 기사에 댓글을 작성한 유저들 중 네이버와 다음 각각 약 1,500명씩 총 2,992명의 유저들의 댓글 이력을 확보했습니다.
예시 문장 | 여성 | 성소수자 | 남성 | 인종 | 지역 | 종교 | 연령 |
---|---|---|---|---|---|---|---|
여자는 집에서 애나 봐라 | 0.86 | 0.01 | 0.03 | 0.03 | 0.01 | 0.01 | 0.01 |
좆족은 21세기의 홍어다 | 0.03 | 0.02 | 0.03 | 0.68 | 0.89 | 0.04 | 0.03 |
너는 전라도 사람이니? | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 |
상폐 한남들 다 재기하라고 | 0.09 | 0.02 | 0.88 | 0.05 | 0.05 | 0.04 | 0.55 |
도심에서 변태성욕 축제라니 말세 | 0.06 | 0.79 | 0.02 | 0.01 | 0.13 | 0.01 | 0.01 |
쉰내나는 태극기들 틀니 압수 | 0.07 | 0.03 | 0.06 | 0.09 | 0.03 | 0.05 | 0.94 |
개독이나 짱깨나 거기서 거기 | 0.05 | 0.03 | 0.02 | 0.84 | 0.09 | 0.92 | 0.05 |
저 친구는 필리핀 출신이다 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 |
쿵쾅이들도 필리핀 그지는 싫지? | 0.74 | 0.01 | 0.04 | 0.71 | 0.02 | 0.01 | 0.01 |
인종 차별 · 혐오 표현 측정의 경우, 혐오표현 분류 알고리즘 HateScore 3) 클릭 를 활용해 그 강도를 측정했습니다. 약 3.5만 개의 댓글들을 학습한 HateScore는 주어진 문장에 포함된 ‘여성’, ‘성소수자’, ‘지역’, ‘인종/국적’, ‘종교’, ‘연령’, ‘남성’ 소재의 혐오발언 비율을 효과적으로 계산할 수 있습니다. 이를 활용한다면 기자나 다른 유저들을 겨냥한 단순 악플은 제외하고 중국과 일본을 겨냥한 인종 차별 · 혐오 댓글만 추출하는 것이 가능합니다.
코로나19 전후 반중 정서는 어떻게 달라졌을까?
분석 결과, 코로나 국내 유입이 시작된 2020년 1월 마지막 주차 이전의 중국 혐오발언 댓글의 평균 비율은 전체 분석 댓글의 25.5%였지만, 그 이후에는 평균 28.3%로 유의미하게 증가(p<.001)가 관찰되었습니다. 특히 조사 시점의 마지막 기간인 2021년 10월에는 중국 혐오발언 댓글이 무려 전체 분석 댓글의 33%를 기록했습니다. 반면 일본의 경우, 코로나 이전에는 혐오발언 댓글의 평균 비율이 전체 분석 댓글의 17.7%, 이후에는 17.2%로 통계적으로 유의미한 차이가 나타나지 않았고, 마지막 한 달 역시 18.3%로 큰 차이가 없었습니다. 즉, 코로나를 거치며 실험군(treatment group)인 중국에 대한 혐오발언은 증가했지만, 대조군(control group)인 일본에 대한 혐오발언은 특별한 변화가 없었습니다. 이에 따르면 팬데믹을 거치며 사람들이 모든 외국인에게 적대적으로 변했다기보다는, 특정국가인 중국에 대한 공격성이 증가했음을 확인할 수 있습니다.
마찬가지로 정치 성향 분류 모델 4) 클릭 을 통해 유저들을 민주당, 중도, 국민의힘 성향의 세 가지 범주로 분류해보니, 정치 성향을 막론하고 모두가 코로나를 거치며 중국에 대한 반감이 증가했다는 사실을 확인할 수 있었습니다. 그리고 코로나 전후 중국 대상 혐오발언 증가율은 국민의힘 성향 유저에게서 가장 크게 나타났습니다. (p<.001)
다만 이러한 분석 결과에 대해서 여전히 의문을 제기할 수도 있습니다. 코로나19가 중국 우한 지역에서 처음 시작되었기에 언론이 중국에 대해 부정적인 뉴스를 많이 작성할 수밖에 없었던 만큼, 독자들의 혐오발언 증가는 기사 공급(supply)의 증가로 인한 자연스러운 결과라고 볼 수도 있기 때문입니다.
그러나 클러스터링 알고리즘을 활용해 기사들을 유형화해 살펴보니, 산업과 경제, 단순 사건·사고, 안보와 국제 정치 등 코로나와 직접 관련이 없는 토픽들에서도 혐오 발언 증가 양상이 나타났습니다. 코로나19를 주제로 한 뉴스의 댓글에서는 본격적으로 코로나가 국내에 확산되자, 오히려 혐오 발언 비율이 감소하는 현상을 볼 수 있습니다. 사람들은 코로나19 확산 초기에는 감염병 원인 제공자로서 중국을 비난하였으나, 국내 감염이 시작된 이후에는 이를 국내 문제로도 인식하기 시작하면서 중국을 구체적으로 겨냥한 혐오발언을 덜하게 되었다고 추측해 볼 수 있습니다.
☞ 분석 세부 설명: 언더스코어 https://bit.ly/3oUDmLc
- 1) 분석 결과에 대한 세부 설명은 https://bit.ly/3oUDmLc 온라인 통계분석 보고서 참조
- 2) ‘중국’, ‘일본’, ‘中’, ‘日’, ‘한일관계’, ‘한중관계’, ‘한·중’, ‘한·일
- 3) https://github.com/sgunderscore/hatescore-korean-hate-speech/
https://minvv23.notion.site/Korean-Online-Hate-Speech-Dataset-for-Multilabel-Classification-Kang-TaeYoung-et-al-2022-8741bbf544d148339fa6e21842b3d6b8 - 4) https://ojs.aaai.org/index.php/ICWSM/article/view/18059