인스타를 돌아다니던 중 흥미로운 게시글을 봤다. 여러분들은 이 이미지를 보면 무슨 생각이 드는가? ‘아, 확실히 한국 이제 결혼 안하는구나’ 생각이 드는 게 자연스럽다. 실제로 내가 본 게시글에서도 출생연도별 혼인 비중을 나타내는 그래프를 통해, 89년생에 비해 92년생의 혼인 비중이 절반도 채 안된다는 우려를 낳고 있었다. 그래프의 출처는 통계청의 데이터를 뉴시스 기사의 형태로 가공한 것으로, 덧글에서 많은 사람들은 혼인을 왜 하지 않는가에 대해 여러 이야기를 늘어 놓으며, 결혼하기 힘든 대한민국의 현실을 지적했다.
하지만 난 그래프를 보며 ‘이 정도인가?’라는 의심부터 들기 시작했고, 천천히 하나 하나 따져보며 이 그래프가 다소 과장하고 있는 부분이 있음을 알게 되었고, 실제로 보아야 할 통계를 따로 살펴보게 됐다.
92년생 남성, 아직 결혼을 준비할 나이
먼저 든 생각은, 지금 한국의 평균 초혼 연령(처음 결혼하는 연령)이 생각보다 높다는 점이다. 이번 글에서는 대한민국 정책브리핑에서 발표한 자료를 많이 참고했는데, 2023년 기준 평균초혼연령은 남자 34.0세, 여자 31.5세다. 통계청의 통계는 만나이를 채택하므로, 2023년 기준 만 34세는 1989~1990년생이다. 즉, 평균적으로 1992년생 남성은 인생에서 결혼을 하더라도, 2023년에 아직 결혼하지 않은 사람이 더 많다. 92년생 남성의 혼인율은 아마 위 그래프에 나온 15%보다 더 증가할 것이다.
시간이 지남에 따라 세대별 혼인율이 올라가는 건 89년생 남성도 마찬가지다. 2023년 나이대별 혼인율 비중을 보면, 남성의 혼인은 만35세를 넘어서도 꽤 많이 이루어지고 있다. 2023년 전체 혼인 중 만35세 이상에서 이루어지는 비중은 약 38%이다. 연령대가 높아질수록 재혼의 비중이 높아진다는 점을 감안해도, 특정 세대의 초혼율을 제대로 측정하기 위해선 그 연령대가 40대 후반이 될 때까지는 통계를 보아야 한다. 여성의 경우에도 2023년 기준 만 31.5세이려면 1991~1992년생이어야 하므로, 맨 처음 그래프에서 나타났던 29.5%보다 이후 몇 년 동안 혼인 비중이 더 많이 늘어날 것으로 예상된다.
진짜로 보아야 할 것은 ‘조혼인율’, 그리고 출산율과의 연관성
그렇다면 한국의 혼인율은 문제가 없을까? 그렇지 않다. 방금 분석한 그래프가 통계적 오류를 범하기 좋아 비판하였을 뿐이지, 실제로 한국의 혼인율은 10년 동안 크게 감소하고 있다. 이제부터 살펴볼 ‘조혼인율’은 1000명 당 혼인한 건수로, 쉽게 말해 ‘인구 대비 혼인율’이다.
통계를 살펴본 결과, 조혼인율은 6.4에서 3.8로 변화하였으며, 10년 전에 비해 약 40.6% 감소했다. 2021-2023년 동안 더 감소하지 않은 것이 그나마 다행이라고 말할 수 있을 정도로 조혼인율은 꾸준히 감소하고 있다.
사회적으로 더 큰 문제로 제시되고 있는 출산율 추이와 비교해보고자 국가지표체계의 합계출산율 통계청 데이터도 가져와 함께 그래프를 그려보았다. 비혼인 출산 등 출산의 형태가 다양해지고 있다고 하더라도 결혼한 부부가 아이를 낳는 출산율이 가장 높기 때문에, 출산율과 혼인율은 항상 큰 상관관계가 존재할 것이라고 쉽게 추측할 수 있다. 합계출산율은 10년 간 39.5% 감소하며 조혼인율과 비슷하게 감소하였다. 다만, 최근 3년 간 조혼인율은 비슷한데 비해 합계출산율은 꾸준히 감소하고 있는데, 이런 추세가 지속된다면 혼인율 감소 외에 출산율에 영향을 미치는 다른 원인을 주목해야 할 것이다.
특정 자료를 분석하거나 뉴스를 접할 때, 통계와 그래프를 항상 천천히 생각해보고 의심할 수 있는 힘을 시민들이 더 길러낼 수 있길 바란다. 또한, 기자를 포함해 정보를 생산하는 사람들 역시 특정 기관이 제공하는 데이터와 해석을 의심하지 않고 그대로 사용하는 것도 자제해야 할 것이다
코멘트
8@라라라 모든 통계는 자의적으로 해석되어서는 안됩니다. 어떻게 해석을 시작할지는 연구자의 자의가 들어 가 있지만, 이를 검증하는 것은 객관적이어야 합니다. 사람의 감정 등이 아니니까요(사람의 감정마저 객관적으로 검증하는 기법을 연구하는 곳이 심리학이라고 알고 있지만요). 더욱이, 기사에서 이야기하는 것과 연도별, 시계열로 나타나는 추이는 완전히 다른 이야기입니다. 연도별 합계출산율이 감소한 것은 이미 일어난 상황을 토대로 이야기하는 것이고, 기사에서의 그래프는 아직 일어나지 않은 일을 일어났다고 보고 그래프를 그린 것이니까요.
말씀하신 내용이 맞으려면 최소한, 단순 통계가 아니라 여러 통제변수를 함께 고려한 여러 가지 회귀분석이나, 제가 직접 잘 하지는 못하지만 머신러닝을 이용한 추정 기법이 들어가야 합니다. 그렇게 하는 경우에도 어디까지나 확률적 추론에 불과한 것이지, 이미 확실히 발생한 통계와는 다른 이야기를 하는 것은 변하지 않습니다.
모든 통계적 그래프는 자의적으로 해석될수 있습니다만
저 80년대 ~ 90년대 생 혼인률 그래프로 낼수있는 결론이 딱히 잘못됬다고 생각되어 지진않네요 시간이 지나면 당연히 그 해당년도생의 혼인률은 올라가긴 하겠지만 시계열 그래프로 보나 저 년생별 혼인률 그래프로 보나 낼수 있는결론은 거의 동일하지않나요 ?
굳이 저게 잘못된 통계적 수치라고 생각되어 지지않는데 기사의 뉘앙스가 저건 잘못됬다는 식으로 표현됬다는건 이상하다고 생각합니다.
@도란 저 역시 항상 같은 다짐을..!
@오동운 저도 이런 걸 보고 쓰는 걸 좋아해서, 기회가 된다면 더 올리겠습니다 ㅎㅎ 대학원에서도 제가 그래프 해석 능력만큼은 자신이 있었죠
@jay_kim 통계나 그래프에 속지 않기 위해 참고할 책...을 제가 따로 알고 있지는 않습니다 ㅠ 뻔한 이야기지만 결국 비판적 사고를 기를 수 있는 좋은 문헌과 교육이 필요할 것 같습니다. 아니면 해당 주제로 제가 간단한 글을 써볼까요(해야 할 일도 안하는 저란 녀석은 딴짓이 재밌습니다)
@오늘은 맞습니다. 거짓 정보는 아니지만 그렇다고 현상을 사실적으로 보는 데는 방해가 되는 기사기도 하죠. 그래도 저는 기성 언론사에 계시는 분들 중 꼼꼼하게 체크하는 분들, 그리고 데이터 저널리즘을 실천하는 분들도 많다고 생각하기도 합니다. 물론 저도 기회가 되면 항상 더 신경을 써줘야겠죠.
@쑥쑥 감사합니다 ㅎㅎ 팩트체크를 2회 진행해본 입장에서, 팩트체크 컨텐츠로 쓸까 저 역시 고민을 했는데, 특정 정치인이나 기관이 말한 내용이 아니라 시사성이 조금 부족하다고 판단, 독립컨텐츠로 쓰기로 했습니다 ㅎㅎ
팩트체크 라벨 붙여드리면 좋을 것 같은 글이었습니다.
숫자만이 아니라 사회적 맥락을 봐야한다는 것! 잊지 않겠습니다.
뉴시스 기사가 만들어지게 된 배경엔 본문에서 지적해주신 것처럼 '출생률 저조 현상 부각'이 있을 것 같네요. 아무래도 초점을 하나에 맞추다보니 다른 관점은 놓치게 된 것 같고요. 폭넓게 보고 여러 데이터를 활용하려는 시도가 과거에 데이터 저널리즘이 유행하면서 일부 있었는데 한국 언론에 잘 정착한 것 같진 않다는 생각도 듭니다. 그래서 이런 글이 더 의미있는 것 같기도 하고요.
통계, 그래프가 사실관계를 의도적으로 왜곡하기 좋은(?) 툴인 것 같아요. 그런데 시민들은 매번 그런 사실관계를 파악하기는 어렵다고 생각합니다. 혹시 통계나 그래프에 속지 않기 위해 참고할만한 책이 있을까요? 추천해주시면 감사하겠습니다.
저도 가장 먼저 보이는 그림을 보자마자 음?! 하는 생각을 했어요. 잘 정리해주셔서 감사합니다. 앞으로도 이런 글들은 많이 보고 싶네요! (약간 탐구력 기르기 같은...!! ㅋㅋㅋ)
연도에 따른 조혼인율 그래프를 보니 더 확실히 와닿네요. 그리고 덕분에 그래프를 볼 때 유심히, 비판적으로 생각하며 봐야된다는 걸 다시 한 번 다짐하고 갑니다 ㅎㅎ