1만명 교사 개인정보 유출한 교육부, 개인정보보호 대책 없으면 AI 디지털교과서 개발 유예해야
AI 디지털교과서 개발과 보급에 관한 기대와 우려가 공존하는 상황입니다. 오픈넷은 AI 디지털교과서 사용이 초래할 수 있는 개인정보유출 문제에 주목해 왔습니다. 아래의 논평은 지난 5월 20일 교육부가 AI 디지털교과서 적용을 위한 교사연수 준비 과정에서 교사들의 개인정보를 '실수'로 유출한 사건에 맞춰 AI 디지털교과서의 개인정보보호 대책을 촉구하기 위해 작성되었습니다.
1만명 교사 개인정보 유출한 교육부, 개인정보보호 대책 없으면 AI 디지털교과서 개발 유예해야
지난 5월 20일, 교육부 주최로 개최된 AI 디지털교과서 적용을 위한 교사연수 준비 과정에서 교육부의 실수로 연수대상자로 선정된 교사 1만 여명의 성명, 학교, 휴대폰 번호가 포함된 개인정보가 유출되는 사고가 일어났다. 방대한 양의 개인정보 수집을 필요로 하는 AI 디지털교과서 개발과 실행의 총책임을 맡고 있는 부처로서 자격미달을 스스로 증명하는 사건이다. 사단법인 오픈넷은 교육부가 AI 디지털교과서의 상용화를 개인정보보호 대책을 완비한 이후로 유예할 것을 촉구한다.
AI 디지털교과서는 서책형 교과서를 디지털화한 것이 아닌 학생과 교사와 학부모가 함께 사용하는 ‘교육용 플랫폼’이다. “AI에 의한 학습 진단과 분석”을 하고 “개인별 학습 수준과 속도를 반영한 맞춤형 학습”을 제공하는 “학생의 관점에서 설계된 학습 코스웨어(Courseware, 교과과정(Course)과 소프트웨어(Software)의 합성어)”로 정의하고 있는 AI 디지털교과서는 공공(교육부와 한국교육진흥원 등)이 제공하는 AI 디지털교과서 포털과 민간(AI 디지털교과서 개발업체)이 제공하는 교과별 AI 디지털교과서 그리고 학습데이터 허브로 구성된다. 포털은 학생과 교사가 디지털교과서로 접속할 수 있는 통로이자, 학생 개인의 교과목과 시간표를 확인할 수 있는 책장이면서, 학생은 개인별 맞춤 학습 지원을 받을 수 있고 학부모는 자녀의 학습현황을 파악할 수 있고 교사가 수업을 설계하고 학생을 지도할 수 있는 통합 대시보드로 기능한다. 통합 대시보드에서 제공하는 정보는 학생이 교과서를 활용하며 학습하는 과정에서 발생하는 학습데이터를 분석한 결과물이다. 학습데이터는 학습데이터 허브로 보내져 민간 개발업체에 의해 데이터 분석과정을 거쳐 포털의 통합 대시보드로 전송된다. 디지털교과서는 학생, 학부모, 교사는 물론 민간 개발업체와 교육부, 한국교육학술정보원 등의 다양한 주체가 접근 가능한 소프트웨어 플랫폼인 것이다. 한국교육학술정보원은 2023년 발간한 「AI 디지털교과서 개발 가이드라인」(이하 가이드라인)에서 디지털교과서의 개발 방향을 “국가적 차원에서 데이터 기반의 교육 의사결정을 가능하게 하는 플랫폼의 기능을 충족함으로써 전체적인 교육의 질 향상에 기여”하는 것이라 밝히기도 했다.
플랫폼으로서 AI 디지털교과서의 핵심 구동 요건은 학생이 학습 과정 중에 생산하는 학습데이터, 즉 개인정보이다. 교과서가 수집할 학습데이터는 학습 시간, 콘텐츠 수행도, 콘텐츠 메타데이터, 학습계획 달성도, 접속시간, 형성평가 성취도, 추가 학습 진행도, 질의응답 정도, 커뮤니티 참여도, 학습 정서, 학생의 전학 등의 항목으로 구성될 것이라 가이드라인은 밝혔다. 가이드라인에 따르면 수집된 학생들의 개인정보는 1. 학생들의 학습 이해도의 특성 분석을 기반으로 현재 수준을 진단하고 개인의 능력, 목표에 맞는 적절한 학습 콘텐츠를 추천하고 학습경로를 제시하기 위한, 2. 학생들의 학습 패턴(관심사, 선호도 등) 및 수준 등을 종합적으로 분석해 적절한 학습 콘텐츠를 제시하기 위한, 3. 학생들의 개념 이해도를 높이기 위한 AI 튜터 기능을 제공하기 위한, 4. 학습 패턴 및 활동 분석으로 추가 학습 요소 등의 맞춤형 서비스를 제시하기 위한 분석 데이터로 활용된다.
디지털교과서로 수집할 학습데이터의 범위와 함께 수집은 최소한을 원칙으로 한다고 가이드라인은 밝히고 있다. 그러나 이번 교육부의 교사 개인정보 유출 사건이 벌어진 이상 AI 디지털교과서가 상용화되었을 때 발생할 수 있는 아동의 개인정보 유출 및 오남용의 가능성을 염려할 수밖에 없다. 교육환경에서 수집되는 아동의 개인정보는 디지털인권과 직결되는 문제이므로 성인의 개인정보보호보다 더 세심한 주의를 필요로 한다. 지난 3월 20일 오픈넷이 제3차 민주주의 정상회의에서 주최한 세션 “AI 디지털교과서 개발 정책의 프라이버시와 감시 이슈”에서 발제를 맡은 정현선 교수는 “AI 디지털교과서의 서비스에 포함된 정보 가운데, 특히 ‘학습 태도’, ‘관심사, 선호도’, ‘학습활동 상태’, ‘학업 정서’ 분석은 교육 환경에서 사람의 감정을 추론하는 AI 시스템을 작동하는 것으로, EU 「인공지능법」에서는 고위험(high-risk)으로 분류되는 민감 정보에 해당”하므로 취급에 각별한 주의를 기울여야 함을 지적했다. 토론을 맡았던 손주은 역시 ‘아동의 신원, 학습 활동, 위치, 의사소통, 감정, 건강, 사회적 관계에 대해 수집한 데이터는 가명화, 익명화 등의 비식별처리를 하더라도 조합을 통해 특정 아동을 정확하게 식별’할 수 있음을 지적했다. 가이드라인에 의하면 디지털교과서는 학습자(는 물론 교사와 학부모)가 디지털교과서 포털에 간편하게 로그인하기 위해 지문과 안면 이미지 역시 수집할 것으로 예상된다.
AI 디지털교과서의 상용화는 필연적으로 정부부처가 민간업체를 통해 국가의무교육의 대상인 전체 아동의 개인정보를 수집하게 될 것임을 뜻한다. 이에 따라 전문가들은 개인정보보호 감시감독 체계가 교과서의 개발과 병행해 수립되어야 하고 그 절차 역시도 투명하게 대중에게 공개되어야 한다고 조언해왔다. 정현선 교수는 위의 발제에서 ‘아동의 개인정보보호를 위한 구체적이고 실효성 있는 시행령 등 법규 마련 및 개발사에 대한 관리 감독과 규제 장치를 마련하고 시행해야’ 하고, ‘이를 위한 조사 연구, 학생과 학부모, 교사 및 일반 국민을 대상으로 한 공청회, 예산과 인력 확보가 시급히 요구’되며, ‘조사 연구와 입법 및 관리 감독은 독립적인 기관에서 시행할 수 있도록 인력 및 예산을 확보’해야 한다고 제언했다. 가이드라인은 한국교육학술정보원을 기술 점검, 기술 관리의 주체로 명시하고 있을 뿐, 구체적인 시스템(소관 부서, 업무 내용, 필수 인력의 수 등)에 관해서는 언급하고 있지 않다. 이번 교사들의 개인정보 유출 사건을 계기로 형성된 국민들의 우려를 잠식시키기 위해서라도 교육부와 한국교육학술진흥원은 디지털교과서가 수집할 개인정보 관리와 감시, 감독 체계에 대한 청사진을 미리 공개할 필요가 있다.
교육부는 AI 디지털교과서의 상용화로 그 역할에 있어 큰 전환을 맞게 될 것이다. 교육부는 개인정보처리자로서 개인정보 및 정보보안 체계를 감시감독할 책임이 있다. 학생과 교사, 학부모의 개인정보가 없이는 구현이 불가능한 AI 디지털교과서의 상용화는 학습 포털에 방대한 양의 학생과 교사, 학부모의 개인정보가 축적되고 가공, 편집 등의 처리가 불가피하다. AI 디지털교과서가 수집하는 개인정보의 양은 지금까지 교육부나 일선 학교가 그간 수집해왔던 정보의 양과 비교하지 못할 양일 것이다. 늘어나는 개인정보의 규모에 따라 교육부의 책임은 앞으로 더욱 강화되어야 것이다. 그럼에도 교육부는 미숙한 업무처리로 1만 여명에 달하는 개인교사들의 민감한 정보를 유출하고 말았다. 이 사건은 교육부가 AI 디지털교과서의 개인정보보호 체계를 감시감독할 능력이 있는가를 근본적으로 의심하게 만든다. 오픈넷은 교육부가 학교 현장을 안심시킬 수 있도록 개인정보보호의 확실한 대책을 마련하고 투명하게 공개하기 전까지 AI 디지털교과서의 개발을 유예할 것을 촉구한다.
사단법인 오픈넷2024년 6월 7일