데이터 접근 권한과 활용 방식을 결정하는 데이터 거버넌스
[스터디 노트3] 데이터 접근 권한과 활용 방식을 결정하는 데이터 거버넌스
빠띠는 ‘데이터로 사회문제를 해결하는 시민의 데이터 플랫폼’을 구축하기 위해 다양한 공익데이터 활동을 진행하고 있습니다. 이는 여러 파트너와 이해관계자와 협력하여 만들어가야 하는 중요한 작업입니다. 그렇기에 공익을 위한 데이터 활동이 무엇인지, 그리고 새로운 인공지능 서비스가 끊임없이 등장하는 시대에 왜 사회문제와 관련된 데이터를 논의해야 하는지에 대한 심도 있는 논의가 필요합니다.
이러한 취지에서 빠띠는 ‘인공지능 시대, 데이터 액티비즘과 거버넌스'라는 주제로 스터디를 진행하고 있습니다. 이 스터디는 기술과 사회혁신 두 분야에서 연구 및 국제협력 경력을 보유한 김정원 박사의 발제로 총 4회에 걸쳐 진행되며, 데이터와 시민의 역량, 데이터 액티비즘의 개념, 그리고 데이터의 생산, 관리, 공유를 둘러싼 거버넌스 유형 등 국내외 인공지능과 데이터 관련 주요 이슈를 다룹니다.
스터디를 통해 얻은 핵심 내용을 요약하여 더 많은 분들과 나눔으로써 공익데이터 활동에 대한 이해를 넓히고, 사회문제 해결을 위한 데이터 활용의 중요성을 공유하고자 합니다.
네 줄 요약
빅테크 기업의 독점화와 함께 개인 정보와 데이터 권리 보호의 필요성이 더욱 중요해지고 있다.
데이터 공유 과정에서 발생하는 기술적, 법적 이슈를 다루기 위해 다양한 데이터 중개 모델이 필요하다.
데이터 거버넌스는 데이터의 소유권과 관리 방식을 규정하며, 소유 주체와 활용 방식에 따라 다르게 설계된다.
데이터 거버넌스 모델 중, 데이터 신탁과 협동조합은 빅테크 기업 중심의 데이터 소유 구조의 한계를 극복하고, 개인의 데이터 권리보호와 데이터 가치 극대화를 목표로 제안된 모델이다.
왜 데이터 거버넌스가 필요한가?
매일 방대한 양의 데이터가 생성되고, 수집되고, 분석되어 일상생활, 비즈니스 결정, 정책 수립 등 사회 전반에 큰 영향을 미치기 시작. 이와 함께 ‘데이터를 누가 소유하고 어떻게 관리해야 하는가’에 대한 질문이 중요해지면서 데이터 거버넌스 개념이 등장함.
데이터는 접근성과 규모, 사용 가능성에 따라 다양한 형태로 존재함. 비공개 데이터부터 누구나 자유롭게 사용할 수 있는 데이터까지 다양하며, 그리고 이 두 범주 사이에도 여러 형태의 데이터가 있음. 이러한 다양성으로 인해 데이터의 성격과 목적에 따라 다른 관리 방식이 필요함. (이미지 출처: Open Data Institute)
데이터 공유에 있어서 당면한 과제
데이터 공유에 따른 인센티브 부족: 데이터 보유자와 이용자 간 이해관계 차이로 인해 데이터 공유가 무의미해지며, 공유에 소용되는 비용에 비해 얻는 인센티브가 적음.
전문 지식 부족: 데이터 보유자는 데이터의 유용성을 잘 알지 못하는 경우가 많으며, 데이터 이용자는 어떤 데이터를 이용할 수 있는지 파악하기 어려움.
비즈니스/윤리/브랜드 명성에 위험: 데이터를 비윤리적으로 사용할 경우, 비즈니스 신뢰와 브랜드 명성이 위험해질 수 있음.
법규 준수: 개인정보보호 및 지적재산권 관련 법규를 위반할 우려로 인해 데이터 공유 자체를 포기할 수 있음.
데이터 접근 및 공유 비용: 데이터 공유를 위한 인프라 구축, 데이터 표준 마련, 과도한 데이터 접근으로 인한 비용 부담이 발생.
공공 이익을 위해 데이터를 활용할 기회 상실: 데이터 공유가 활발하지 않을 경우, 데이터로부터 발생하는 경제적 가치나 사회적 이익을 충분히 누리지 못할 수 있음.
데이터 중개자라는 새로운 역할의 등장
데이터의 복잡성과 수요가 증가하면서, 데이터의 수집, 관리, 공유, 활용을 돕는 중간자로서 '데이터 중개자'라는 새로운 역할이 중요해짐.
데이터 중개모델은 다양한 형태로 존재하며, 데이터 활용과 유통을 촉진하여 가치를 극대화하면서도 개인의 권리를 보호하는 역할을 함.
다양한 데이터 중개모델 유형
데이터 교환(Data Exchange): 데이터 거래소를 통한 데이터 이동, 교환을 촉진하는 플랫폼(예: AWS Data Exchange,Databroker DAO, Streamr)
데이터 관리자(Data Custodian): 민감한 데이터를 자체 개발한 환경에서 안전하게 관리하고 공유하는 역할을 하는 시스템(예: Open Safely, Genomics England, Open Banking Pensions Dashboard)
산업별 데이터 플랫폼: 특정 산업 내 데이터 공유를 위한 인프라를 제공하는 플랫폼(예: APROCONE(Advanced Product Analysis Environment), MK Data Hub)
데이터 협업(Data Collaborative): 데이터 공유와 협력을 통해 공동의 목적을 달성하는 모델(예: GovLab 데이터 협업, SharedStreets, BrightHive)
개인정보관리 시스템(PIMS): 데이터 주체가 개인 데이터를 직접 통제하고 관리할수 있도록 지원하는 시스템(예: digi.me, Solid)
데이터 신탁(Data Trust): 신탁법에 근거하여 데이터 접근과 사용을 관리하며, 데이터 주체의 권리를 보호하는 신뢰 기반의 중개 모델(예: Data Trust UK, Open Corporate, Food Data Trust, Jersey Cycle Data Trust)
데이터 협동조합(Data Cooperative): 데이터 생산자들이 모여 데이터를 공동으로 관리하고, 그 가치를 공유하는 협동조합 모델(예: Manchester Data Coop, Drivers’ Seat, Salus Coop, MIDATA)
데이터 거버넌스는 데이터 공유 및 개인정보 보호의 중요성과 관련이 있다.
현재 대부분의 데이터는 구글, 메타, 아마존 등 빅테크 기업에 의해 수집되고 관리되고 있음. 일반적으로 개인은 이러한 기업의 서비스를 이용하는 대가로 개인 데이터를 제공하게 되며, 그 결과 기업은 방대한 양의 개인 데이터를 보유하게 됨.
이러한 모델에서는 개인이 자신의 데이터에 대한 소유권과 통제권을 상실하고, 데이터의 가치가 소수의 기업에 집중되는 문제가 발생함.
페이스북, 아마존, 구글 등의 빅테크 기업들의 데이터 경제 모델을 설명하는 다이어그램. 사용자는 플랫폼의 무료 서비스를 제공하는 대가로 개인 데이터를 제공하며, 플랫폼은 이를 광고 수익으로 연결하는 구조. 데이터를 통한 타겟팅된 광고료가 빅테크 기업의 주요 수익원이 됨.(참조: Mills, S. (2020), “Who owns the Future? Data Trusts, Data Commons and the Future of Data Ownership”)
이러한 문제를 해결하기 위해, 데이터의 접근과 활용 조건을 명확히 하고, 데이터를 집단적으로 활용할 수 있는 새로운 데이터 거버넌스 모델이 제안되고 있음.
데이터 거버넌스는 다음과 같은 내용을 포함
데이터에 누가 접근할 수 있는지, 어떤 조건하에 데이터를 이용할 수 있는지, 그리고 데이터 활용의 혜택이 누구에게 돌아가는지에 대한 의사결정 구조
데이터 생성자와 이용자 간의 이해관계 차이와 관련 기술 및 법규 관련 지식의 비대칭을 해결하기 위해 전문적 지식과 노하우를 가진 중재자의 필요성
데이터 이용 시 법규 준수 여부를 관리하고, 데이터 이용에 따른 인센티브 제공 구조를 마련하는 것의 중요성
이와 관련하여 주목받는 데이터 거버넌스 모델로는 데이터 신탁과 데이터 협동조합이 있음. 이 두 모델 모두 개인 데이터 보호와 데이터 가치 극대화를 목표로 한다는 점에서 공통점이 있음.
데이터 거버넌스 모델로서 데이터 신탁 vs. 협동조합
데이터 신탁/협동조합의 기본 구조 (참조: Mills, S. (2020), “Who owns the Future? Data Trusts, Data Commons and the Future of Data Ownership”)
데이터 신탁
데이터 협동조합
조직형태
신탁법에 기반한 신뢰할 만한 데이터 중개 서비스 모델
법적 조직으로 정관에 의해 거버넌스 체계가 정의되는 협동조합 모델
의사결정 구조
신탁법에 의거하여 다수의 위탁자(데이터 생성자/제공자) 집단이 자신의 데이터 권리를 수탁자(데이터 중개서비스)가 행사할 수 있도록 위임
데이터 권리행사의 주체인 조합원이 자발적으로 데이터를 제공하며, 1인 1표의 투표로 집단적 의사결정
운영비 조달 방안
공공자금, 민간재단 지원기금, 데이터 이용료
조합원의 출자금, 데이터 이용료 또는 기타 수익 모델을 통한 자금 충당
데이터 자산
수탁자의 가입 및 탈퇴에 따라 데이터 규모가 변동됨
조합원의 가입과 탈퇴에 따라 데이터 규모가 변동됨
4-1. 데이터 신탁(Data Trust)
데이터 신탁은 데이터를 생성하거나 소유하는 그룹(이하, 위탁자)이 수탁자와 계약을 맺어, 데이터 사용의 범위와 목적을 명확히 정하는 데이터 관리 모델
예를 들어, 다수의 개인이 데이터 신탁을 만들어 자신의 건강 데이터를 공공 의료 목적에만 사용할 수 있도록 설정할 수 있음. 수탁자는 목적에 맞도록 데이터의 안전한 이용을 보장하는 데이터 전문가나 변호사가 포함된 그룹이 될 수 있음.
데이터 신탁의 구조
위탁자와 수탁자 간의 계약은 법적 구속력을 가지므로, 한 번 계약이 체결되면 위탁자가 추가적인 동의 없이도 명시된 범위 내에서 데이터 활용을 결정할 수 있음.
데이터 신탁의 주요 특징
독립적 거버넌스: 수탁자는 독립적인 판단을 통해 위탁자의 이익을 보호하기 위한 결정을 내림
명확한 목적과 수혜자 설정: 데이터의 사용 목적과 사용에 따른 이익을 받을 대상이 명확히 정의됨
투명성과 책임성: 수탁자의 모든 결정과 행동은 투명하게 공개되며, 이에 따른 책임을 짐.
데이터 신탁의 장점
데이터 비전문가도 자신의 데이터를 공익적 목적으로 안전하게 활용하면서 체계적으로 데이터 집단적 가치를 극대화할 수 있음.
데이터의 독립적 운영을 통해 개인의 데이터 보호를 강화할 수 있음.
이해관계 충돌이 발생할 경우, 수탁자와 각 분야의 전문가가 이를 조율하고 해결할 수 있음.
[참고] 영국과 한국의 신탁법
영국의 신탁법은 광범위한 자산을 보호할 수 있는 법적 틀을 제공해 데이터와 같은 비전통적 자산도 신탁의 보호 대상이 될 수 있으나, 한국의 신탁법은 주로 부동산이나 금융 자산에 한정되어 있어 신탁의 적용 범위가 상대적으로 제한적.
4-2. 데이터 협동조합
전통적인 협동조합의 원리를 데이터 분야에 적용한 모델로, 데이터 생산자들이 모여 데이터를 공동으로 관리하고 그 가치를 공유함.
데이터 협동조합의 핵심 요소는 커뮤니티와 조합원으로, 조합원은 데이터 생성자, 이용자, 수집자일 수 있음.
[관련 사례] MIDATA 협동조합
2015년 스위스 ETH 취리히와 베른대 연구팀이 설립한 데이터 협동조합으로 개인이 자신의 건강 및 의료 데이터를 직접 관리하고, 의료 연구나 프로젝트에서 사용할 수 있도록 허가할 수 있는 데이터 공유 플랫폼을 제공함.
특징
사례) 돌봄 간호사의 감정, 스트레스 수위 측정 앱, 인지기능 데이터 측정앱, 알레르기 증상 모니터링 앱 등
개인이 MIDATA 플랫폼에 자신의 의료 데이터를 저장하고, 연구 프로젝트나 관련 기관이 데이터를 활용할 수 있도록 동의 여부 결정이 가능
조합원들은 데이터 활용에 대한 의사결정 과정에 참여할 수 있는 민주적 거버넌스 구조. 총회를 통해 데이터 사용의 윤리적 기준을 설정하고, 데이터 활용이 공익을 위해 이루어질 수 있도록 보호
유럽의 GDPR(일반 개인정보보호법)을 준수하여 데이터 주체가 언제든지 자신의 데이터에 접근, 이동, 삭제할 수 있는 권리를 보장. 데이터는 암호화되어 외부 접근으로부터 보호하는 시스템 운영.
건강 관련 앱 개발이나 연구 프로젝트에서 관련 개인 건강 데이터를 사용할 수 있는 플랫폼을 제공하여 의료 연구를 지원하며 건강 데이터를 통한 공익을 창출함
비영리 구조로 운영되며, 데이터 이용에 따른 수익은 조합의 운영비로 사용
데이터 협동조합의 구성 요소
조합원 커뮤니티: 데이터를 자발적으로 수집하고 공동의 활용 모교를 설정하는 커뮤니티로, 데이터 생성자, 수집자, 이용자 등으로 다양한 역할로 구성됨.
목표 및 조합원 혜택: 조합원들이 공동으로 설정한 데이터 관리와 활용 목표를 바탕으로 조합원에게 돌아갈 혜택도 직접 결정함.
데이터 관리 공유 정책: 데이터의 관리와 공유에 대한 정책을 결정하고, 실행하며, 점검하는 거버넌스 체계를 마련함.
데이터 플랫폼: 조합원이 직접 데이터 제공 여부를 결정할 수 있는 플랫폼을 갖추며, 데이터 보안 및 안전한 공유를 보장해야 함.
비즈니스 모델: 협동조합 운영 비용을 충당할 수 있는 비즈니스 모델 필요
데이터 협동조합의 특징
조합원의 데이터를 활용하는 것이므로 조합원의 수에 따라 데이터 규모가 변동함. 조합원 규모가 클수록 더 가치있고 의미있는 데이터셋 확보가 가능한 규모의 경제가 작동함.
공동의 데이터 관리 및 활용에 대한 의사 결정이 조합원 중심으로 이루어지며, 1인 1표 원칙에 따른 공정한 의사결정 구조를 가짐.
조합원을 비롯한 다양한 이해관계자 간의 조정과 합의 도출이 중요하며, 이를 위한 효과적인 커뮤니케이션과 협의 과정이 필수적임.
효과적인 비즈니스 모델과 기술 플랫폼이 필요하다는 점에서 조직 운영의 난이도가 높은 편임.
데이터 협동조합의 도전과제
데이터 활용과 개인정보 보호를 동시에 달성할 수 있는 잠재력을 지닌 거버넌스 모델이지만, 1인 1표의 원칙, 조합원의 공동의 의사결정과 같은 협동조합 운영의 특성을 충분히 고려해야 함. 데이터 활용 및 협동조합 운영 과정에서 긍정적인 효과가 있을 수 있지만, 반대로 논의가 길어지거나 실질적인 성과가 없는 경우도 발생할 수 있음.
성공적인 운영을 위해서는 지속적인 조합원 확보와 유의미한 참여율을 유지해야 하며, 데이터의 가치 생성을 위해 조합원 규모도 중요함.
데이터 거버넌스 구축을 위한 빠띠의 데이터트러스트
공익데이터를 중심으로 한 생태계 조성을 위해서는 적절한 데이터 거버넌스 체계를 구축하는 것이 필수적입니다. 빠띠는 이에 주목하여, 특정 플랫폼이 데이터 독점적으로 수집하고 활용하는 방식이 아닌, 공익 단체, 공공 기관, 시민, 연구자 등 다양한 주체들이 함께 공익 데이터를 생산, 관리, 공유하는 데이터 거버넌스 체계를 만들고자 합니다.
또한 공익 데이터 생태계 생태계 차원에서 시민과 공익 섹터 데이터 필수 역량을 확보하기 위해 역량 있는 데이터 활동가들을 중심으로 데이터 신탁 사업을 추진하는 데이터트러스트 플랫폼을 구축하였습니다. 공익 데이터 생산, 관리, 유통을 위탁 받아 수행하는 플랫폼에서 ‘시민 데이터 실험실'과 ‘공익 데이터 작업실' 사업을 추진 중입니다.
이를 통해 공익 단체는 자신들의 이슈를 확산할 수 있는 데이터 기반을 마련하고, 개인 및 단체는 데이터를 활용해 사회 문제 해결, 연구, 활동 등에 협력할 수 있으며, 함께 공익 데이터 생태계를 만들 수 있습니다.
함께 생각해봐요.
국내 법적, 데이터 시장 상황에서 데이터 공유 시 해결해야 할 과제는 무엇일까요?
데이터 거버넌스 모델을 구현할 때, 고려해야 할 요소는 무엇인가요? 어떤 조건과 인프라가 필요한가요?
정리 : 박아영 빠띠 협력가(ahyoung@parti.coop)*본 내용은 김정원 박사가 진행한 ‘인공지능 시대, 데이터 액티비즘과 거버넌스' 스터디 내용을 바탕으로 작성되었습니다.