기후위기 극복을 위한 무기, “데이터”
디지털 사회에서 데이터는 사회를 읽는 창구이자 하나의 경쟁력이 되었습니다. 복잡한 사회문제를 이해하고 해결하는 중요한 자원이라고 할 수 있지요. 빠띠는 오래 전부터 ‘데이터로 사회문제를 해결할 수는 없을까?’라는 문제의식으로, ‘공익데이터’의 중요성을 강조해 왔어요. 공익데이터는 말 그대로 ‘공익을 목적으로 하는 누구나 접근 가능한 데이터’를 말합니다. 기업이나 기관뿐만 아니라 시민 혹은 공익단체가 모은 데이터도 공익데이터가 될 수 있어요. 이는 사회문제 해결에 직접적으로 활용될 가능성이 높습니다. 삶의 생생함을 담고 있는 데다가 선명한 문제 의식을 갖고 있기 때문이지요. 이러한 데이터를 더 많은 시민에게 공유한다면, 다양한 관점에서 문제를 해결하고 협력할 기회가 늘어납니다. 공익데이터를 분석하고 활용하여 사회문제를 발견하거나 해결하는 활동을 ‘공익데이터활동’이라고 부릅니다. 빠띠는 공익데이터의 생산, 공유, 활용, 관리가 유기적으로 이뤄지는 시스템을 구축하고, 이를 통해 지속가능한 공익데이터 생태계를 조성하고자 ‘데이터트러스트’ 사업을 진행하고 있습니다. 지난 9월 시작한 ‘이달의 데이터톤’(이하 데이터톤) 또한 이 일환으로 열리게 되었어요. 데이터톤은 ‘데이터’와 ‘해커톤’의 합성어로, ‘일정 시간 동안 특정 주제에 대한 데이터를 모으고 분석한 후 문제 해결 방법을 찾아보는 이벤트’입니다. 기후위기라는 벼랑 끝에 선 우리 첫 주제는 ‘기후위기’입니다. 올 여름, 유난히 길었지요. SNS에서 “대한민국의 사계절은 이제 ‘봄-여어어어어어어어어어름-갈-겨어어어어어울”이라는 표현이 유행어처럼 번지기도 했지요. 단순히 길었던 것만은 아니에요. 평균 기온, 열대야 기간, 강수량, 해수면 온도 등 많은 부분에서 역대 기록을 갈아치우기도 했습니다. ‘가장 뜨거웠던 여름’으로 기억될 올 여름, 하지만 동시에 ‘올해가 남은 인생 중 가장 시원할 여름’일 것이라는 역설적인 이야기도 들립니다. 하지만 막상 ‘그래서 기후위기를 어떻게 해결할 수 있는데?”라는 질문을 들으면, 시민 개인이 답할 수 있는 건 한정적입니다. 에어컨 사용을 줄이고 자차 대신 대중교통을 이용하는 게 얼만큼 도움이 되는지도 잘 모르겠습니다. 무엇보다 개인의 힘으로 이 거대한 문제를 해결할 수 있을지 확신이 서지 않습니다. 비단 기후위기뿐만 아니라 현대 사회의 많은 문제는 복잡하고 규모도 큽니다. 때문에 단일 분야가 아니라 다양한 이해관계자의 협력으로 해결해야 한다는 목소리가 커지고 있고요. 데이터? 기술? 잘 몰라도 괜찮아요 데이터톤에서도 협력이 중요합니다. 기후위기 문제에 관심 있는 시민이라면 누구나 참여할 수 있어요. 데이터에 대해 잘 몰라도, 특별한 기술이 있지 않아도 괜찮습니다. 제안자의 진행에 따라 나의 생생한 경험과 관점을 나누고, 데이터를 수집하고 가공하는 작업에 함께하면 됩니다. 데이터와 기술 관련 활동 경험이 있다면 결과물을 만들거나 멘토로도 참여할 수 있고요. 각자 할 수 있는 다양한 방식으로 참여하고 협력해나가면 됩니다. 이번 데이터톤에는 40여 명의 시민이 참여했는데요. 참여 동기는 각각 달랐지만, ‘데이터로 기후위기 문제 해결의 실마리를 찾아보고 싶다’는 마음은 모두 같았습니다. “일상의 작은 시점에서, 기후위기 문제 해결을 위한 임팩트를 데이터로 어떻게 만들 수 있을지 궁금해서 참여하게 되었습니다.”“기후위기를 데이터를 통해 정량적으로 확인하고 이를 해결하기 위한 액션을 고민해보는 것에 대한 관심과 기대로 신청하게 되었습니다.”“평소에도 환경이 관심이 많았지만, 9월이 되어도 식지않는 열대야 날씨에 심각성을 더욱 더 뼈저리게 느끼게 되었습니다. 실질적으로 내가 이런 상황 속 무얼 할 수 있는지 지구에 조금이나마 도움이 되고 싶다는 생각으로 지원하게 됐습니다.”- 참여동기 중 발췌 -  데이터로 기후위기를 해결할 수 있을까? 데이터톤은 총 4개의 주제별 세션으로 진행되었는데요. 각 세션에는 공익단체들이 세션 호스트로 함께했습니다. 공익단체는 그간의 활동으로 쌓아온 데이터를 공유한 후 시민과 머리를 맞대고 ‘데이터로 기후위기를 해결할 수 있는 방법’을 찾아보았어요.(👉 공익단체 데이터와 함께하는 사회문제 해결 협력의 장 ‘활동가의 서랍’  자세히 보기) 세션1. 데이터 캠페인 - 기후위기 데이터 발굴하기 함께한 공익단체 : 빠띠 세션 주요 내용 기후위기 관련 데이터를 찾아보는 기초 과정을 함께했습니다. 정보를 손쉽게 기록할 수 있는 구글 확장 프로그램 ‘물음표’를 활용하여 정보를 수집하고, 원본 데이터와의 대조 작업을 통해 기초 배경 데이터를 발굴했습니다. 이 과정에서 데이터 확인에 필요한 구글 검색 노하우를 학습하고 실습에 활용했는데요. 데이터 활동의 범위와 의미, 기획방법 등을 살펴보고, 더 많은 시민이 공익데이터 활동을 할 수 있는 방안을 고민해보는 시간도 가졌습니다. 참여자 회고 “데이터 원본을 찾는 일이 생각보다 힘들어서 ‘데이터 작업은 인형 눈붙이기와 같다’는 다른 분의 말에 공감했습니다. 원하는 데이터를 필요할 때 참고하고 사용할 수 있도록, 한 곳에 모으고 접근성을 높이는 일이 중요하다는 것을 다시 느낄 수 있었습니다. 추후 원본 데이터를 가공하거나 시각화하는 등 다양하게 활용하는 방법도 배우고 싶습니다.”  세션2. 1.5도씨 라이프스타일 데이터 분석 및 시각화 함께한 공익단체 : 녹색전환연구소 세션 주요 내용 녹색전환연구소는, 시민이 개인 일상에서 배출하는 온실가스 규모를 확인하고 감축 계획까지 세울 수 있는 ‘1.5도 계산기’를 만들었습니다. 이번 세션에서는 그간 수집된 데이터를 함께 살펴보고, 이 내용을 어떻게 잘 가공하여 전달할 수 있을지 시각화 방법을 함께 찾아보았습니다. 참여자 회고 “1.5도씨 라이프스타일 계산기의 단순한 사용을 넘어, 모인 데이터값으로 어떤 인사이트를 제시할 수 있을지 고민하는 시간이 유익했습니다. 데이터를 통해 인사이트를 뽑아낸다는 것은 원본 데이터를 정확하게 잘 정리하는 것을 넘어 소비하는 사람들의 시점에서 무엇이 끌리고, 왜 시도를 하려고 하는지까지를 고려해야 한다는 점을 배웠습니다."  "학교 기후 관련 앱개발에 참고할 수 있는 설문 문항이나 이와 연계된 학습 자료 개발과 관련된 많은 아이디어를 얻을 수 있었습니다. 학교와 지속적으로 협력할 수 있는 다양한 활동(강의, 학교에서 활용할 수 있는 데이터 생성 등)을 기획해보고자 합니다."  세션3. 선거용 홍보물품 데이터 가공 및 수집 함께한 공익단체 : 웨어마이폴 세션 주요 내용 선거철마다 의류, 현수막, 명함, 문자메시지/ARS 등 엄청난 홍보물이 쏟아집니다. 웨어마이폴은 선거 과정에서 발생하는 환경적 영향을 고민하는 비영리 스타트업입니다. 이번 세션에서는, 선거 홍보물이 만들어내는 탄소 배출량 데이터를 가공, 처리, 분석하는 과정을 시민과 함께했습니다. 23대 국회의원 선거 서울지역 후보자 홍보물품의 탄소 배출량을 계산해보고, 홍보물품 사용량을 줄이기 위한 스토리텔링 방안을 고민해보았습니다. 참여자 회고 “데이터에도 스토리텔링이 필요하다는 사실을 깨달을 수 있었습니다. 그래서 데이터 간 인과관계와 상관관계를 잘 살펴야 한다고 생각하게 되었습니다.” "데이터를 같이 살펴보고 어떻게 정리할지, 정리된 데이터를 바탕으로 가설을 설정하고 어떻게 검증할지 논의할 수 있어서 즐거웠습니다." 세션4. 지속가능한 축제를 위한 기후위기 대응 모니터링 함께한 공익단체 : 그린피겨스 세션 주요 내용 10월은 축제의 계절입니다. 다양한 공연과 체험행사 등이 우리의 일상에 활력을 불어넣어주지요. 하지만 축제의 이면에 탄소배출과 환경파괴가 존재한다는 사실을 알고 계셨나요? 보통의 축제는 짧은 기간 동안 많은 양의 자원을 소모하고 거대한 폐기물을 만듭니다. 그린피겨스는 축제 탄소배출 모니터링 데이터를 바탕으로, 주최자를 위한 탄소배출 관리 가이드와 참여자를 위한 기후영향 자가진단 모형을 제작하고 있어요. 이번 세션에서는 시민과 함께 진단 설문을 테스트하고, 데이터 수집 방법을 공유해보았습니다. 참여자 회고 “축제와 관련된 탄소배출을 정량화하는 모니터링을 통해 실제적으로 어떻게 탄소배출 감축을 관리할 수 있는지 축제 이해관계자 모두의 인식을 높이고 있는 활동들이 인상깊었어요. 이번 자라섬 페스티벌에서도 좋은 임팩트가 있길 기대하며, 마주하고 있는 어려움에도 불구하고 그린피겨스의 노력들이 꼭 리포트 작성까지 이어지길 바랍니다!" "데이터로 사회문제를 여러 사람들과 얘기하는 경험이 잘 없었는데, 이번 기회에 그 경험을 할 수 있어서 좋았습니다! 데이터 분석으로 할 수 있는 다양한 가능성을 얻어가는 것 같아서 다음에 어떤 활동을 기획하고 실행할지 기대됩니다." "데이터화하기 위해 필요한 제반 논의들을 오신 분들과 여러 관점에서 나눌 수 있어 의미있었습니다."   짧은 시간이었지만 압축적이고 농도 깊은 이야기가 오갔습니다. 데이터톤에서 나온 이야기들이 기후위기를 당장 해결할 수는 없을 거예요. 하지만 이런 움직임들이 하나의 실마리가 되고, 그 실마리들이 모이다보면 언젠가 의미있는 변화를 만들 수 있게 되지 않을까요? 빠띠는 앞으로도 사회문제 해결의 실마리를 만들고 찾는 데에 ‘데이터’를 적극적으로 활용해보려고 합니다. 우리 사회는 여전히 데이터의 경제적 가치만 높게 평가합니다. 사회문제 관련한 데이터의 생산과 관리는 상대적으로 부족할 수밖에 없지요. 하지만 지속가능 관점에서 바라보면, 데이터의 사회적 가치를 결코 등한시 할 수 없습니다. 그렇기 때문에 데이터톤은 앞으로도 계속됩니다. 다음달에는 어떤 주제로 데이터톤이 열릴까요? 꾸준한 관심과 응원을 부탁드립니다. 또한 시민 여러분의 생생한 삶의 목소리를 언제라도 편히 들려주셨으면 좋겠습니다. 그것 또한 우리 사회를 더 나은 곳으로 만들 수 있는 하나의 데이터가 될 수 있으니까요.
·
데이터 액티비즘과 시빅해킹
[스터디 노트2] 데이터 액티비즘과 시빅해킹     빠띠는 ‘데이터로 사회문제를 해결하는 시민의 데이터 플랫폼’을 구축하기 위해 다양한 공익데이터 활동을 진행하고 있습니다. 이는 여러 파트너와 이해관계자와 협력하여 만들어가야 하는 중요한 작업입니다. 그렇기에 공익을 위한 데이터 활동이 무엇인지, 그리고 새로운 인공지능 서비스가 끊임없이 등장하는 시대에 왜 사회문제와 관련된 데이터를 논의해야 하는지에 대한 심도 있는 논의가 필요합니다.이러한 취지에서 빠띠는 ‘인공지능 시대, 데이터 액티비즘과 거버넌스'라는 주제로 스터디를 진행하고 있습니다. 이 스터디는 기술과 사회혁신 두 분야에서 연구 및 국제협력 경력을 보유한 김정원 박사의 발제로 총 4회에 걸쳐 진행되며, 데이터와 시민의 역량, 데이터 액티비즘의 개념, 그리고 데이터의 생산, 관리, 공유를 둘러싼 거버넌스 유형 등 국내외 인공지능과 데이터 관련 주요 이슈를 다룹니다. 스터디를 통해 얻은 핵심 내용을 요약하여 더 많은 분들과 나눔으로써 공익데이터 활동에 대한 이해를 넓히고, 사회문제 해결을 위한 데이터 활용의 중요성을 공유하고자 합니다.     네 줄 요약  데이터 액티비즘은 시민 참여를 통해 투명성을 높이는 중요한 방법이다.  시빅 해킹은 정부가 놓친 문제를 해결하기 위해 협력적인 접근을 취한다.  디지털 사회혁신, 데이터 액티비즘, 시빅해킹은 시민력 증진에 기여한다.  집단지능(인공지능+인간지능)은 복잡한 문제 해결의 핵심요소로 주목받고 있다.    데이터 액티비즘(Data Activism)이란?  2000년대 초반 오픈 정부데이터 운동에서 시작되어 공공 데이터를 공유하여 정부 운영의 투명성을 높이려는 활동으로 발전함. 데이터를 수집, 분석, 시각화하여 새로운 사회적, 정치적 이슈를 부각시키고 변화를 추구하는 것으로 정의할 수 있음.  데이터 액티비즘의 핵심은 ‘시민 참여'에 있음.  목표는 1)시민 참여를 촉진해 2)사회적 불평등을 드러내고 3)정치적 변화를 이끌어내는 것이며, 4)오늘날 대규모 데이터 수집에 저항하여 개인의 프라이버시를 보호하기 위한 목적도 있음.  데이터 액티비즘의 사례로는 다음과 같은 것이 있음 세이프캐스트(Safecast, 일본): 후쿠시마 원전 사고 이후, 시민들이 방사능 수치를 측정하고 데이터를 공유하여 공공의 안전을 도모하기 위한 활동 전개. 원자력 찬반이라는 정치적 이분법에서 벗어나 정확한 데이터를 통해 사회적 신뢰를 구축하기 위해 방사능 측정기를 개발하여 시민에게 보급하고, 측정된 데이터를 모아 ‘방사능 지도'를 만들었음.  데이터포블랙라이브스(Data 4 Black Lives): 2만 명이 넘는 과학자 및 활동가로 구성된 네트워크를 통해 흑인들의 삶에 구체적이고 측정가능한 변화를 만들기 위해 데이터를 활용하는 비영리단체로 통계 모델링, 데이터 시각화, 크라우드소싱과 같은 방법으로 편견에 맞서고 시민 참여를 촉진해 데이터와 알고리즘의 차별적 사용에 도전하는 활동을 지원함.  일상 속 그린워싱 데이터: 빠띠의 공익데이터 활동 중 하나로 판매하는 소비재의 친환경성과 그린워싱 의 기준을 직접 데이터를 수집하고 분석하며 더 나은 소비를 위한 ‘그린가이드'를 만들어 봄.     시빅해킹이란?  기술, 데이터, 협력의 방식으로 시민 문제를 해결하는 창의적인 접근법으로 기술적 솔루션과 혁신적 접근을 통해 시민 문제를 해결하고 지역 사회를 개선하는 것을 목표로 함.  시빅해킹의 접근법 정부 책임성과 투명성을 높이기 위해 정부 데이터 활용 시민의 요구를 해결하기 위한 소프트웨어 애플리케이션, 웹사이트, 도구 개발 지역사회 문제에 대한 통찰력을 얻기 위한 데이터 분석 및 시각화 정부 프로세스와 시민 경험 재설계 시민사회 단체, 혁신 조직과 함께 사회적 문제를 데이터 분석과 기술을 활용하여 해결 시빅해킹 사례로는.  코로나19 공적 마스크 공동 대응 활동: 2020년 코로나19 시기 마스크 수급 대란이 발생. 이에 빠띠, 코드코포리아를 포함한 시빅 해커들이 정부에 코로나19 관련 공공 데이터 개방을 요청하고, 마스크 재고를 실시간으로 파악할 수 있도록 하는 ‘공적 마스크 재고 맵 서비스’를 개발. 이후, 재난시 정부의 공공 데이터 개방과 14만건 이상의 데이터 공개 방침을 세우는 데 영향을 미침.    데이터 액티비즘과 시빅 해킹의 차이점은 무엇? 자료 참조: Data Activism; Civic Hacking as data activism and advocacy:A history from publicity to open government data 사회문제를 해결을 위해 정치적 변화를 이끌어내는 활동을 데이터 액티비즘이라고 한다면, 정부가 하지 못하는 서비스 개선을 위해 시민이 직접 나서 협력하는 방식으로 문제를 해결하는 것을 시빅해킹으로 보는 경향. 학자들이 위와 같이 구분해두었지만, 크게 다르지 않은 개념으로 사용하고 있음. 이런 관점에서 접근법에서도 데이터 액티비즘은 정치사회적 위협에 반응하는 행위라고 한다면, 시빅해킹은 불편하거나 해결이 필요한 것을 “이런 것이 필요하니 해주세요.”, “같이 해볼까요?”처럼 자연스러운 협력적 접근이라고 이야기하기도 함.    데이터 액티비즘과 공공은 상호보완적인 관계를 형성 공공의 데이터 수집 및 활용과 데이터 액티비즘은 상호 보완하며 더 큰 공익을 창출할 수 있음. 공공은 데이터 공유에 제한적이거나 복잡한 절차를 요구함. 특정 관점이나 우선순위에 따라 데이터를 수집하고 분석하기 때문에 시민과 시민사회 조직은 이를 보완할 수 있는 다양한 전문 지식과 관점을 제공할 수 있음.  시민은 데이터를 새로운 방식으로 해석하고 활용하여 혁신적인 해결책을 만들어내기도 하며, 공공기관의 데이터 수집 및 분석 과정을 감시하고 투명성을 높임.  공공이 충분히 반영하기 어려운 지역의 특수성을 고려할 수 있으며, 시민주도의 데이터 활동은 새로운 문제가 트렌드에 빠르게 대응할 수 있음.    데이터 액티비즘과 집단 지능의 중요성  현대 사회의 복합적인 문제를 해결하는데 ‘집단 지능'의 활용이 중요해지고 있으며, 기술과 플랫폼, AI의 발전에 따라 더욱 확장된 개념으로 논의되고 있음.  집단지능이 더 주목받는 이유는 오늘날 거대한 문제가 가진 복잡성과 앞으로 어떤 상황으로 이어질지 모르는 불확실성 때문  오늘날 대부분의 문제가 ‘문제의 원인이 A이니 해결책은 B야"처럼 선형적으로 풀릴 수 없는 유형. 여러 원인이 얽혀있고, 그 원인이 전지구적 범위인 경우도 많음(예: 기후위기)  또한 현상이 빠르게 변화하여 그 흐름을 파악하기가 쉽지 않으며, 여러 사회, 정치, 경제적 변수로 인해 어떻게 변화할지 불확싱성이 높아짐.  정책이나 제도적 방법만으로 해결하기가 충분치 않으며, 개인의 생활 양식이나 행동 변화 등 다양한 수준 및 층위의 변화를 요구함. 집단 지능이란, 인공지능과 인간지능을 결합하여 주어진 문제 해결을 위해 다수의 사람들이 다양한 정보, 아이디어와 통찰을 구하는 확장된 역량을 말함. 즉, 인간지능과 인공지능이 가진 다른 특성(예: 인간은 감정을 고려하고 윤리적 판단을 수행, 인공지능은 패턴 발견과 데이터 학습에 강점)을 결합하여 과거 현상의 근본 원인을 파악하고, 다양한 데이터를 모아 복잡한 문제의 맥락을 이해함으로써, 복잡한 문제를 해결할 수 있는 가능성을 높임.   참조자료: The future of minds and machines: how artificial intelligence can enhance collective intelligence 집단지능이 언제 유용한가?  더 정확한 문제 파악 현재 관찰되는 현상과 관련된 데이터를 통해 빠르게 사실과 전체 맥락적 시사점을 파악하여, 복잡한 현상의 이면에 가려진 문제와 근본 원인을 이해할 수 있음.  적용 방법: 다양한 유형의 데이터를 모아 병합하고, 크라우드소싱을 통해 새로운 데이터를 수집하며, AI를 활용해 분석하고 예측  사례: 페타벤카나(PetaBencana), 세이프캐스트(Safecast), 위센스잇(WeSenseit), 우샤히디(Ushahidi) 해결안 도출  문제 해결안 도출이 어려울 때는 시민참여와 다양한 지능을 모아 새로운 접근법을 시도하거나, 다른 곳에서 검증된 해결책을 찾아보거나, 혁신가들에게 인센티브를 제공하여 새로운 방법을 만들도록 하는 접근법이 필요  적용 방법: 최신 연구결과를 검색하고, 유사 문제의 혁신적 해결방법을 시도하며, 시민 코크리에이션 워크샵과 네트워킹을 통해 다양한 분야의 혁신가들과 협업하여 인공지능을 활용한 데이터 분석과 예측모델을 구축 사례: 올아워아이디어스(AllOurIdeas), 블록바이블록(BlockByBlock) 의사결정&행동  사회적 이슈에 대해 다양한 사람들의 의견을 듣고 함께 의사결정을 내리며, 그 결정에 대한 책임을 공유하고 행동을 이행  적용 방법: 다양한 이해관계자들이 모여 숙의, 숙의 후 투표를 통해 우선순위를 결정, 인공지능을 활용해 수집된 데이터와 조사결과 분석, 이슈 전문가와의 Q&A 및 유사한 그룹과의 협업을 통해 문제와 해결안을 모색 사례: 브이타이완(vTaiwan), 루미오(Loomio), 폴리스(pol.is) 모니터링 및 개선  현재 프로젝트나 정책이 의도한 대로 작동하고 있는지 추적하고 싶다면, 여러 사람이 함께 시스템을 모니터링하여 현 상황을 파악하고 개선점을 찾아내야 함.  찾아낸 개선점을 다른 사람들과 공유하여, 프로젝트나 정책이 더 효과적으로 운영되도록 할 수 있음.  적용 방식: 휴먼디엑스닷오알지(HumanDx.org), 퍼블릭랩(PublicLab.org)   데이터 액티비즘과 시빅해킹에 시민은 어떻게 참여할 수 있는가?(시민참여 유형) 참조자료: Palacin-Silva & Possa, J. (2018) Shut up and take my environment data! A study on ICT enabled citizen science practices, participation and challenges  데이터 소비자로서 참여: 데이터 수집 활동에는 참여하지 않지만, 개발된 서비스를 통해 공익 데이터를 활용하는 방식으로 서비스 이용 (예: 무스티카고 Mustikka Go)  데이터 제공자로서 참여: 데이터 수집과 분류에 참여(주니버스 Zooniverse, 픽스마이스트리트 FixMyStreet, 웨이즈 Waze)  협력자로서 참여: 전문가가 주도하는 문제해결 과정을 지지하고 돕는 역할로 전문가가 전체 프로세스와 우선 순위를 정하고 시민들에게 협력을 요청하는 방식. (시민 과학 프로젝트가 대부분 이런 유형)  공동 디자인 역할로서 참여: 과정 기획, 설계, 실행 전 과정에 참여. 시민들이 직접 자신들에게 중요한 문제를 결정하고, 무엇을 해결할지 결정하고, 개발자 및 전문가와 함께 과정을 만들어나감 시민이 직접 문제해결의 주체로 역할: 시민이 직접 나서 문제 해결의 주체를 만들고 해결과정에 적극적으로 나섬(우샤히디 Ushahidi, 세이프캐스트 SafeCast)   데이터 기반 문제 해결에는 다양성이 중요  집단지능을 활용할 때의 원칙을 소개함. 사람과 관점의 다양성이 집단 지능을 향상시킴(다양성이 확보된 그룹이 유사한 관점을 가진 몇몇 전문가 그룹보다 더 나은 해결책을 도출한다는 연구 결과가 있음)  다양성을 위해, 단일한 데이터가 아닌 다양한 맥락과 관점을 포함한 데이터를 수집해 새로운 통찰력을 얻어야 함. 기술이 아닌 시민을 중심으로, 이들이 변화의 주체가 될 수 있도록 데이터 역량 강화에 중점을 둘 것.    디지털 사회혁신, 데이터 액티비즘, 시빅해킹은 시민력을 키우는 디지털 접근법   데이터 분석을 포함해 기술로 복잡한 문제를 해결하려면, 다양한 관점의 데이터와 사람들의 경험 및 지혜가 필요하며, 이것이 공평하게 목소리를 내고 고려될 수 있는 기술 지원이 중요.  현재 데이터, AI, 플랫폼 기술은 시민 참여를 더욱 용이하게 만들며, 공익적인 목적으로 활용되어, 더 많은 문제를 새로운 방식으로 해결할 수 있는 기회를 열고 있음.  시민들, 사회문제를 해결하고자 하는 기업, 자선단체, 비영리단체, 공공은 데이터 액티비즘과 시빅해킹을 통해 해결할 수 있는 문제가 무엇인지 고민하고, 새로운 집단지능의 활용 방식에 대해 생각해봐야 함.  서로 다른 이해관계자들이 협력하기 위한 공간을 만드는데 있어서 공공의 경청과 지원이 중요함.    함께 생각해봐요. 데이터 액티비즘, 시빅해킹, 집단지능은 우리 사회의 어떤 문제를 해결하는데 효과적일까요?  함께 할 수 있는 다양한 이해관계자는 누구이며, 참여와 협력을 어떻게 만들어나갈 수 있을까요?  한 명의 시민으로서 나는 어떤 방식으로 참여할 수 있을까요?    *정리: 박아영 빠띠 협력가(ahyoung@parti.coop)   *본 내용은 김정원 박사(jungwon@spreadi.org)가 진행한 ‘인공지능 시대, 데이터 액티비즘과 거버넌스' 스터디 내용을 바탕으로 작성되었습니다. 
새 이슈 제안
·
2
·
AI 시대의 도전과 데이터 액티비즘
[스터디 노트1] AI 시대의 도전과 데이터 액티비즘     빠띠는 ‘데이터로 사회문제를 해결하는 시민의 데이터 플랫폼’을 구축하기 위해 다양한 공익데이터 활동을 진행하고 있습니다. 이는 여러 파트너와 이해관계자와 협력하여 만들어가야 하는 중요한 작업입니다. 그렇기에 공익을 위한 데이터 활동이 무엇인지, 그리고 새로운 인공지능 서비스가 끊임없이 등장하는 시대에 왜 사회문제와 관련된 데이터를 논의해야 하는지에 대한 심도 있는 논의가 필요합니다.이러한 취지에서 빠띠는 ‘인공지능 시대, 데이터 액티비즘과 거버넌스'라는 주제로 스터디를 진행하고 있습니다. 이 스터디는 기술과 사회혁신 두 분야에서 연구 및 국제협력 경력을 보유한 김정원 박사의 발제로 총 4회에 걸쳐 진행되며, 데이터와 시민의 역량, 데이터 액티비즘의 개념, 그리고 데이터의 생산, 관리, 공유를 둘러싼 거버넌스 유형 등 국내외 인공지능과 데이터 관련 주요 이슈를 다룹니다.스터디를 통해 얻은 핵심 내용을 요약해 더 많은 분들과 나눔으로써 공익데이터 활동에 대한 이해를 넓히고, 사회문제 해결을 위한 데이터 활용의 중요성을 공유하고자 합니다.     네 줄 요약 (데이터 액티비즘 이전에 인공지능과 데이터에 대한 이해 쌓기) AI와 데이터 편향성 문제는 예상보다 사회와 일상에 더 큰 영향을 미치고 있다.  AI 기술이 발전할수록, 사회적 문제 해결과 시민 참여가 더욱 중요해지고 있다.  AI 개발에는 민주적 요소와 함께 디지털 기술 전문가와 일반 시민의 참여가 필요하다.  AI 규제와 정책은 산업의 발전 속도를 따라가지 못하고 있으며, 이에 대한 활발한 사회적 대화가 필요하다.    챗GPT, 오늘날 인공지능 발전 흐름의 집약체  2022년 11월 30일, 오픈AI가 챗GPT를 발표한 이후, 유사 모델이 잇따라 개발되면서 AI 기술 발전이 가속화되고 성능 변화도 뚜렷해짐. AI 기술은 매 3개월 주기로 빠르게 발전하고 있음.  최근 AI 기술은 대부분 생성 AI 알고리즘의 결과물로 데이터가 많을수록 뛰어난 성능을 발휘한다는 점이 중요함(오늘날 데이터의 경제적 가치가 높아지게 된 배경임). 이러한 생성 AI 개발에는 방대한 훈련 데이터와 막대한 컴퓨팅 파워를 요구함.  과거에는 학계가 AI 개발의 중심이었으나, 현재는 민간 기업이 압도적인 비중을 차지하고 있음. AI 모델의 학습 비용이 계속 증가하면서, 투자 자본이 부족한 기업은 경쟁에서 밀려나고 현재 빅테크 기업이 AI 연구와 개발을 주도함.   그래프 출처:  AI Index Report 2024, Stanford Human-centered AI, 2024 데이터와 알고리즘 편향 문제를 파헤치는 콘텐츠 가이드 거대한 해킹(2019): 2016년 미국 대통령 선거 캠페인과 영국 브렉시트 국민투표 캠페인에서 인공지능과 페이스북 데이터가 활용된 캠브리지 애널리티카 사건을 다룬 다큐멘터리. 페이스북은 약 8천 7백만 명의 이용자 개인 데이터를 동의없이 선거 캠페인 전략 회사인 캠브리지 애널리티카에 넘겨주고, 이 데이터를 분석하여 선거에 개입했다는 의혹을 다루고 있음.  소셜딜레마(2020): 실리콘밸리의 유명 소셜미디어 기업에서 일했던 핵심 인력들이 소셜미디어 알고리즘의 위험성과 해악을 고발하는 내용을 다루고 있음. 광고 수익으로 성장하는 IT 기업이 광고 효과를 높이기 위해 이용자의 정보를 어떻게 추출하고, 행동을 유도하는지 보여줌으로써 알고리즘에 저항해야 한다는 메시지를 전달함.    공공 서비스의 디지털 전환: 시민의 권리에 대한 시스템 오류, 그 영향 공공 부문에서 AI 활용이 점차 늘고 있음. 왜 그럴까?  보다 정확한 정보와 예측을 제공하여 더 나은 결과를 도출(예: 기후변화 예측, 응급 서비스 수요 예측, 교통량 예측 등)  어려운 사회 문제에 대한 해결책 제시(예: 기후테크) 맞춤형 공공 서비스 제공이 가능(예: 맞춤형 복지 및 교육 서비스 연계)  반복적이고 시간이 많이 소요되는 작업의 자동화를 통한 효율성 개선  생산성과 효율성을 위해 공공 서비스를 점차 디지털로 전환하고 있음.  알고리즘이 중립적이고 무결할 것이라는 일반적이 인식이 있으나, 이에 대해 문제 의식을 갖게 하는 ‘대학입시’ 관련 사례가 영국에서 일어남.  [케이스 스터디]알고리즘이 대학입시를 결정한다고?! 2020년 코로나19로 영국 대학입시(A-Level)가 취소됨. 대신 모의고사 점수와 내신 성적으로 대학 입시를 대신하기로 결정하는데, 여러 편차를 보정하고 객관성을 보장하기 위해 개별 교사의 판단이 아닌 정부 입시 기관의 자동 알고리즘을 활용함. 그러나 이 과정에서 많은 학생들이 예측 점수보다 낮은 성적을 받아 합격할 것으로 예상한 대학에서 불합격 통보를 받음. 결과에 대한 재심 요청 후 분석 결과, 성적이 하향 조정된 대부분의 학생이 빈곤 지역에 위치한 학교에 재학 중이며, 이들 학교의 과거 대학 입시 결과가 낮았던 것으로 드러남. 반면, 부유한 지역 사립학교 재학생의 점수는 4.7% 상승해 공정성 문제가 제기됨. 최근 3년간 시험 결과 데이터를 반영해 만들어진 알고리즘 계산이 불공정 시비를 불러오자 교육부는 최종 시험결과 통보 후 4일 만에 결정을 취소하고, 결국 각 교사가 제출한 예측 결과를 대입 최종 결과로 인정하기로 함.  관련 내용 더 보기   사회적 이슈를 초래하는 AI와 저작권, 데이터 편향성  생성형 AI는 차별과 배제를 유발하는 콘텐츠를 생성할 수 있으며, 민감한 정보를 누설하거나 추론할 위험이 있음. 또한, 거짓이나 왜곡된 정보를 생성할 수 있고, 악의적 목적으로 악용될 가능성(예: 딥페이크)도 존재함.  생성형 AI 모델의 활용도가 높아짐에 따라 할루시네이션(Hallucination) 문제, 즉, AI의 결과가 허위일 확률이 존재함(챗GPT-4 3%, 클로드 8.5%, 제미나이 프로 4.8%의 확률이라는 연구 결과, 출처: Economist, 2024년 2월) 일부에서는 데이터셋을 단순한 알고리즘의 원료가 아닌, 특정 가치를 가진 사람들과 그들이 제공한 데이터가 개입할 수 있는 정치적 행위로 간주해야 한다는 주장도 있음. 따라서 어떤 데이터를 입력할지, 그리고 누가 이 결정을 내릴 것인지에 대해 깊이 고민하고 질문해야 함.  또한, AI 연구자나 개발자의 구성과 이로 인한 편향성에 대한 연구가 활발히 진행 중이며, 몇몇 연구에 따르면, AI 학자 및 연구자들 사이의 다양성이 부족하다는 문제가 지적되고 있음.  데이터 자체의 투명성과 사용 과정의 투명성에는 차이가 있다는 것을 인식하고, 원래 의도와 달리 발생할 수 있는 위험에 대한 대응 방안도 필요함.     AI 발전에서 민주화 논의의 필요성 왜 필요한가?  AI는 부정확하거나 편견과 편향성을 포함한 결과를 만들어낼 수 있음.  AI의 의사결정 과정은 블랙박스와 같아, 의사결정의 근거를 설명하기 어려운 경우가 많음. 이로 인해 문제 발생시, 개발자나 시스템 운영자는 결과의 책임을 알고리즘에 전가할 수 있으며, 실제 문제의 근본 원인을 파악하고 해결하는 데 어려움을 겪을 수 있음.  AI 개발자와 연구자는 자신들이 개발한 시스템이 사회에 미치는 영향을 전적으로 이해하기 어려우며, 이로 인해 발생할 수 있는 피해를 사전에 예측하기 어려움.  이러한 맥락에서 AI 발전 과정에서 민주적인 요소를 고려하여 공정하고 투명하며, 사회 전반에 긍정적인 영향을 미치는 방향으로 나아가야 함. 이는 ‘AI 사용', ‘AI 개발', ‘AI 이윤', ‘AI 거버넌스' 측면에서 고려될 수 있음.  출처: Democratisig AI: Multiple Meanings, Goals and Methods, AIES '23: Proceedings of the 2023, Seger, E. et al AI가 사용자 데이터를 활용해 창출한 이익의 공정한 분배 문제도 대두되고 있으며, AI의 영향력이 광범위하게 미치는 만큼, 시민 참여와 책임성 확보의 필요성이 제기되고 있음.  AI 알고리즘의 투명성과 의사결정 과정에 대해 기술 업계뿐만 아니라, 시민과 시민사회의 이해가 요구됨. AI 시스템 개발의 각 단계에서 시민사회의 참여와 모니터링이 중요해지고 있으며, AI 개발 시 이해관계자와 시민 간의 협력, 즉 AI 거버넌스 구축이 필요함.   안전한 AI를 위한 국제사회의 노력 미국 공공기관은 AI의 안전한 사용을 위한 가이드라인을 마련했으며, AI를 잘못 사용했을 경우의 사례가 보도되면서 AI 기술에 대한 사회적 경각심도 높아지고 있음. 2023년 4월에 발표된 EU의 인공지능 법안은 우리나라에서도 주목하고 있음. 이 법안은 AI를 위험도에 따라 4개 카테고리로 나누어 규제하는 내용을 담고 있음. 예를 들어, 가장 위험한 AI는 사용이 금지되고, 고위험 AI는 특정 가이드라인을 준수해야 하는 방식임.  이러한 법안의 제정 차제로도 의미가 있지만, 모호한 표현과 복잡성으로 인해 여전히 논란의 여지가 있으며, 실질적 운영까지 많은 어려움이 따를 것으로 예상됨.  출처: AI법 집행주체는 과기부, 산업진항기관이 윤리감시까지… EU와 한국의 AI 법안 차이점, 힌국일보, 2023년 4월 20일   함께 생각해봐요. AI의 영향력이 확대됨에 따라 새롭게 떠오르는 문제는 무엇이며, 그 문제의 근본 원인은 무엇인가요?  AI와 데이터의 통제권은 누구에게 있을까요?  각국의 AI 규제 움직임은 어떠한가요? 규제 완화가 AI 강국을 만드는 방법일까요? 이 과정에서 시민사회의 역할은 무엇일까요?  데이터와 AI의 안전성과 신뢰성을 지키기 위해 시민이 할 수 있는 일은 무엇일까요?    * 정리: 박아영 빠띠 협력가(ahyoung@parti.coop)  * 본 내용은 김정원 박사(jungwon@spreadi.org)가 진행한 ‘인공지능 시대, 데이터 액티비즘과 거버넌스' 스터디 내용을 바탕으로 작성되었습니다.   
새 이슈 제안
·
데이터로 만드는 변화, 데이터 캠페인에 초대합니다!
세상엔 수많은 정보가 존재합니다. 하지만 모든 정보를 신뢰할 수 있는 건 아닙니다. 불확실한 정보 속에서 우리는 불안감을 느낍니다. 확실한 근거가 있을 때 비로소 정보를 신뢰할 수 있겠죠. 그렇다면 확인된 근거를 모아서 볼 수 공간이 있다면 어떨까요? 그래서 데이터트러스트는 시민들이 직접 확인된 데이터를 모으고, 모인 데이터를 활용할 수 있는 공간을 구현했습니다. 데이터트러스트에선 누구나 근거 확인이 필요한 정보를 제보하고, 확인된 데이터를 기록할 수 있습니다. 더 많은 시민이 검증이 필요한 정보를 수집하고, 데이터를 확인해 기록한다면 세상은 어떻게 달라질까요? 데이터트러스트에선 이런 궁금증을 바탕으로 시민들이 함께 정보를 찾고, 데이터를 기록하는 데이터 캠페인을 진행했습니다. 첫 번째 데이터 캠페인의 주제는 ‘일본 원전 오염수’였는데요. 3주간에 걸친 시민들의 활동은 어떻게 진행됐을까요? 함께 확인해보시죠. 데이터를 모아 만드는 변화! 첫 번째 데이터 캠페인에선 확인이 필요한 정보를 보다 쉽게 수집할 수 있도록 도와주는 ‘물음표’를 활용했습니다. 물음표는 드래그와 클릭 한 번으로 검증이 필요한 정보를 제보할 수 있는 구글 크롬 확장 프로그램인데요. 누구나 데이터트러스트에서 다운로드 받아 활용하실 수 있습니다. 첫 번째 모임에선 물음표를 활용해 정보를 수집하는 시간을 가졌습니다. 정보 수집에 앞서 이번 캠페인의 진행 과정과 물음표 설치 방법 등을 공유했습니다. 이후 오염수 방류와 관련된 여론조사, 공직자의 발언, 정부 발표 등을 직접 수집했습니다. 첫 번째 모임에선 언론 보도, 유명인의 발언 등 70개의 정보를 함께 수집했습니다. 정보를 수집한 후에는 수집한 정보 중 가장 기억에 남는 정보를 소개하고, 회고를 나눴는데요. “물음표라는 프로그램이 너무 흥미로웠다”, “다음주 팩트체크해볼 시간이 기대된다” 등의 반응이 있었습니다. 두 번째 모임에선 수집했던 정보를 바탕으로 데이터를 찾아 기록하는 활동을 함께 했습니다. 본격적으로 데이터를 찾기 전에 시민팩트체커 그룹 K.F.C.의 멤버들이 오염수 기준 관련 팩트체크 결과물과 작성 과정을 공유했는데요. 정보의 사실관계를 확인하는 과정에서 데이터를 어떻게 찾았는지, 찾은 데이터를 어떻게 활용했는지 등의 노하우를 공유했습니다.  이어서 함께 데이터를 찾아보고, 데이터트러스트 오염수 아카이브에 기록하는 시간을 진행했습니다. 두 번째 모임에선 9개의 데이터를 아카이빙했습니다. 참가자들은 데이터를 찾고 기록하는 과정에서 “자료를 찾는 과정이 어려웠지만 관심있는 주제에 대해서 찾아보니 즐거웠다” 등의 반응이 있었습니다. 세 번째 모임에선 그동안의 과정을 콘텐츠로 정리하는 시간을 가졌습니다. 함께 정보를 수집하고, 수집한 정보를 바탕으로 데이터를 찾아 기록하는 과정을 정리해봤는데요. 각자 정보를 수집하고, 데이터를 찾아 기록하는 과정에서 어떤 생각이 들었는지 등을 공유했습니다. 세 번째 모임에서 정리한 5개의 결과물은 캠페인즈에서도 확인하실 수 있습니다. 일본 원전 오염수 데이터 캠페인 결과물 모아보기! 일본은 원전 오염수 피해자를 어떻게 보호하고 있을까요? 오염수 방류 후 윤석열 대통령은 수산시장에서 이런 말을 했습니다 도쿄전력의 후쿠시마 핵 오염수 처리 계획 오염수 관련 정부 브리핑, 어떻게 소화할 수 있을까? 후쿠시마 오염수 방류 이후, 방사능 수치 검사는 잘 이루어지고 있을까요?   데이터 캠페인에 여러분을 초대합니다 데이터를 바탕으로 한 논의는 다양한 분야로 확장돼야 합니다. 그래서 두 번째 데이터 캠페인을 시작합니다! 두 번째 데이터 캠페인의 주제는 ‘아동/청소년 학대’입니다. 매해 아동 학대 사건이 등장하지만 관심이 쏠린 후 사라집니다. 반면 데이터는 꾸준히 발표되고 있음에도 여러 곳에 분산되어 있어 찾아보기 힘들거나 활용에 제약이 있습니다. 그래서 두 번째 데이터 캠페인에선 아동/청소년 학대와 관련된 정보를 수집하고, 데이터를 찾아 기록하는 과정을 진행합니다. 또한 정보를 수집하고, 데이터를 기록하는 과정과 데이터가 가지고 있는 맥락을 담아 콘텐츠를 작성합니다. 이를 통해 데이터를 바탕으로 한 더 나은, 더 많은 논의가 이뤄지도록 활동합니다. 두 번째 데이터 캠페인은 3회차로 진행되면 첫 번째 모임인 11월 8일(수)을 시작으로 매주 수요일 오후 7시 30분부터 9시까지 진행됩니다. 데이터로 만드는 변화에 함께 하고 싶으시다면 지금 바로 아래 신청 링크를 클릭해주세요! 👉아동/청소년 학대 데이터 캠페인 신청하기!
기술 공공성
·
3
·