[단비월드] 빅데이터 기업들의 비밀

빅데이터(디지털 환경에서 짧은 주기로 생성되는 방대한 규모의 데이터)는 ‘4차 산업혁명’의 주요 구성요소 중 하나다. 지난해 이세돌과 인공지능(A.I.) 알파고의 바둑 대국으로 전 세계가 들썩였다. 그 알파고가 ‘머신러닝(기계학습)’을 통해 바둑의 ‘무한대 수’를 깨우칠 수 있었던 것은 막대한 양의 기보(바둑을 둔 기록)라는 빅데이터가 있었기 때문이다. 

구글과 페이스북 아마존 등 전 세계 수십억 명이 이용하는 정보통신(IT) 서비스도 빅데이터의 산물이다. 구글은 전 세계 사용자들의 검색 기록을 분석해 가장 많이 선택된 결과물을 제일 먼저 노출시키고, 페이스북은 사용자들의 사진 데이터를 분석해 ‘친구 태그하기’ 등의 서비스를 제공한다. 소비자들은 구글, 페이스북 등의 서비스를 ‘공짜로’ 이용한다고 생각하지만 그것은 결코 공짜가 아니다. 미국의 진보저널 <자코뱅(Jacobin)>은 지난 달 14일자 기사 ‘빅데이터에 숨겨진 노동(Big Data’s Hidden Labor)‘에서 “오히려 사용자들이 이들 기업을 위해 엄청난 공짜 노동을 하고 있다”고 지적했다. 

나도 모르게 다 털어놓는 개인정보     

페이스북 같은 플랫폼을 이용하는 사람들은 대부분 회원 가입 전에 이용 약관을 꼼꼼히 읽지 않는다. 그래서 이들 기업은 자사에 유리한 내용의 약관으로 정보보안 분쟁 등 만일의 상황에 대비한다. 반면 가입자들은 서비스를 이용하기 위해 순순히 빈 칸을 채움으로써 개인정보를 아낌없이 제공한다. 검색을 하고, 게시물을 올리고, 물건을 구매하고 별점을 매기는 동안 이들 기업에게는 엄청난 데이터가 차곡차곡 쌓인다.

빅데이터를 수집하는 기업의 종류는 다양하다. 다국적 종자업체 몬산토는 ‘스마트팜(smart farm)’ 기술을 통해 개개의 농부로부터 가치 있는 정보를 대량으로 추출한다. 모바일 차량 예약서비스인 우버에 소속된 기사들은 운전 관련 데이터베이스를 계속 쌓아감으로써 장차 자율주행기술이 자신들의 노동을 대체해버릴 수 있는 환경을 만들어내고 있다. 

자본가들은 오랫동안 아무런 보상 없이 직원들에게서 정보를 수집해 이익을 냈는데, 최근에는 ‘사물인터넷(IoT)’과 같은 스마트 네트워크 기술의 확산으로 이런 활동이 소비자의 삶까지 확장됐다. 디지털업체들은 맞춤형 추천을 하기 위해 사람들의 성향관련 정보를 수집한다. 예를 들어 스트리밍 서비스는 개인의 취향을 알아내 그 사람이 좋아할 만한 콘텐츠를 예측한다. 건강관리 앱은 사용자가 움직이면서 소비한 칼로리를 계산해 더 바람직한 운동방식 등을 제안한다.

▲ 구글의 서비스 이용 약관 화면. ⓒ 구글 회원가입 화면 캡쳐

이런 데이터 수집을 바탕으로 현재 빅데이터를 분석하는 산업은 1300억 달러(약 130조 원) 규모로 성장했다. 그 사이 소비자들의 여가 시간은 점점 ‘데이터 생산 시간’으로 바뀌고 있다.

당신의 정보는 이렇게 돈으로 바뀐다 

거대 기업들이 구체적으로 어떻게 데이터를 수집하는지 살펴보자. 구글은 내놓고 적극적으로 정보 수집을 하는 방식이 아니라 물리적 공간(구글 맵), 예상할 수 있는 미래(구글 캘린더), 그리고 인터넷 사용 통계(구글 크롬) 등을 통해 자연스럽게 정보를 수집한다. 아마존은 구매정보와 상품평가 등의 방대한 소비정보를 바탕으로 맞춤형 온라인 광고(targeted online advertising)의 선구자가 됐다. 

페이스북은 처음 페이지 양식을 만들 때부터 사용자들이 최대한 많은 양의 개인 정보를 누설하도록 수많은 디자인 수정을 했다. 웹사이트의 빈칸을 채우고, ‘좋아요’를 누르고, 게시물을 작성하면 컴퓨터 알고리즘이 사용자의 정치적 성향, 소득 및 취미까지 분석한다. 페이스북으로 로그인한 외부 앱이나 웹페이지도 이런 정보와 한 덩어리로 묶인다. 예를 들어 데이트알선 앱인 틴더(Tinder), 금융사이트인 벤모(Venmo) 거래 기록도 엮어서 넣을 수 있다. 

▲ 개인 정보가 드러나는 페이스북 페이지. ⓒ 마크 주커버그 페이스북 페이지 캡쳐

이 구체적인 프로필은 광고주들에게 대량으로 묶여 팔린다. 물론 개인정보를 제공한 소비자겸 생산자(consumer-producer)에게는 아무런 보상이 주어지지 않는다. 이런 과정을 통해 2016년 말 페이스북의 연간 매출액은 270억 달러(약 27조 원)를 넘었다. 구글은 1,360억 달러(약 136조 원), 아마존은 900억 달러(약 90조 원)의 매출로 세계에서 가장 거대한 정보기술 기업의 자리를 유지하고 있다. 

▲ 서로 연동하는 방식으로 사용자 정보를 모으는 기업들. ⓒ 위키피디아

2016년 페이스북 사용자의 1인당 평균 가치는 약 15달러로 계산됐다. 구글의 경우는 약 33달러였다. 이 숫자는 작은 것처럼 보이지만 각각의 사용자 수가 수십억명이라는 것을 감안하면 어마어마한 돈이다. 또 인공지능 등의 활약에 따라 원 데이터를 수익성 있는 정보로 처리하는 능력이 향상될 것이므로, 이 가치는 계속 커질 것이다. 

‘숨겨진 노동’을 보상받을 수 있을까

제약회사의 신약 임상시험에 참여했거나 시제품 테스트에 기여했다면 누구든 보상을 기대할 것이다. 그렇다면 수많은 사용자가 ‘무심결에’ 제공한 정보로 막대한 돈을 버는 기업들에게 우리도 보상을 요구할 수 있지 않을까? 적정한 보상이 이뤄진다면 사람들은 정보를 통한 가치 창출 활동에 더욱 기꺼이, 자발적으로 참여할지도 모른다. 반대로 이런 부가 모두 소수의 개발자와 기술임원들의 손에 넘어간다면 사용자들은 협력하기를 꺼릴 것이다. 

개인 데이터 소유권을 주장할 수 있다면, 사람들은 정보에 대한 보상으로 소득이 오르는 미래를 상상할 수 있다. 예를 들어, 구글 검색 횟수나 페이스북 업로드 건수에 따라 보상을 지급받는 것이다. 유휴 시간에 소셜미디어 활동을 함으로써 얻은 부가적인 가치 덕분에 노동시간이 짧아질 수도 있다. 따라서 빅데이터의 사회적 잠재력을 깨달았을 때 가장 필요한 것은 그 구조에 숨겨진 노동에 대한 인식을 요구하는 것이다.

우리나라에서도 메신저 점유율 90% 이상인 카카오톡의 빅데이터가 오는 6월 출범할 인터넷전문은행 카카오뱅크에 활용될 것으로 보이는 등 사용자 데이터의 상업적 활용이 가속화하고 있다. 빅데이터를 만드는 데 기여한 대중의 노동을 어떻게 보상할지, 논의를 시작해야 하지 않을까.

[기사 원문 링크]
Big Data’s Hidden Labor


IS, 히잡, 국제유가, 그렉시트, 브렉시트, 스위스 국민소득, 인종갈등, 미국대선, 일대일로, 지카 바이러스, 사드, 북핵... 외신을 타고 매일 쏟아지는 뉴스 소재다. 이를 제대로 모르면 현대 세계를 올바르게 이해하기 어렵다. 나아가 무역, 안보에서 생존을 보장받기 힘들다. 인류역사가 제국주의 시대로 변모한 이후, 자본과 권력은 국경을 넘어 세계로 뻗는다. 냉혹한 국제 정치, 경제 무대에서 자본(Capital)과 힘(Hegemony)의 논리를 제대로 꿰뚫어야 하는 이유다. 단비뉴스는 <단비월드>를 통해 국제사회 정치, 경제, 사회, 문화의 표면적인 움직임과 그 이면의 실상을 파헤친다. 난마처럼 얽힌 우리 앞의 과제를 해결하는 동시에 세계평화와 인류 행복을 증진하는 열쇠를 얻기 위해서다. (편집자)

편집 : 황두현 기자 

저작권자 © 단비뉴스 무단전재 및 재배포 금지