빅데이터 인문학 권남희 수필교실 추천도서
권남희 수필교실추천도서 (한주씩 나누어서 소개합니다)
빅데이터 인문학 에레지 에이든 & 장바티스트 미셀 지음 . 김재중 옮김(고대 영어영문과 졸업 경향신문 기자) .사계절 출판 -800만권의 책에서 배울 수 있는 것들-
에레지 에이든( 2010년 하버드와 MIT의 의학.공학 통합프로그램인 Health Science and Technology )에서 박사학위를 받았다. 그의 학위논문은 새로운 기술의 발명과 수학, 물리학이론을 통합한 공로를 인정받아 ‘허츠 논문상’과 미국 물리학회가 주는 최우수 박사학위 논문상을 수상했다. 2011년에는 동료들과 함께 HI-C라는 신기술로 인간게놈이 3차원적 구조를 규명해내는 논문이《사이언스》의 표지를 장식했고 ‘젊은 과학자에게 수여하는 미국대통령상’을 받았다. 수학, 분자생물학, 언어학, 웨어러블 컴퓨팅, 고분자 물리학 등 여러 영역을 남나들어 ‘과학계의 르네상스인’으로 불리는 그는 2009년 《MIT테크놀로지 리뷰》에서 “ 전 세계 35세 이하 혁신가 TOP 35"로 선정되었고, 2010년에는 최고의 학생 발명가에게 주는 레멜슨-MIT학생상을 수상. 수년간 하버드 명예교우회의 특별연구원과 구글의 방문연구원을 지낸뒤 현재 베일러 의과대학의 조교수로 재직중이다.
장바티스 미셸( 2011년 《포브스》선정 “30세 이하의 주목할만한 30인”으로 뽑혔고 2012년 전 세계 다양한 분야의 혁신가와 개척자들의 네트워크인 “ Ted Fellow"로 선정. 2005년 프랑스 파리의 에콜 폴리테크니크를 졸업. 하버드응용수학석사학위. 시스템 생물학으로 박사학위. 세계적 석학 마틴 노왁 하버드교수가 이끄는 ‘진화 생물의 기초적인 질문’프로젝트의 참여연구원이자 구글의 방문연구원을 지냄. 인간의 삶과 밀접한 관련이 있는 현상들을 수량화하는 데 관심이 있는 그는 데이터 과학을 기반으로 한 회사인 ‘Quantified Labs'를 설립하고 과학자이자 기업가로 활동)
전 세계 도서관의 서가에 꽃혀있는 모든 책을 읽을 수 있는 로봇이 있다면 ? 이 로봇 역사학자에게 우리는 무엇을 배울 수 있을까 ? 구글의 야심- 단하나의 도서관
디지털 지문( 1만년전 선사시대 양치기들은 주기적으로 양을 잃어버렸다. 그들은 불면증 환자들의 충고를 받아들여 양의 머릿수를 잘 셀 수 있는 아이디어를 떠올렸다. 노름꾼들이 얼마나 땄는지 기록하기위해 포커칩을 사용하듯, 양을 가리키는 패(Counter)로 돌멩이를 사용했다.4000년이 넘는 기간동안 사람들은 갈수록 많아지는 제산목록을 기록할 때 돌멩이에 무늬를 새기는 단순한 도구인 첨필( Stylis)을 사용했다. 그후 그보다 엄청나게 큰 돌 하나를 가져다가 바늘로 무늬들을 나란히 새겨넣는 쪽이 더 쉬웠다. 이로써 쓰기Writing이 탄생했다..... 선지자Proper이 글이 있기 훨씬 전에 이윤Profit의 글이 먼저 있었던 셈이다.....고대사회에서 살아남은 것은 영수증 더미이다. 많은 문명이 종종 문화사와 관련지어 생각하는 위대한 저작물들을 기록하고 후세에 남기는 단계까지 가지 못했다.
이런 기록들을 생산한 영리업체들이 아니었더라면 우리는 그것들이 유래한 문화에 대해 아주 조금밖에 알지 못했을 것이다. 이런 상황은 예전보다 오늘날 더하다. 선조들과 달리 오늘날의 기업들은 사업을 하는 과정에서 생겨난 단순한 부산물로서 기록들을 남기는 것이 아니다. 구글이나 페이스북, 아마존같은 회사들은 사용자들이 인터넷에서 자신을 드러내고 교류할 수 있는 도구를 만든다. 이런 도구들은 디지털화된 개인적, 역사적 시록들이 쌓여야만 작동한다. 이런 회사들은 인류문화를 기록하는 것이 핵심사업이다. 이것은 웹페이지,블로그, 오날인 뉴스와 같이 대중적인 소비를 꾀하는 것들의 단순한 기록이 아니다. 우리의 개인적인 커뮤니케이션은 이메일을 통해서건, 스카이프를 통해서건 , 아니면 문자메세지를 통해서건 온라인에서 점점더 많이 이루어진다. 이 메세시들 가운데 상당수는 어딘가에 어떤 형식으로, 종종 여러 개체에 의해 , 이론적으로는 영원히 보존된다. ......우리는 영구적인 디지털 지문을 남긴다. .....우리가 현대적인 삶이 제공하는 모든 것을 경험하고 , 삶의 점점 더 많는 부분들을 인터넷상에서 영위하게 되면서 우리의 디지털 부스러기는 점점 더 철저히 자취를 남기기시작했다. 우리 개개인이 남기는 기록은 그 폭과 깊이가 믿기어려울 정도다.
빅데이터-연구자들의 신대륙( 이 정보들을 합하면 그 양이 얼마나 될까? 컴퓨터 과학에서 정보를 측정하는데 사용되는 단위는 2진수(binary digit)를 줄인 비트다. ‘예-아니오 질문’의 답을 1비트로 볼 수 있는데 1은 ‘예'고 0은 ’아니오‘다. 8비트는 1바이트byte로 불린다. 현재 보통 사람의 데이터 발자국, 즉 전 세계적으로 한사람이 연간 만들어내는 데이터의 양은 거의 1테라바이트에 가깝다. 이것은 약 8조개의 ‘예-아니오 질문과 맞먹는 양이다. 집단적으로 보면 인류는 매년 5제타바이트의 데이터를 만들어낸다. 40,000,000,000,000,000,000,000(400해 비트)다. 1메가바이트정보를 손으로 쓴다면 1과 0행렬은 에베레스트 산보다 다섯배 높다. ...이런 종류의 기록을 빅데이터라 부르는 이유이고 빙산의 일각인 이 데이터는 2년마다 두배씩 늘고있다. .....디지털 기록이 풍부하고 연산력(computing Power)이좋아지면 인류문화를 들여다보기에 안성맞춤인 위치를 확보할 수 있을 것이다.