데이터과학은 과학일까?

입력 2014-09-24 18:51 수정 2015-03-25 17:47
요즘 유행하는 말이 “빅데이터”입니다. 더 나아가 “데이터과학”이란 말도 나옵니다. 그런데 빅데이터란게 무엇일까요? 말 그대로 “방대한 양의 자료”입니다. 데이터과학은 그러한 방대한 양의 자료를 다루는 학문을 가리키는 용어로 쓰입니다. 그런데, 데이터과학이란 용어는 “공공연한 비밀”처럼 형용모순(oxymoron)입니다. 비밀이 공공연할 수가 없는 것처럼 “데이터”만으로는 과학이 될 수 없습니다.

과학은 논리체계와 경험적 근거를 활용한 인식의 방법입니다. 즉 과학이기 위해서는 데이터뿐 아니라, 그 데이터와 일치하는 이론이 필요합니다. 그런데 과학 앞에 “데이터”라는 용어로 수식하게 되면, 과학의 또 다른 요소인 “이론”은 사라지고 맙니다.

데이터과학이라고 뉴스페퍼가 소개한 데이팅싸이트 오케이큐피드의 자료 역시 데이터과학이 왜 형용모순인지 잘 보여주는 사례라고 할 수 있습니다.

아래 그림은 오케이큐피드의 공동창업자가 최근 자료재앙(Dataclysm)이라는 책을 내면서 소개한 남녀의 선호도 차이를 보여주는 자료입니다. 여자는 대체로 자신의 나이와 비슷한 남자를 선호합니다. (왼쪽 세로축이 여자의 나이이고, 빨간 색 숫자가 선호하는 남자의 나이입니다.)



 

그런데 남자는 20대건 50대건 20대 초반의 여자를 선호합니다. (왼쪽 세로축이 남자의 나이이고, 빨간 색 숫자가 여자의 나이입니다.)



만일 10대 남성이 조사대상에 포함됐어도 비슷한 결과가 나왔을 겁니다 (이를 뒷받침하는 연구도 있습니다. 남자 청소년들을 상대로 한 조사에서 데이트 상대로 매력적인 이성의 연령대를 10대가 아닌 20대 초반 “누나”인 것으로 나타났습니다.)

이 자료를 보면 누구나 피식 웃지 않을 수 없습니다. 실제로 저자의 강연에서 청중은 폭소를 터뜨렸다고 합니다.

그러나 어떤 현상을 기술(describe)한 자료만을 갖고 “과학”이라고 할 수 없습니다. 아무리 방대한 양의 자료를 동원해도 마찬가지입니다. 과학이 되기 위해서는 자료에 나타난 유형을 설명할 수 있는 이론이 있어야 합니다.

그렇다면, 남자는 왜 나이가 적건 많건 20대 초반의 여성을 선호할까요? 후천적인 요소만을 강조하는 사람들은 자본주의 사회의 위선적 문화 혹은 젊은 여성만을 매력적인 존재로 보여주는 “고약한” 미디어 때문이라고 합니다. 그런데, 이는 진정한 원인을 간과한 것일 수 있습니다.

아무리 21세기 첨단과학기술의 시대라고 하지만, 인간은 구석기시대의 원시인의 마음을 그대로 갖고 있습니다. 구석기 원시인보다 지적 능력이 발달했다고는 하지만, 그 발달한 지적 능력은 종종 원시본능을 합리화하는데 쓰이곤 합니다.

남자와 여자의 성차를 잘 설명해 주는 이론이 진화심리학의 이론 중 하나인 생애사이론(Life-history theory)입니다. 생애사이론에 따르면 모든 생명체는 삶의 과정에서 생존과 재생산의 가능성을 극대화하는 방향으로 자원을 배분합니다.

생존 자체가 아쉬운 구석기 원시인들에게 20대 초반의 여성은 지금보다 더욱 중요했습니다. 임신과 출산의 최적시기이기 때문입니다. 따라서 남성은 제한된 자원을 20대 초반의 여성에게 투자하는 것이 생애사의 관점에서 봤을 때 최적의 선택이라 할 수 있습니다. 인류는 그렇게 수백만 년을 살아왔습니다. 산업사회에 들어선지 2백 년밖에 안된 인류에게 구석기 시대에 형성된 본성을 부정하기는 그리 쉽지 않습니다.

우리는 아직도 구석기 원시인입니다.
참고: Delton, A. W., Robertson, T. E., & Kenrick, D. T. (2006). The mating game isn’t over: A reply to Buller’s critique of the evolutionary psychology of mating. Evolutionary Psychology, 4, 262-273.

여기까지 와야 과학이라고 할 수 있습니다. 이런 점에서 데이터과학은 과학의 한 방법론이라고 보는 것이 더 정확하다고 할 수 있습니다. 그렇다고 해서 "데이터과학"이란 용어 자체를 써서는 안될 것 까지는 없습니다.  다만 데이터과학이 무엇인지 보다 정확하게 알고 쓰자는 것이지요.

 

 
서울대 동양사학과를 졸업하고 한국경제신문에서 기자로 사회에 첫 발을 디뎠습니다. 미국 University of Alabama에서 박사 학위(커뮤니케이션 전공)를 받았습니다. 박사 논문 주제는 슬픔과 즐거움의 심리입니다. 주 연구 분야는 미디어 사용이 인지역량, 정신건강 및 의사결정에 미치는 영향입니다.

ⓒ 한경닷컴, 무단전재 및 재배포 금지

광고

투표보험설계사·택배기사 등 노동3권 보장, 어떻게 생각하세요?

  • 특수형태 근로자도 노동조합을 결성하고 교섭을 통해 권익을 보호받을 것 62명 34%
  • 4대 보험 적용 등 고용주의 부담이 늘어나면 일자리가 되레 줄 수도 우려 122명 66%
광고