2009년 9월 19일 토요일

구글, 자료 집대성의 끝을 향해 달리다


[ 도서 ] 구글, 신화와 야망
랜달 스트로스(Randall Stross), 고영태 | 일리 | 2009/07/02
평점
상세내용보기 | 리뷰보기(8) | 관련 테마보기(7)
등록된 글자수 : 3954 글자

 우리나라에서 쓰는 최고의 검색포털 사이트를 묻는다면 대부분 Naver를 꼽을 것이다. 그러나 최고의 검색엔진을 갖춘 사이트를 꼽는다면 인터넷을 좀 한다는 사람들은 다름 아닌 Google을 이야기할 것이다. Naver의 경우에는 지식in과 같은 콘텐츠들이 대량으로 구비되어 있기 때문에 정리된 정보를 사람들이 간단하게 찾을 때 유용하게 쓰일 수 있지만, 정작 산재된 정보들을 하나로 끌어 모으는 목적으로 검색을 할 때에는 Google이 훨씬 유용하다는 소리다. 그리고 이는 비단 우리나라뿐만 아니라 외국에서도, 아니 외국에는 더욱이나, Google이 검색목적으로 많이 쓰이는 이유이다.

왜 Google은 그렇게 강력한 검색능력을 갖추게 되었을까?
그리고 그러한 검색능력을 갖추는 데에는 어떠한 마인드가 바탕이 있었을까?
이 책은 Google이 어떠한 신조를 가지고 시작을 했으며 어떻게 지금의 회사로 성장을 해왔는지 자세히 이야기하고 있다.

 

 적잖은 IT회사들이 그렇듯, Google또한도 최초의 사무실은 차고에서부터 시작이 되었다. 창업자는 래리 페이지와 세르게이 브린이었으며, 모두 컴퓨터 사이언스를 전공하여 박사과정을 마치지 않은 상태였다. 그러한 엔지니어의 사고를 가진 그들은 모든 정보는 알고리즘으로 정리될 수 있으며 이 모든 정보들을 하나로 집대성할 수 있는 날이 언젠가는 올 것이라는 이상을 가지고 있었다. 그렇게 그들은, 어떻게 본다면 허무맹랑한 꿈을 가지고 검색엔진 사이트 운영을 시작하였다.

 

 그러나 현실은 그다지 녹록치 않았다. 이미 그 당시에는 Yahoo!나 AOL같은 쟁쟁한 검색포털 사이트들이 포진해 있었고, 막강한 자본력과 콘텐츠, 유료회원들을 확보하고 있었기 때문에 Google이 다른 회사들보다 뛰어난 무언가를 가지지 않는다면 더 이상 참여할 시장이 없을 것임은 불 보듯 뻔한 것이었다. 실제로 그들의 시작 초기에는 텍스트 광고를 이용하여 나름대로의 수익 창출을 꾀하였지만, 한정된 이용자 수로는 어림도 없었다.

 

 그러나 터널의 끝에는 빛이 있으리라고 했던가. 그 당시 Yahoo!는 검색로봇이 아닌, 편집자들을 고용해서 일일이 인터넷 사이트들을 분류하는 방식으로 검색포털을 운영하고 있었다. 그러나 웹의 성장속도가 사람의 분류속도보다 월등히 빨랐기 때문에, Yahoo!는 자신들의 능력이 닿지 않는 범위의 사이트들을 다른 회사의 검색 엔진을 외주하여 보완하는 방식을 펼쳤다. 그러나 대부분의 검색 엔진의 검색 능력은 다 고만고만했기 때문에 Yahoo!는 이들 엔진들을 정기적으로 교체하였다. 그러는 와중에 Google에게도 그러한 계약이 맺어진 것이다. Google의 검색엔진 초기에는 다른 회사들과 별 다를 바가 없었지만, 그들의 검색방식인 알고리즘 검색은 입력되는 데이터가 많을수록 정교해지고 정확해지는 특성을 가지고 있었다. 그러한 특징과 한정된 방문객을 가지고 있던 Google에게 이 Yahoo!와의 계약은 가뭄에 단비가 아닐 수 없었다. 그래서 Google은 이를 바탕으로 수많은 데이터들을 수집할 수 있었고, 훨씬 더 정교한 검색 알고리즘을 가지는데 바탕이 되었고 결국은 타 검색포털을 위협할 정도로 성장할 수 있었다. Yahoo!는 2년 뒤에 뒤늦게 검색 엔진을 바꿨지만, 이미 Google이 자사 홈페이지만으로도 충분히 성장한 뒤였다.

 그러한 알고리즘을 저장하는데 에는 하드위어가 필수였다. 다른 무수한 대기업 데이터저장소는 막강한 자본력을 바탕으로 넓고 냉각이 잘 되었지만, 한정되고 초라한 Google의 자본력은 Google이 차고에서 시작하여 좁은 공간에 그다지 성능이 좋지 않은 하드웨어밖에 허락하지 않았다. 그러나 Google의 공동창업자는 컴퓨터에 대해서는 도사였다. 그들의 검색엔진 운영방식은 한정된 하드웨어에서도 최적의 성능을 낼 수 있었으며, 그 당시 닷컴열풍의 거품이 무너지던 시기여서 싸게 매각된 데이터 저장소들을 그야말로 거저먹을 기회가 맞물렸다. 그렇게 Google은 점차 대기업 못지않게 나름대로의 성장을 도모할 수 있었다.

 시간이 지나면서 Google은 자료의 집대성을 검색에만 한정짓지 않았다. 검색엔진의 성능을 높이기 위해서는 검색어를 넣는 사람의 필요를 알아야 했는데, 이는 대량의 방문객들이 입력한 검색어와 검색된 사이트에서 클릭된 경향을 바탕으로 수집될 수 있었다. 이렇게 Google의 자료 수집은 점차 사람들의 키워드에 따른 성향파악으로 확장되었고, 이는 개인정보를 입력해야지 검색서비스를 제공하여 광고수익을 얻는 타 검색포털과 차별화되었다. Google은 키워드만으로도 그들에게 구미를 당기게 하는 광고를 띄울 수 있었고, 이는 현란한 배너가 아니라 소박한 텍스트 광고로도 충분하였다.

 더 나아가 Google은 온라인에서 오프라인의 자료까지 확장하였다. 그것은 바로 이 세상에 존재하는 모든 책들을 수집하여 인덱스를 구축하고 웹에서 검색가능하게 만드는 것이었다. 이는 이전에 오픈 북 얼라이언스나 구텐베르크 프로젝트에서도 시도된 일이 있었지만, 워낙 저작권 업체와의 문제나 한정된 참여 단체의 영향으로 크나큰 한계성을 가지고 있었다. Google은 주로 대학 기관과 협의하여 대학 도서관을 스캐닝하는 방식을 취하였고, 최소한의 비용으로 최대한의 스캐닝을 하고자 고민하였다. 책의 저자는 아마도 Google이 스캐너가 아니라 디지털 카메라로 찍는 방식이 아닐까 추측하기도 했다.

 자료는 텍스트나 그림에만 한정되는 것이 아니었다. Google은 동영상에도 손을 대었다. 처음에 Google은 '쓸 만한' 동영상만을 올리길 고집하였고, 대개 TV프로그램이나 다큐 등의 동영상을 중심으로 구축하고자 하였다. 그리고 검색 방식은 동영상 자막을 이용하는 방식이었다. 그러나 그러기에는 콘텐츠의 한계가 컸고, 동영상 자막이 있는 동영상은 더욱이나 한정되었다. 그러던 와중에 YouTube가 있었다. YouTube또한 한정된 콘텐츠로 미미한 시작을 하였지만, 결국 추천 동영상을 원하는 이메일로 링크를 보내기 등등의 전략으로 점점 입소문이 나게 되었고, 동영상이 퍼지는 속도가 급증하게 되었다.

 그리고 Google은 이메일까지 손을 뻗었다. 이메일은 원래 검색포털의 전유물이었고, Google은 단지 검색만을 위한 사이트로 그들과 차별성을 가지고 있었다. 그러나 이메일에 대해서도 검색의 개념을 도입한다면? 이러한 개념을 가지고 Google은 이메일 서비스 안에 검색창을 당당히 넣었고, 나중에 추가하였지만 이러한 검색기능 때문에 삭제 기능이 필요치 않다고 하여 삭제버튼을 일부러 넣지 않기도 하였다. 무엇보다도 Google이 당당할 수 있었던 점은, 타 포털사이트들은 이메일의 내용을 보면서 개인정보를 수집할 수 있다는 불안감이 있었지만, Google의 모든 자료수집방식은 컴퓨터를 이용한 방식이었기 때문에 사람에 의한 사생활 침해가 적다는 장점이 있었다. 물론 그래도 의혹은 없어지지 않고 있다.

 컴퓨터 네트워크 방식의 다음 세대는 중앙집중화 컴퓨터 방식이라고 한다. 이를 영어로 Cloud Computing이라고 하는데, Google은 이 개념에 따라 현재 각 컴퓨터에 설치되어 있는 Office를 온라인으로 옮겨버렸다. 이는 이전에도 시도된 바가 있었지만, Google 정도의 영향력 있는 기업이 본격적으로 실행하였고 급기야는 Microsoft의 영역을 직접적으로 건드렸다. Microsoft는 그 당시에도 Office 제품들을 각 컴퓨터에 판매하여 설치하는 방식을 취하고 있었는데, 만약 Google의 온라인 Office 시스템이 대중화되기 시작한다면 Microsoft의 Office 판매량은 급감할 것이 불 보듯 뻔하기 때문이다. 아직까지 온라인 Office의 기능적 한계가 많기 때문에 Microsoft의 입지가 뒤바뀌지는 않겠지만, 적어도 시장에 영향이 갈 것은 틀림없는 사실이고, 향후 네트워크 속도가 빨라진다면 온라인 Office의 기능이 더욱 막강해질 것이기 때문에 Microsoft에게 작지 않은 위협이 될 것이다.

 그리고 지구상의 모든 지리 정보를 담는다면 어떻게 될까? Google은 드디어 이 영역에도 마구(?)를 뻗쳤다. 사실, 위성사진을 통째로 온라인에 옮겨 담는 일은 미국 국방성이 유일하였다. 그러나 십 수 년 전부터 그러한 제한 이 풀리고 기업들이 위성을 쏘아 올리면서 온라인으로도 위성사진을 볼 수 있게 되었다. 그 중에 하나가 바로 KeyHole이라는 벤처기업이었다. 그들이 하고자 하는 것은 바로 사용자들이 컴퓨터로도 세계여행을 하는 것처럼 그러한 간접경험을 하도록 서비스하는 것이었다. 나중에 Google도 이 기업에 관심을 가지게 되었고 결국은 인수하여 협업을 하게 된다. 더 나아가 StreetView라는 서비스를 함으로써 길마다의 사진을 찍어서 사람들이 가보지 않은 지역에 대해서도 가 본 것처럼 상세히 정보를 알 수 있게 되었다.

 Google은 이제껏 세상의 모든 자료의 2~3% 밖에 모으지 않고, 더 나은 하드위어로 집대성하는데 300년이 걸릴 것으로 내다보았다. 단순한 먼 시간이 아니라 유의성 있는 계산을 통해서 내놓은 수치이겠지만, 예측치 못하는 컴퓨터의 발전 속도를 감안한다면 아마도 100년 이하가 되어도 이상하지 않을까 생각이 된다. 그 때까지 Google이 살아남는다면, 그 기업의 모토인 '모든 자료를 개방하여 모든 사람들이 쓸 수 있게 한다.'는 결코 이상에 지나지 않을 것이다.

 평소 Google에 관심이 많았기 때문에 이 책을 읽으면서 많은 면들을 엿볼 수 있었습니다. Google의 성장 마인드, 어떤 난관이 있었는지, 그리고 여기에는 자세히 언급하지 않았지만 Google의 정보수집 방식에 대한 저작권 업체나 사생활 보호를 위한 사회단체와의 수많은 갈등들을 보면서 그래도 Google은 그들 나름대로의 신조를 지키고 여기까지 이끌어왔다는 것에 대해서 감탄을 금치 못했다.

또한 이 책을 쓴 필자에 대해서도, 무슨 매니아가 쓴 것처럼, 처음부터 2008년까지의 과정들을 세세하고 군더더기 없게 잘 풀어놓았고, 그에 대한 주석을 40쪽 가량 할애할 만큼 풍부한 정보들을 바탕으로 글을 썼다. 무엇보다도, Google에 대해서 어떠한 판단도 피하고자 중립적으로 쓰고자 하는 노력에 대해서도 빼 놓을 수가 없을 것이다.

 Google에 대해서 궁금한 점이 많은 네티즌이나, 일관된 가치관을 가지고 끊임없이 변화를 추구하는 기업을 운영하고자 하는 사람은 아마도 이 책이 그 사람을 위한 책이라 하여도 과언이 아닐 것이다.


구글, 검색, Google, 경영

댓글 3개:

  1. 저도 이 책을 읽고 있습니다. 최근에 구글에 관심을 가지게 왰는데 읽으면서 구글에 대해 몰랐던 점들을 많이 알아가는 것 같습니다.

    답글삭제
  2. trackback from: 2009/09/21 오늘 본 게임/개발/IT 기사
    Gamasutra - News - GDC Austin An Inside Look At The Universe Of Warcraft: parkpd.egloos.com 에 가보시면 한글로 정리해놓은 요약본이 있습니다. Gamasutra - News - Sponsored Feature Scaling Ambient Animations for Improved Game Experience: 클라이언트 뉴스 Gamasutra - News - NCsoft's Du..

    답글삭제
  3. @외계인 - 2009/09/19 23:13
    하하 그렇군요 ^-^

    제가 내용을 이것저것 써놔서 요약본 비슷하게 되었네요.

    확실히 이 책은 구글 역사책(?)이라 해도 과언이 아닐겁니다. 구글 외부인 입장으로서는 그야말로 샅샅이 뒤져놓았더군요.

    답글삭제