검색의 미래
일요일, 9월 21, 2008
날짜: 2008년 9월 22일 월요일
저는 검색광(狂)입니다. 본래 묻기를 좋아하는 성격이고 항상 무언가 발견하는 것을 좋아했으며, 게다가 구글에서 검색 분야로 9년 하고도 3개월을 일하고 있습니다. 당연한 말이지만, 검색도 매우 많이 하고 있지요. 그러나 제가 실제 검색하고 있는 정보는 검색할 수 있는 전체 정보의 20%에 불과하다는 생각이 듭니다. 그래서 지난 토요일 실험을 해봤습니다. 지인들과의 대화 중에 나오는 말 중에서 당장 검색해보고 싶지만 그렇지 못한 것이 무엇인지 추적해보았습니다. 다음은 그 중 몇 가지 입니다.
"fab", "goy", "eely"라는 단어가 실제로 있을까? (저와 제 동료들은 단어 만들기 게임을 하고 있었다.) JC 페니의 토요일 개장 시간은? 바나나 슬러그(Banana Slug)라는 팀이 속한 학교는? 산호세 주립대 팀의 마스코트는? 수력 발전댐의 발전 용량은? 칠면조의 무리를 지칭하는 말은? 영화 '트로픽 썬더'의 상영 시간은? 아일랜드 플루트 연주 대가인 제임스라는 사람의 풀네임은? 모스크바와 세인트 피터스버그 다음으로 러시아에서 큰 도시는? 아메리카 삼나무와 사이프러스 나무 중 더 오래된 나무는? 가장 나이가 많은 생물은 무엇이며 현재 나이는? "Queen of Hearts"를 부른 사람은? 저기에 날고 있는 새의 종류는? 샌프란시스코의 "LF"는 유니온 스퀘어에 있는가 아니면 유니온 스트리트에 있는가? 찰스톤 댄스 스텝은 어떻게 하는 것인가? The Lawrence Welk Show는 무슨 요일에 했나? 앨범 "In the Mood"에 나오는 가사 내용은? 쿠마딘과 아스피린은 혈액을 묽게 하는 효과가 어떻게 다른가? 10의 100제곱을 뜻하는 “구골(googol)”의 이름에 관한 사연은?
제가 기억하고 있는 것은 이 정도입니다. 이 목록을 살펴보면 두 가지가 분명해집니다. 하나는 제 자신이 훨씬 더 많은 검색을 할 수도 있었다는 점이고, 또 하나는 검색에는 여전히 혁신과 변화, 진전을 위한 수많은 기회가 있다는 점입니다. 사용자의 요구를 충족시키기 위해 검색은 진화해야 하며 이를 위해 필요한 방법 또한 많이 있습니다. 지난 토요일 제가 답을 못 찾은 일부 질문들을 보면서 검색이 향후 10년간 어떻게 변하게 될지 생각해 보았습니다.
검색 방식의 변화
당장 필요한 정보인데도 사람들은 왜 바로바로 필요할 때 마다 검색을 하지 못했던 것일까? 검색이란 것이 여전히 접근성이 떨어지기 때문입니다. 언제 어디서든 검색을 할 수 있어야 합니다. 다시 말해 휴대폰이나 달리는 차에서도 휴대용 기기로 가능해야 하고, 아직은 개발되지 않았지만 몸에 착용하는 입는 컴퓨터를 통해서도 검색은 쉽게 할 수 있어야 합니다. 예를 들어, 보트를 타는 도중에 ‘나이가 가장 많은 생물이 무엇인가’라는 얘기가 나왔다면 모두들 답을 궁금해 하겠지만 그렇다고 해서 느리고 잘 갖춰지지 않은 장비로 검색을 하겠다며 분위기를 깨고 자하는 사람은 없을 것입니다. 따라서 대화를 중단하지 않으면서도 언제 어디서나 검색을 할 수 있는 기기가 있다면 매우 좋을 것입니다. 조금 억지스런 생각이지만 대화 중 나온 말들을 골라내 이를 바탕으로 자동 검색하여 연관된 사실을 실시간으로 보여주는 입는 컴퓨터가 있다면 어떨까요?
이 같은 개념은 검색의 “방식”이 기존의 텍스트에서 음성이나 자연언어로 변할 것이라는 점을 시사합니다. 타이핑을 하는 것이 아니라 직접 음성으로 검색엔진에 말을 건네는 것입니다. 질문은 구두로 던질 수도 있고 자연어 방식대로 입력할 수도 있습니다. 다시 말해, 검색을 한다고 해서 반드시 키워드 형식으로 생각할 필요는 없는 것입니다.
여기서 더 나아가면 검색이 꼭 단어로만 움직일 필요도 없습니다. 머리 위로 날아가는 새를 찍은 사진을 검색 쿼리로 입력해 검색엔진이 어떤 종류의 새인지 구별하도록 할 수는 없을까요? 동영상을 따서 검색엔진이 그 소리(음악 혹은 대화의 일부)를 구분한 뒤 이에 관한 정보를 말해주도록 할 수는 없을까요? 오늘날에도 이같은 서비스가 부분적으로는 가능할지 몰라도, 사용이 편리하면서도 일관된 방식으로 제공하는 것은 아직 불가능합니다.
향후 10년 안에 우리는 검색의 방식이 정말 빠르게 발전하는 것을 볼 것입니다. 몇 가지 예를 들면 모바일 기기를 통해 보다 편리하게 검색을 할 수 있고, 보다 많은 기기들이 인터넷 기능을 갖게 될 것입니다. 검색어는 음성, 자연어, 그림, 또는 노래로 입력하거나 표현될 것입니다. 현재의 키워드 기반의 검색은 매우 강력한 것인 반면 한편으론 매우 제한적입니다. 따라서 새로운 검색 방식이 실현될 경우, 검색에 있어 가장 획기적인 변화가 일어날 것입니다.
미디어의 변화
검색의 방식 다음으로 검색 결과를 표현하는 미디어의 변화가 예상됩니다. 현재 인터넷 검색 결과에서 볼 수 있는 10개의 파란 줄 링크만하더라도 매우 놀라운 발전이며 이로 인해 사람들의 생활이 바뀌었습니다. 그러나 만약 여러분이 찰스턴 댄스 스텝을 배운다고 하면 텍스트 기반의 웹 페이지 보다는 비디오가 더 큰 도움이 될 것입니다. 따라서 검색 결과를 표시하는 미디어가 무엇이냐 하는 점은 중요할 수 밖에 없습니다.
지난 5월 발표한 유니버설 서치는 구글 검색 결과에서 이미지, 비디오, 뉴스, 책, 지도/현지 정보를 모두 아우르는 것을 보여주기 위한 중요한 첫 단계였습니다. 그러나 우리가 보여주는 것은 여전히 평면적으로(리스트 형식의 검색결과와 검색 결과간에 정보의 중요성이나 크기에 대한 우열이 없음) 되어 있습니다. 만일 결과 페이지가 대대적으로 변해서 서로 다른 형태의 검색 결과를 모아 단순히 10개의 독립된 답변 그 이상으로 만들어 진다면 어떨까요? 결과 페이지가 제일 앞에 있거나 가장 큰 것을 기준하지 말고 가장 연관성이 높은 미디어만을 모아서 유용한 콘텐츠를 보여주면 어떨까요? 필요한 콘텐츠를 기둥 모양으로 한 곳에 모아 제시하고 여백으로 남는 화면은 스크린이 더욱 새롭고 넓은 제품에서 그 활용도를 높이면 어떨까요?
유니버설 서치는 이제 막 선보였지만, 오디오나 비디오와 같은 리치 미디어(rich media)를 통해 우리가 할 수 있는 모든 영역을 탐구해본다는 점에서는 중요한 첫 단계에 들어섰습니다. 지난 1년 동안 우리의 목표는 이러한 새로운 형태의 검색 결과를 잘 활용하고, 인터페이스 디자인과 이에 따르는 사용자 경험을 개선하는 것이었습니다. 앞으로 몇 개월이면 이 같은 실험의 결실을 보게 될 것입니다. 그러나 이러한 변화는 이제 시작일뿐입니다. 검색의 얼굴은 향후 10년에 걸쳐 극적으로 변할 것입니다. 아마도 더욱 많은 비디오와 이미지를 포함할 것입니다. 아마 검색의 상대적인 중량과 정확도를 정확히 구분해낼지도 모릅니다. 검색어 후보의 자동 제시라는 측면에서 사용자와의 교감은 더욱 커질 수도 있습니다. 이 모든 것은 아직 확실치는 않습니다. 그러나 지금 한가지 확실하다고 할 수 있는 것은 현재 온라인 미디어가 폭발적으로 증가하고 있기에 검색 경험은 정체되지 않고 더욱 더 개선될 것이라는 점입니다.
개인화
10년 후의 검색 엔진은 지금보다 훨씬 더 나아질 것입니다. 이를 자신 있게 말할 수 있는 이유는 구글 자체가 매일 조금씩 더 나아지고 있기 때문입니다. 우리는 검색의 적절성에 대한 새로운 개념에 대해 끊임없이 글을 쓰고 고치면서 거의 매일 새로운 개선책을 내놓고 있습니다. 그러한 개선은 구글은 물론 다른 검색엔진에도 적용될 것이며, 따라서 지금부터 10년 후의 검색 엔진은 몰라보게 좋아질 것입니다. 이제 해야 할 질문은 ‘검색이 좋아질 것인가’가 아니고 ‘어떻게 좋아질 것인가’ 입니다.
미래의 검색 엔진들은 완벽하게는 아니더라도 사용자 개인을 보다 잘 이해하게 될 것은 분명합니다. 물론 여러분 자신이 개인 정보를 직접 관리, 통제할 수 있습니다. 검색엔진이 어떤 개인 정보를 사용하던지 여러분의 승인을 얻어야 하고 그 내용도 투명하게 공개될 것입니다. 그러나 가장 기초적인 사용자 정보만으로도 검색엔진은 크게 나아진 검색 결과를 제공할 수 있을 것이며 또 그렇게 할 것입니다. 아마도 미래의 검색 엔진은 여러분이 어디에 있는지를 알아낼 것이며, 여러분이 이미 알고 있는 사실이라던지 오늘 새로 배운 사실을 알아낼지 모릅니다. 구글에 검색정보를 공유하도록 선택했다면 검색엔진은 여러분이 무엇을 좋아하고 싫어하는지도 알 수 있을지도 모릅니다. 구글은 현재 개인화 된 검색을 연구하고 실험하는데 투자하고 있습니다. 개인화 정보가 훗날 매우 중요할 것이라고 생각하기 때문입니다.
위치
여러분이 어디에 있는가 하는 위치정보는 매우 유용한 개인화 정보일 수 있습니다. 제가 앞서 한 질문들 중(JC 페니의 토요일 개장 시간은? 수력발전댐의 발전 용량은? 영화 '트로픽 썬더'의 상영 시간은?)에 대해 답을 하기 위해서는 우선 제가 검색당시 어디에 있는지를 제 검색엔진이 알고 있어야 합니다. 이와 같이 검색하는 사람의 위치정보는 검색결과에도 큰 영향을 미치기 때문에 사용자의 위치와 문맥을 연결하는 것은 연관성과 미래 검색의 편익을 높이는 데 결정적인 요소가 될 것입니다.
사회적 맥락
개인화의 또 다른 요소는 사회적 맥락입니다. 나는 누구의 친구이며 그들과 어떤 관련이 있는 걸까요? 내가 어떻게 그들의 지식을 더욱 효율적으로 이용할 수 있을까요? 예를 들면, LA의 LF라는 상점에서 일하는 친구가 있다(이는 샌프란시스코에 있는 LF에 관한 질문)고 할 때, "LF" 그 자체는 매우 모호한 약자에 불과합니다. 구글의 첫 검색 결과 페이지에 따르면, 이 단어는 내 친구의 첨단 패션샵을 지칭할 수도 있지만 동시에 Leapfrog Enterprises, low frequency(저주파), Lebhar-Friedman, Li & Fung 투자 그룹, LF 드리스콜 건설 관리, large format(대용량), 혹은 렉서스의 컨셉트 카를 지칭할 수도 있습니다. 오늘 "LF"를 입력하는 사람은 이런 결과 중에서 어떤 게 올바른 것인지를 알아야 합니다. 그래서 검색은 모호한 단어에서 "모호성을 제거" 하는 것입니다. 하지만 이는 검색엔진이 풀어야 할 과제입니다. 아마도 우리는 샌프란시스코에서 LF는 어디에 있는가라는 질문을 의미론적 차원에서 이해할 것입니다. 이렇기 때문에 LF가 패션샵을 지칭한다는 것도 추론하는 것입니다. 혹은 검색이 나의 사회적 그래프를 분석해 내 친구 중 한 명이 LF에서 일을 하며 내가 이번 주말에 그 친구를 만났다는 것을 알아낸다면 이런 맥락에서는 "LF"는 내 친구가 일하는 장소를 지칭하게 됩니다. 사용자의 검색어를 더욱 정확하게 다듬거나 모호성을 제거하기 위해 앞으로 사용자의 사회적 그래프를 알고리듬으로 분석하면 그 유용성이 드러날 것입니다.
여기에 더해 실제로 친구의 도움이 필요한 검색도 있습니다. 저는 아스피린과 쿠마딘(Cumadin)에 관한 질문에 답을 찾는데 고생을 했습니다. 왜냐하면 쿠마딘의 스펠링을 'cumitin'으로 잘못 입력했는데 구글이 제대로 정정해주지 않았기 때문이지요. 저는 의사 친구에게 메일을 보내고서야 제대로 된 작업을 할 수 있었습니다. 올바른 스펠링을 바탕으로 두 약의 차이에 대한 그의 설명을 들었을 때 저는 이 두 약이 피를 묽게 하는데 어떻게 쓰이는지를 훨씬 더 많이 검색하고 알아낼 수가 있었던 것입니다. 사용자의 사회적 그래프에는 전문지식, 일반지식, 문맥 등이 많이 존재합니다. 따라서 "친구한테 물어봄으로써 한층 보강된" 검색이 손쉽게 이뤄지는 곳에 검색 도구를 활용할 수 있게 한다면 더욱 효율적인 검색이 가능하고 연관성 높은 결과를 얻을 수 있습니다.
언어
위에서 든 예는 검색의 방식, 미디어, 개인화의 다양한 형태가 어떻게 광범위하게 검색을 개선하는 잠재성이 있는지를 보여줍니다. 하지만 언어는 어떤가요? 웹 상에 분명 해답이 존재하지만, 사용자가 모르는 언어로 쓰여있는 경우가 많이 있습니다. 이런 점 때문에 구글은 기계 번역에 투자하고 있습니다. 우리는 어떤 사용자가 어떤 언어를 쓰던 웹 검색의 혜택을 누릴 수 있게 하고 싶습니다. 기본적인 컨셉은 이렇습니다 – 어디에서든 어떤 언어이든 온라인상에 답이 존재한다면 우리는 그것을 찾아 사용자의 모국어로 번역을 해서 보여주자는 것입니다. 이는 매우 강력한 아이디어로서, 사용자가 웹을 경험하고 특히 자국의 언어로 쓰여진 콘텐츠가 많지 않은 곳에서 상호 의사 소통하는 방식을 바꿀 수도 있습니다. 이 분야에 관한 초기 연구와 관련 해서는 구글의 교차언어 정보 검색툴을 방문하면 보다 상세한 사항을 알 수 있습니다.
결론
우리 모두는 80-20의 문제, 즉 마지막 20%만 해결하면 문제의 80%가 해결된다는 원리를 잘 알고 있습니다. 이에 비한다면 검색은 90-10의 문제라고 할 수 있습니다. 즉 90%에 대해서는 답을 알고 있습니다. 지난 토요일에 제가 궁금했던 것들 대부분은 답을 찾을 수 있는 것들입니다. 물론 검색을 활용하면 더 쉽게 답을 구할 수 있겠구요. 그러나 우리가 답을 못찾는 나머지 10%가 실질적으로는 90%를 차지한다고 볼 수 있습니다. 이동성, 방식, 미디어, 개인화, 위치, 사회적 맥락, 언어의 도전에 맞서 적합한 솔루션을 내놓기까지는 수 십 년이 걸릴 것입니다. 검색은 앞으로 수백 년간 발전하고 진보하게 될 과학입니다. 1500년대나 1600년대의 생물학이나 물리학을 생각해보세요. 이런 점에서 검색은 항상 크고 흥미진진한 획기적 발견을 만드는 신생 학문입니다. 우리가 현미경을 갖고 검색이란 유명한 분자와 원자를 이해하는 데는 백 년 혹은 그 이상의 시간이 걸릴 수도 있습니다. 수 백 년 전의 생물학과 물리학이 그랬듯이 가장 큰 진전은 이제부터입니다. 바로 이점 때문에 인터넷 검색 분야가 흥미로운 것입니다.
이상적인 검색 엔진이란 과연 무엇일까요? 검색이란 아마도 세상에 존재하는 모든 사실을 비롯해 여러분이 본 것과 알고 있는 모든 것들을 사진처럼 저장해두고, 이들을 원할 때마다 바로바로 찾아볼 수 있도록 하는 최고의 친구가 아닐까요. 이상적인 검색엔진이라면 사용자가 기존에 갖고 있는 지식과 무엇을 좋아하고 싫어하는지 사용자 기호도 고려해서 답을 찾아줄 것입니다. 그것도 가장 알맞는 미디어의 형태로 명확한 답을 말입니다.
지난 10년간 구글은 기대이상으로 검색 속도와 검색 편리성에 큰 발전을 가져 왔습니다. 하지만 향후 10년 더 발전할 구글 검색의 미래를 머리 속에 그려보면 흥분된 마음을 감출 수가 없습니다.
작성자: 검색 담당 총괄 부사장 마리사 메이어 (Marissa Mayer)
댓글 없음 :
댓글 쓰기