한국 블로그
Google에 대한 다양한 소식을 확인해 보세요!
구글 검색순위에 담긴 철학
금요일, 7월 18, 2008
날짜: 2008년 7월 18일 금요일
지난번 우디 만버(Udi Manber) 부사장이 검색결과의 랭킹 업무를 담당하고 있는 구글 검색 품질(search quality) 팀에 대해 소개한 적이 있습니다. 만버 부사장은 핵심 랭킹(Core Ranking), 인터내셔널 검색(International Search), 사용자 인터페이스(User Interfaces) 그리고 그 외의 팀들을 포함한 ‘퀄러티(Quality)’ (검색 품질을 담당하는 팀을 줄여서 주로 “퀄러티” 라고 부르고 있습니다) 내의 다양한 팀에 대해 소개 했습니다. 저는 이번 시간에 이 중 한 팀에 대해 보다 자세히 설명 드리고자 합니다. 이는 바로 핵심 랭킹(Core Ranking) 팀입니다.
먼저 제 소개를 드리겠습니다. 제 이름은 아미트 싱할(Amit Singhal)이며, 현재 구글 랭킹 팀에 소속되어 있습니다. 1990년 대학원에서 컴퓨터 과학을 전공하며 처음 검색을 접한 이래로 지난 18년 간 검색분야에서 일해 왔습니다. 학계에서는 검색 분야를 정보검색(IR, Information Retrieval) 이라고 합니다. IR 연구원으로 10년을 일한 뒤 2000년도에 구글에 입사했으며 그 후 지금까지 구글 랭킹업무를 담당하고 있습니다.
구글 랭킹은 사용자의 검색어에 대한 가장 적합한 결과를 찾기 위한 알고리듬의 집합입니다. 구글은 매일 수 억 개의 검색어와 함께 수 십 억 개에 해당하는 웹 페이지 집합을 기반으로 이 같은 작업을 수행하고 있습니다. 이러한 알고리듬은 구글의 검색 서비스로 유입되는 모든 검색어에 적용됩니다. 가장 많이 알려진 구글 웹 검색에 사용되는 알고리듬은 이미지나 뉴스, 유튜브, 구글맵스, 제품 검색, 북서치 등과 같은 다른 검색 서비스에도 새롭게 적용되고 있습니다.
구글 랭킹과 관련해 제가 가장 많이 받는 질문은 “어떻게 랭킹 작업을 하는가?”에 관한 것입니다. 물론 구글과 같은 최신식의 랭킹 시스템을 구축하기 위해서는 많은 작업이 필요합니다. 이전에 블로그를 통해 이 같은 시스템을 가능하게 하는 기술에 대해 분석해 드린바 있습니다. 오늘은 구글 랭킹의 기본이 되는 철학에 대해 간단하게 설명드리고자 합니다.
1) 지역적 적합성을 가장 잘 반영한 결과를 전세계로 전달
2) 간단명료한 구성
3) 수작업의 배제
첫번째 철학은 이해하시기 쉬울 것입니다. 구글은 검색에 대한 열정을 다해 모든 사용자들의 검색이 가장 적합한 결과를 얻기를 원하고 있습니다. 국가나 언어, 검색어의 종류를 막론하고 이상적인 결과를 얻지 못했을 경우에는 이로부터 교훈을 얻어 향후 감색결과에 반영될 수 있도록 노력합니다(검색은 쉽게 풀리는 문제가 아니기 때문에 이 같은 일은 물론 일어나지요).
두 번째 철학 역시 이해하시기 쉽습니다. 모든 시스템 개발자들의 바람이 바로 시스템을 ‘간단명료’하게 하는 일 아니겠어요? 다양한 언어와 광범위한 분야의 검색어에 대한 결과 제공을 위해 더 복잡한 구조의 시스템으로 증가하는 검색어를 커버할 수도 있습니다. 하지만 구글은 검색결과의 품질을 떨어트리지 않으면서 구글의 시스템을 간단명료하게 유지시키는 일에 주력하고 있습니다. 이 같은 노력은 매우 가치 있는 것이기 때문에 계속적으로 진행하고 있습니다. 저희는 매주 10회 가량 랭킹을 변화시키고 있는데 이 같은 변화를 감행함에 있어 간단함은 매우 중요한 고려사항입니다. 구글 엔지니어들은 주어진 검색어에 대해 왜 이 같은 방식으로 페이지가 랭킹되는지에 대해 정확히 이해하고 있습니다. 이처럼 간단하고 이해하기 쉬운 시스템을 통해 구글은 보다 빠른 속도로 혁신을 단행하고 있으며 이는 결과로 나타납니다. 구글의 ‘간단 명료한 구성’ 에 관한 철학은 구글을 이끄는 중요한 핵심 요소 중 하나입니다.
구글 랭킹에 대해 이야기할 때 항상 일반적으로 따라오는 잘못된 질문이 있습니다: 바로 ‘구글은 검색결과를 편집하는가?’에 관한 것입니다. 이에 대한 대답은 ‘수작업의 배제’라는 세 번째 철학에 잘 드러나 있습니다. 웹은 사용자들에 의해 구축된다는 것이 구글의 입장입니다. 페이지를 만드는 것은 사용자 여러분들에 의해 이루어지고 구글은 그 페이지를 연결시키는 역할을 하고 있는 것이지요. 저희는 이 모든 사용자들의 업적을 구글 알고리듬을 통해 활용하고 있다고 볼 수 있습니다. 검색결과에 대한 최종적인 순위는 수작업이 아닌 바로 위대한 인터넷 커뮤니티의 산물을 활용하고 있는 구글 알고리듬에 의한 것입니다. 모든 사람들의 주관적 판단은 그야말로 주관적인 것이라고 생각합니다. 구글 알고리듬에 의해 추출된 정보는 이 같은 개인적 주관성에 비해 훨씬 뛰어난 것이라고 믿고 있습니다.
제대로 된 결과를 얻지 못하는 검색어가 나올 경우, 구글은 이를 랭킹 알고리듬을 보다 향상시킬 수 있다는 가능성의 의미로 받아드립니다. 이것이 검색결과에서 수작업을 배제하고 검색 알고리듬 향상에 주력하는 두 번째 이유입니다. 근본적인 알고리듬의 향상은 단순히 해당 검색어를 향상시키는 일에 그치지 않습니다. 이를 통해 검색어 전체에 대한 결과를 향상시킬 수 있으며 많은 경우 모든 언어에 적용이 가능합니다. 다만 구글에 의해 추천받은 웹사이트들에 대해서는 명확한
정책
이 구축되어 있다는 점을 알려드립니다. 또한 구글의 정책에 위배되거나 기타 위반사항(법률적 요구, 아동포르노, 바이러스/멀웨어 등)이 있는 사이트들에 대해서는 제재조치를 취하고 있습니다.
다음 시간에는 구글 랭킹의 기술적 측면에 관해 현재 시행 중인 최첨단 테크닉의 몇 가지 예를 말씀드릴 예정이니 계속해서 관심 부탁 드립니다. 검색을 향한 저희 검색 연구원들의 열정은 그 누구보다도 뜨겁습니다. 그리고 저는 이 세상에서 가장 멋진 직업을 가진 사람입니다 :-).
작성자: 아미트 싱할(Amit Singhal), 구글 펠로우(Google Fellow)
댓글 없음 :
댓글 쓰기
태그
"웹마스터를 위한 검색 이야기"
[YTN 라디오]구글 인기 검색어
+1
2009 대한민국 검색대회
2015 Google HackFair
개인정보 보호정책
개인정보 취급 방침
갤럭시 넥서스
검색+
검색결과 삭제
검색어 성격별 스마트 검색
검색어 연속 추가 + 버튼
검색의 미래
검색품질
게임
광복절
구글
구글 가족 안전 센터
구글 개발자 핵페어
구글 개발자 행사
구글 검색 이야기
구글 검색 챌린지
구글 검색 통계
구글 검색통계 (Insights for search)
구글 계정 보안
구글 과학 경시 대회(Google Science Fair)
구글 광고 이야기
구글 나우(Google Now)
구글 나이트 (Google Night)
구글 나이트 시즌 2
구글 뉴스
구글 대시보드
구글 도서 검색
구글 도움말
구글 드라이브(Google Drive)
구글 디자인
구글 리더
구글 모바일
구글 문서도구
구글 문화
구글 문화연구원
구글 번역
구글 브레인
구글 비영리단체 프로그램
구글 사이언스 페어(Google Science Fair)
구글 사이트
구글 사이트 도구
구글 세상보기(Google Currents)
구글 소셜검색(Google social search)
구글 아니타 보그 추모 장학금 제도
구글 아트 프로젝트
구글 애드몹(AdMob)
구글 애드센스(AdSense)
구글 애드워즈
구글 앱스 (Google Apps)
구글 오픈소스 라운드테이블
구글 음성검색
구글 이벤트
구글 이스터에그(Easter egg)
구글 인기 검색어
구글 인턴
구글 자이트가이스트(Zeitgeist)
구글 저작권
구글 제품 포럼
구글 지도
구글 창업가 지원팀
구글 채용
구글 캘린더
구글 코드잼 (Google Code Jam)
구글 크롬(Chrome)
구글 크롬(Chrome) OS
구글 토픽검색
구글 트렌드
구글 플러스
구글 플레이
구글 플레이 무비 서비스
구글 플레이 북 서비스
구글 플루 트랜드
구글 필기 검색
구글 한국 블로그
구글 PhD 펠로우십 프로그램
구글 TV
구글검색으로 할 수 있는 100가지
구글과 다양성
구글과 함께하는 모바일 세상
구글러 이야기
구글서브(Google Serve)
구글어스
구글의 개방성
구글의 기부철학
구글의 사회공헌
구글의 정책
구글이 바라본 미래 시리즈 (Google at 10)
구글지도
구글플러스
구글플레이
구글플레이 인사이드 BIFF
글로벌 K-스타트업
기념 로고
기념로고
날씨 레이어
내 계정
넥서스
넥서스7
넥서스플레이어
놀(Knol)
대중교통 내비게이션
더 나은 웹 (betterweb.or.kr)
데이터 센터
두들 이야기
라마단
런던 하계 게임
마케팅 캠페인
만우절
모바일 광고
무인자동차
밴쿠버 동계 이벤트
버추얼 포토워크 코리아
보안
부산국제영화제
블로거 칼럼
블로그 토픽 서비스
비영리단체
비즈니스 포토(Business Photo)
빅텐트 (big tent)
빈트 서프
사진 여행
서평
소프트웨어 업데이트
쇼팽 국제 피아노 콩쿠르
순간 페이지(Instant Pages)
스타트업 채용
스트리트 뷰
아이구글(iGoogle)
악성코드
안드로이드 개발자 랩
안드로이드 마시멜로
안드로이드 마켓 (Android Market)
안드로이드 웨어
안드로이드 M
안드로이드(Android)
안전한 인터넷의 날
알아두면 좋은 정보(Good to Know)
애드센스(AdSense)
애플리케이션
엄마를 위한 캠퍼스
에너지 효율을 위한 5단계
여성의 날
오픈소셜 (OpenSocial)
원박스
웹 브라우저
웹개방성
웹마스터 지식
웹마스터를 위한 검색 이야기
위치 기반 서비스
유튜브
유튜브 뮤직데이 (YouTube Music Day)
유튜브 생중계
유튜브 스페이스 랩
유튜브 심포니 오케스트라(YTSO)
유튜브 어워즈
유튜브 이야기
유튜브 저작권
음성검색
이미지 검색
이집트
이태영박사
인사이드 서치(Inside Search)
인터넷 개방성 포럼
인포그래픽
장학생
접근성
제스처 검색(Gesture Search)
주민등록번호 노출 경고 시스템
지메일
지메일(Gmail)
지식 그래프
지역정보
채용정보
축구응원
취업
캠퍼스 서울
컨슈머 바로미터
케네디 우주 센터
코리아 고 글로벌
코펜하겐 기후 정상 회의
크롬 실험(Chrome Experiment)
크롬 앱 (Chrome Apps)
크롬캐스트(Chromecast)
테크숩코리아
텍스트 큐브(textcube)
통신사 요금 결제
투명성 보고서(Transparency Report)
포스트마스터(Postmaster)
표현의 자유
한글날
한글박물관
행아웃
행아웃 온에어
호우재난정보
A-Pop
Android Marshmallow
Android Wear
Blogger
BOLD
brasil2014
Campus for Moms
Campus Seoul
CEO의 편지
DevArt
Doodle
Enterprise
GDG
Global Impact Awards
google
Google Crisis Response
Google Cultural Institute
Google Developers Hackathon Korea
Google Finance
Google for Entrepreneurs
Google for Entrepreneurs Exchange 2015
Google for Nonprofits
Google Geo
Google I/O (구글 개발자 컨퍼런스)
Google I/O (구글 개발자 회의)
Google Impact Challenge
Google Keep
Google Localization
Google PhD Fellowship Program
Google Play
Google Translate
Google Trends
Google.org
Grow Beyond
HackFair
Hello World!
HTML5
Innovation Heroes
iOS 지원
K-스타트업
K-Pop
Kstartup
Musicking on the Web
MWC
Nexus
Nexus 5X
Nexus 6P
Openness
RRN leak message
SSL 암호화 검색
Start@Startups
Summer of Code
Women Techmakers
YouTube
��$Google I/O (구글 개발자 회의)�
블로그 목록
2015
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2014
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2013
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2012
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2011
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2010
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2009
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2008
12월
11월
10월
9월
8월
7월
웹의 규모는 얼마나 될까요?
구글 데스크톱으로 내 컴퓨터에 있는 문서 한번에 찾기!
여러분의 소중한 개인정보 지메일(Gmail)로 지키세요.
구글 검색 시스템의 핵심 기술
구글 검색순위에 담긴 철학
더욱 향상된 구글 그룹스를 소개합니다.
데이터를 활용한 웹스팸 차단
외부 메일을 지메일(Gmail)로 가져오는 방법
6월
5월
4월
3월
2월
1월
2007
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2006
12월
11월
10월
9월
8월
7월
6월
5월
4월
3월
2월
1월
2005
12월
11월
10월
9월
8월
7월
Feed
Follow @googlekorea
구글 제품 포럼
을 방문하여 여러분의 의견을 공유해 주세요.
댓글 없음 :
댓글 쓰기