본문 바로가기

정보통通/하늘방송국

구글 검색 알고리즘과 구글 검색 최적화 방법 공개!! 매트 커츠


GOOGLE 검색 최적화 방법에 목말라 하고 있던 저에겐 참으로 유용한 정보이기에 올려봅니다.

우리나라에선 네이버가 검색의 왕이라하지만
그래도 많은 인터넷 유저들은 구글이 대왕이라 생각하기에...^^;

한편으로 드는 생각은
우리나라에서 네이버검색을 이기기위한
구글의 꼼수가 아닐까~^^;

어째든간에...

첫번째, 구글검색 알고리즘은 어떻게 적용되나??


   매트 커츠 구글 검색그룹 총괄 엔지니어는
  1월30일 열린 ‘2012 웹마스터 컨퍼런스’에서 한국의 웹마스터에게 검색 최적화 비법과 중요성을
   알리며,
구글의 검색 서비스 개발에 대한 뒷이야기를 공개했다.

  매트 커츠는 “매년 2만건을 실험하고 그 실험 내용을 반영해 매주마다 검색 어떤 아이디어를 실행할 것인지를 평가해 결정한다”라며 “매일 적어도 한 번은 변경이 이루어진다”라고 밝혔다.
그는 구글의 검색은 “하나의 아이디어에서 출발한다”라며 구글이 검색 알고리즘을 변경하는 과정을 소개했다.

2010년 자료를 토대로 매트 커츠가 소개한 구글 검색 알고리즘 변경 과정을 살펴보자.

  2010년 구글은 검색 서비스를 개선하기 위해 나온 2만개 아이디어 중 그럴듯한 9735개를 추렸다. 구글은 이 아이디어를 추릴 때 외부와 격리된 환경(sandbox)에서 철저한 평가를 했다.
이게 1차 테스트이다.

  1차 테스트를 거친 1만여개의 아이디어 중 ‘좋은 결과가 나왔다’ 싶은 8549개는 사용자에게 적용하는 실험을 거쳤다.
이 2차 테스트는 일부 사용자를 대상으로 검색 결과에 해당 아이디어를 적용하고 기존의 방법으로도 검색 결과를 교차해 보여주는 방식으로 진행된다. 이렇게 사용자의 반응이 좋은 아이디어를 골라보니 2688개가 남았다. 실제 이용자에게 적용했지만, 그렇다고 해서 이 아이디어가 검색 결과에 곧장 반영되진 않았다.


  마지막 관문, ‘클릭 평가’가 남았다.
이 단계에서 구글은 사용자가 새로운 아이디어를 적용한 검색 결과에 얼마나 만족하는지를 클릭률로 판단한다. 검색 결과를 테스트할 때 이용자는 달라진 점을 못 느낄 수도 있다고 매트 커츠는 설명했다.
매트 커츠는 “새로운 검색 방법을 적용했을 때 검색 결과에 대한 클릭이 기존의 검색 결과보다 더 많이 나왔다면, 이 아이디어는 검색 품질을 개선하는 아이디어로 평가받는다”라고 최종 선정 기준에 대해 말했다.


2만개 중 이렇게 총 4개의 관문을 통과한 아이디어만이 구글 검색에 공식적으로 반영된다.
2010년에는 이 과정을 거쳐 검색 알고리즘에 최종 반영된 아이디어가 585개였다.

매트 커츠는 검색 방법에 변화를 줄 때마다 “이렇게 변경했을 때 사용자를 위해 검색 결과가 개선됐는가”라는 질문을 던진다며 “구글은 이런 과정을 절대 멈추지 않을 것”이라고 말했다.





두번째, 구글코리아는 30일 본사의 책임 엔지니어 매트 커츠를 초청해 검색과 오픈웹이라는 주제로 인터넷 개방성 포럼을 진행했습니다.
 

매트 커츠는 검색엔진 최적화 및 웹 스팸팀을 총괄하고 있으며 검색분야 최고 전문가로 손꼽히는 인물입니다.

 

 


구글의 귀띔 “검색에서 잘 노출되려면…”

"한일월드컵과 서울올림픽, 평창올림픽, G20을 유치해 한국은 국제적 위상이 높습니다. 그런데 한국이 유일하게 기대에 못 미치는 부문이 있는데 바로 자신의 정보를 전세계에 알리는 법입니다."

매트 커츠 구글 검색그룹 총괄 엔지니어는 ‘2012 웹마스터 컨퍼런스’에서 검색엔진 최적화를 위한 비결을 한국 웹마스터들에게 공개했다. 2012웹마스터 컨퍼런스는 구글과 한국인터넷전문가협회가 공동 주관한 행사로, 웹마스터로서 알아두면 좋을 검색엔진 최적화 방법과 개인정보 보호를 위해 유념할 사항 등을 알리는 자리로 마련됐다.


매트 커츠는 2001년부터 검색엔진 최적화 방법을 공유하는 ‘구글웹마스터’ 서비스와 함께 직접 비법을 동영상으로 찍어 유튜브로 공유하기 시작했다. ‘검색엔진 최적화 열혈 전도사’로 손색이 없다. 매트 커츠가 이 행사에서 공개한 검색엔진 최적화 비법은 구글의 검색 서비스를 풍부하게 하는 데 초점을 맞췄지만, 구글 외 검색 서비스에 콘텐츠를 노출할 방도가 될 수도 있겠다.

먼저 검색 서비스에 대한 구글의 철학을 살펴보자. 구글은 ‘0.5초 안에 검색 결과를 제공하지 못하면 실패한 검색’이라고 여긴다. 빠른 검색을 위한 일종의 내부 방침이다. 웹상에 1조개 URL이 있다는 점을 떠올리면, 검색 엔진은 발바닥에 불이 나고 손바닥에 땀이 나도록 움직이고 있다. 구글이 1시간마다 처리하는 검색이 10억건이라니, 과한 표현은 아니다.


매트 커트는 ‘사람이 손으로 처리하기에 웹은 거대하다’라고 말했다. 그렇게 해서는 웹의 성장 속도를 따라갈 수 없다는 이야기다. 그래서 구글은 컴퓨터에 맡기는 방법을 택했다. 컴퓨터는 절대로 피로를 느끼지 않고, 쉬지 않아도 되고, 같은 프로그램을 똑같은 방식으로 일할 수 있고, 특별한 관점도 편견도 없이 검색 작업을 수행하는 강점이 있어 수작업보다 믿을 만하다고 매트 커츠는 강조했다.
이 말을 듣고보니 검색 결과에 잘 노출 되려면 컴퓨터에 잘 보여야 한다는 판단이 선다.

이제 매트 커츠의 검색 최적화 비결을 들어보자.

1. 우선 검색엔진이 웹페이지를 발견하기 쉽게 히는 작업이 필요하다.
매트 커츠는 검색엔진 최적화를 위해 검색엔진이 웹페이지를 수집하도록 하라고 조언했다.
방법은 이렇다.
웹 게시자는 robots.txt(로봇.txt) 파일을 만들어 웹서버의 루트 디렉토리에 배치한다.
로봇.txt는 인터넷 검색엔진 배제표준으로, 사이트의 어느 부분을 구글 색인에서 제외해야 하는지
혹은 수집해야 하는지를 알린다.

이 작업이 단순해 보이지만, 이게 없다면 검색 엔진이 해당 웹페이지를 수집하는 데 어려움을 겪는다고 매트 커츠는 설명했다. 일단은 검색엔진이 접근하게는 만들어야 한다는 이야기다.

구글코리아는 국내 웹사이트는 대체로 이 작업을 하지 않아, 검색엔진이 웹페이지를 수집하지
못하는 경우가 많다고 설명을 덧붙였다.

정부 관련 웹사이트 중에는 국세청, 대법원, 방송통신위원회, 문화재청, 외교통상부, 정부민원서비스, 고용노동부 워크넷, 보건복지부, 우정사업본부, 국립국어원, 국사편찬위원회 등이
검색엔진의 접근을 막아둔 곳이다.

2. 표준 HTML을 사용하는 것도 도움이 된다.
물론 표준 HTML은 검색엔진 최적화뿐 아니라, 다양한 기기와 웹브라우저에 웹사이트를 보여주는 데에도 유용하다.
사람들에게 보여주기 위해 이트를 운영한다면 표준 HTML을 적용해 웹사이트를 운영하라는 이야기다. 액티브X나 AJAX, 플래시를 반드시 사용해야 한다면 가장자리 링크는 HTML로 만드는 게 좋다고 매트 커츠는 강조했다.

3. 웹페이지에 제목을 입력하는 것을 잊지 말아야 한다.
매트 커츠는 짧게 보이는 검색 결과는 웹페이지 제목과 메타디스크립션에 의해 결정되는 경우가
많다고 말했다. 그런데 국내 웹사이트는 웹페이지 제목이 없거나 웹페이지마다 제목이 같다고
매트 커츠는 꼬집었다.
웹페이지에 제목을 입력하고 메타디스크립션을 만드는 것은 상점이 쇼윈도에 물건을 멋지게 전시하는 것에 비교할 수 있다.
웹페이지 제목이 매력적이고 유혹적이라면 클릭을 부른다는 게 매트 커츠의 설명이다.

구글이 운영하는 웹마스터 페이지를 방문하면 “검색결과의 첫 번째 행은 웹페이지의 제목”이라는
말이 있다.
웹페이지의 쇼윈도인 검색 결과에 웹페이지 정보를 잘 포장해서 보여주는 게 중요하다는 이야기다.


4. 글을 잘 활용해야 한다. 이 말은 3번과도 이어지는 설명이다.
검색엔진은 특정 웹페이지에 대한 정보를 웹페이지 제목, 메타디스크립션, 웹페이지 내 글로 파악한다. 특히 웹페이지를 이미지로 꾸밀 때에도 설명글(알트텍스트)은 필수다.
해당 이미지가 무엇에 대한 것인지는 글로 써야 검색엔진이 파악하기 좋다.
이미지와 동영상 파일을 검색엔진이 이해하는 게 아니라, 거기에 쓰인 설명을 바탕으로 검색 결과에 노출할 지를 정한다.

메타디스크립션이나 웹페이지 제목, 이미지 설명 등을 입력할 때는 사람들이 검색할 때 자주 쓰는 단어를 유념해야 한다고 매트 커츠는 강조했다.

“미국에서는 USB 메모리를 메모리스토리지, 플래시드라이브, 섬드라이브 등 다양한 이름으로 부르는데 USB를 파는 쇼핑몰이 이 중에서 하나의 이름만 설명에 넣진 않을 것”이라는 설명은 웹페이지의 설명글이 얼마나 중요한지를 보여준다.
특히 페이지 내 정보가 글로도 잘 설명된 웹사이트는 시각장애인이 웹사이트를 둘러보기에도 좋다.

5. 매트 커츠는 웹상에 링크가 많이 돌아다니는 게 좋다고 말했다.
블로그를 쓰거나 소셜미디어에 웹페이지를 소개하는 것도 방법이다.
물론 링크를 여러 웹페이지에 심으려는 노력이 과도해 스팸이 되면 안 된다고 매트 커츠는 설명했다.

6. 마지막으로, 매트 커츠는 웹표준을 다시 한 번 강조했다.
인터넷 익스플로러만 지원하는 웹사이트가 있다고 치자.
매트 커츠는 “인터넷 익스플로러 점유율은 80%로 매우 높은 수준이지만, 인터넷 익스플로러만 지원한다면 전체 방문자의 20%는 배제하는 셈”이라며 “웹사이트는 웹브라우저에 상관 없이 구동돼야 한다”라고 말했다.



검색엔진 업체가 웹마스터가 모인 자리에서 ‘이렇게 하면 검색 잘 된다’라고 비법을 알려주는 게 일종의 꼼수는 아닐까.

매트 커츠는 이러한 질문을 예상이라도 한듯 “섬은 아무도 원하지 않으며, 섬은 진전이 없다는 것을 의미한다”라는 말로 강연을 마무리했다.
온라인에서 어디와도 연결되지 않은 웹페이지를 우리는 쓸모 있다고 말할 수 있을까. 찾을 수조차 없는데 말이다.