사이트맵은 웹마스터들에게는 중요한 개념이 아닐 수 없는데, 이 사이트맵은 검색엔진의 크롤러들이 보다 효율적으로 크롤링할 수 있도록 돕는다. 티스토리의 경우 RSS의 기능을 이용해서 손쉽게 사이트맵을 검색사이트에 등록할 수 있지만 구글 블로그(블로거, Blogger)의 경우에는 약간 다르다. 아니 오히려 좀 더 복잡하다고도 볼 수 있지만 좀 더 명확하다고도 할 수 있다. 검색 사이트에 제출하는 사이트맵은 간단한 xml 파일의 형식을 제출한다는 뜻이고, 이 xml파일에는 웹사이트의 모든 페이지가 들어있고 또 가치가 높은 순으로 정렬된다.
구글 블로그(Blogger) 사이트맵 제출하기
복잡한 것 같지만 보다 명료하다
기존의 구글 블로그 사이트맵의 문제
구글 블로그는 별다른 사이트맵 제출절차를 거치지 않아도 이미 자체적인 디폴트 설정으로 구글 검색엔진에 사이트맵을 제출한다. 즉, 구글 웹마스터 도구에서 사이트맵 제출을 하지 않아도 된다는 뜻이다. 구글은 다양한 서비스를 제공하고 있는 회사이기 때문에 (구글신의 위엄) 구글의 Blogger를 사용한다는 것은 이런 좋은 점도 있다. 참고로 구글 블로그에 2차 도메인을 붙일 때에도, 웹마스터 도구에서 따로 코드를 받아서 스킨에 붙일 필요가 없다. (이런 장점들이 있는 구글 블로그이지만 우리나라에는 티스토리가 있다!!)
하지만 구글 블로그의 자동 사이트맵 기능의 단점은, 모든 포스트를 등록시키지는 않는다는 점이다. 최근의 25개의 포스트만 사이트맵으로 자동등록한다. 만약 구글 블로그 사용자가 25개 이상의 포스팅을 했고, 예전의 포스팅이 구글 검색에서 노출되고 있지 않다면, 별다른 사이트맵 제출을 하지 않았을 확률이 높다.
구글 블로그에서 전체 사이트맵 등록하기
구글의 공식 고객지원에서는 구글 블로그의 자동 사이트맵의 상세한 기능이나, 전체 블로그 포스트를 등록하는 방법에 대해 명확한 설명을 찾지 못하였다. 외국의 전문 블로거들에 의하면, 전체 포스트를 유지하려면 아래와 같은 url을 '구글 웹마스터 도구>크롤링>사이트맵'에 등록해야 한다고 입을 모으고 있다.
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
"http://yourblogname.blogspot.com/"는 물론 사용자의 구글 블로그 주소이다. (2차 도메인 사용의 경우에는 해당 도메인주소이다.) 뒤의 atom.xml이 구글 블로그에서 사이트맵을 생성하는 프로세스의 본체로 보인다. atom.xml에는 몇가지 매개변수가 필요한데, 여기서 중요한 것은 start-index와 max-results값이다. 인덱싱을 처음부터(최근부터) 하겠다는 의미가 start-index=1이고, 인덱싱하는 최대 포스트 갯수를 500개로 설정하는 것이 max-results=500 이다.
max-results값은 500을 초과할 수 없으며 이를 초과하게 설정해도 500만큼만 인식한다.
만약 포스트 갯수가 500을 초과하고 1000개 이하가 됐을 때는 구글 웹마스터도구에서 "사이트맵을 추가"하는 방법으로 한 줄을 더 붙이면 된다.
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
같은 방식으로 포스트 갯수가 1500개를 초과하고 2000개 이하가 됐을 때는 아래와 같이 네 개의 사이트맵이 제출되면 된다.
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1001&max-results=500
http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1501&max-results=500
이 과정이 끝나고 나서는 보다 효율적으로 (구글)크롤러에게 새 사이트맵를 알려주기 위한 과정이 필요할 수 있는데 바로 robots.txt파일을 수정해 주는 것이다. 구글 블로그는 사용자의 커스텀 robots.txt 설정을 지원하므로 "대시보드>설정>검색환경>커스텀 robots.txt"에서 아래와 같이 추가해주면 된다. 아래의 robots.txt 내용은 바로위의 "포스트 갯수가 1500개 초과, 2000 이하"의 경우의 것이다. 자신의 포스트 갯수에 따라 한 줄씩 추가해 나가는 식으로 하면 되겠다.
Sitemap: http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
Sitemap: http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
Sitemap: http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1001&max-results=500
Sitemap: http://yourblogname.blogspot.com/atom.xml?redirect=false&start-index=1501&max-results=500
문제는 네이버와 다음의 검색등록
구글 웹마스터 도구는 여러줄의 사이트맵을 추가할 수 있지만, 국내 검색사이트에서는 그렇지 않다. 따라서 자신의 블로그의 포스트 수가 상당히 많은 경우라면 상대적으로 검색노출에 있어서는 유리하지 않다고 볼 수 있다. 이런 경우에는 사이트맵 xml을 지원하는 다른 서비스를 이용하는 것을 고려할 수도 있다. 하긴 애초에 url 한 줄로 끝낼 수 있는 다른 서드파티 서비스를 이용하는 것이 가장 좋을 지도...
댓글