Blog

스팸 컨텐츠가 된 뉴스

December 11, 2013

스팸 컨텐츠가 된 뉴스

무언가 검색할 때 반갑지 않은 글들이 있습니다. 얕은 수준으로 어떤 보도 자료가 있는지 소개하는 기사들과 그 기사들을 퍼 옴긴 블로그 글들입니다. 구글 검색에서도 이 글들을 치우지 않고서는 제대로된 컨텐츠를 확인하는 것이 불가능해졌습니다. 구글 이전에 알타비스타라는 검색 엔진이 있었는데 본격적으로 컨텐츠 수집을 한 최초의 상업 검색 엔진이라고 봐도 될 것 같습니다. 이 검색 엔진의 문제는 노이즈가 너무나 많고 글들이 순서없이 배열되어 컨텐츠를 찾기 위해 수 페이지를 기본으로 넘겨야 했다는 점이 특징이었습니다. 가끔은 15 페이지 정도를 넘겨 원하는 컨텐츠를 찾기도 했죠. 뉴스가 많은 키워드들은 구글 검색 엔진을 알타비스타 수준으로 만듭니다.

기사들이 심층 보도를 하고 후속 기사들도 나와서 알차게 구성이 되었으면 좋겠지만 이것은 희망사항입니다. 대신 검색 엔진 사업자들이 즉각적으로 할 수 있는 대책은 있습니다.

1. 뉴스를 무조건 별도의 섹션에 표시하고 섹션의 크기를 줄입니다.
2. 뉴스 섹션에 포함된 글의 전문을 포함한 사이트가 있다면, 그 사이트의 랭크를 낮추어 검색에서 배재합니다.

이 두가지만 이루어져도 검색 품질의 향상은 자연스럽게 이루어질 것입니다.