네이버 검색의 중독문서판독시스템의 문제점과 유사문서로 분류된 글을 정상적으로 복원, 복구하는 방법 - 새로운 리브라(Libra) 검색 알고리즘 대비

 

네이버 유사문서판독시스템은 남의 원본 글을 복사하거나, 스크랩 한 포스팅 등 홈페이지나 블로그의 글을 걸러내는 시스템으로 검색엔진의 질을 높이고, 원작자의 글을 보호하는데 아주 좋은 시스템인듯 합니다.

Naver 검색공식블로그 - 원본? 복사본! 네이버 중복문서판독시스템이 알아냅니다!

적당한 수준의 인용을 넘어가는 문서는 유사문서로 분류되어서 검색에서 노출이 거의 안되는데, 뭐 개인이 자신의 생각이나 리뷰를 남긴다면 유사문서로 분류될 일은 거의 없습니다.

블로그나 홈페이지를 운영하시는 분들은 남의 글을 복사, 스크랩 하거나.. 과다한 인용등은 네이버 검색에 적용이 안되니, 포스팅시 유의하셔야 합니다.

하지만 문제점도 없지 않아 있는듯 합니다. 예전에는 네이버가 아닌 블로그에서 글을 쓴것을 네이버 블로거가 불법펌질을 했느데, 네이버블로그 글이 먼저 등록이 되면서 오히려 원작자의 글이 유사문서로 분류가 되기도 했는데, 이부분은 개선이 된듯 하더군요.

제 블로그 입장에서 볼때의 문제는 한번 유사문서로 분류가 되면 빠져나오기가 정말 힘들다는것입니다.

저같은 경우는 도서, 영화, 방송 등의 리뷰를 많이 하는 편인데... 그냥 리뷰만 했으면 문제가 없는데, 글의 하단에 yes24의 도서정보 내용, 맥스무비의 영화정보 내용, 방송국의 방송정보 내용을 덧붙였는데... 그것때문에 상당히 많은 글이 유사문서로 분류가 되어서 네이버 검색에 노출이 되지 않더군요...-_-;;

티스토리 블로그(Tistory Blog)에 작성한 글이 네이버(Naver)와 다음(Daum) 검색엔진에 등록되었는지 확인하고 누락시 고객센터에 신고하는 방법

유사문서로 빠졌는지 확인하는 방법은 위의 글을 참고하시면 됩니다.

뭐 그냥 둘까 생각을 했었는데, 최근에 NHN에서 리브라(Libra)라는 새로운 검색 알고리즘을 도입해서 검색 만족도와 신뢰성 높은 문서가 상위에 노출되도록 한다는 뉴스를 봤는데, 저품질 문서에 밀려 찾기 어려웠던 좋은 블로그 문서가 검색결과 상위에 노출되게 하는 방식이며 우선은 맛집쪽부터 적용을 한다라고 하더군요.

요즘 저품질 블로그에 대한 이야기도 간혹 나오는데, 이 소식을 접하고 나니 만약 유사문서가 많아서 제 블로그의 검색순위나 블로그 지수에 문제가 있지 않을까 우려가 되더군요(물론 네이버측에서는 저품질 블로그라는것이 없다고 하더군요)

이 문제로 상담원과 통화를 해보았는데, 현재로써는 유사문서가 많다고해서 불이익을 받는 부분은 없다고 하더군요. 하지만 상식적으로 생각해봤을때(상담원의 사견) 차후에는 불이익을 받을수도 있지 않을까요 라고 하더군요...T_T;;

뭐 당연한 말이고, 상식이겠지요... 그래서 유사문서를 수정하거나, 삭제를 하기로 했습니다.

1. 유사문서로 분류된 글을 삭제하기

삭제를 해보았는데... 네이버 검색엔진에 적용이 안되고, 유사문서로 계속 검색이 되더군요.

2. 유사문서로 분류된 글을 수정하고, 업데이트하기

포스팅중에 문제가 있는 부분은 수정하고, 제목도 수정을 하고, 현재 날짜로 update해서 RSS에 반영 되로고 했는데, 역시나 반영이 안되고 예전 글의 제목 그대로 유사문서에 빠져있습니다.

3. 유사문서로 빠진 글을 삭제하고, 새로운 글로 포스팅하기

2번과 같은 방식이지만, 기존 (A)글을 삭제하고 새로운 글(B)에 유사문서로 판독될 부분을 삭제하고 발행해보았는데, 새로 발행한 글(B)이 아마도 기존에 유사문서(A)에 있는 제가 쓴 글과 같아서 유사문서로 판독이 되더군요...-_-;;

4. 네이버 분석툴 이용하기

Naver Analytics, 네이버에서 제공하는 홈페이지, 블로그 방문자 통계 로그 분석 툴과 간단한 설치와 사용방법(티스토리도 사용 가능)

얼마전에 위 서비스를 오픈했는데, 혹시나 싶어서 분석코드를 받아서 해당 글에 삽입하고, 수정, 업데이트를 해보았지만, 역시나 갱신이 되지 않더군요

티스토리 블로그(Tistory Blog)에 작성한 글이 네이버(Naver)와 다음(Daum) 검색엔진에 등록되었는지 확인하고 누락시 고객센터에 신고하는 방법

현재로써 블로거가 유사문서에 빠진 글을 원본글로 인정을 받아서 정상적으로 검색엔진에 노출이 되게 하려면... 고객센터에 유사문서로 빠진글이나 삭제를 하고나서 고객센터에 해당 글의 url을 적고, 내용을 적어 문의를 해서 수정 요청을 하는 수밖에 없는듯 합니다.

유사문서 판독시스템은 원본 글을 정확히 판독해내기 위해 블로그뿐 아니라, 카페, 뉴스의 글 모두를 주기적으로 비교해 체크하고 있습니다. 따라서 블로그 내에는 유사한 글이 없더라도  뉴스나 카페에 유사한 글이 있으면 유사문서로 판독되며, 한 번 유사문서로 판독되더라도 주기적인 재체크 과정에서 수정된 문서가 원본으로 판독되면 다시 검색에 노출됩니다.

네이버 고객센타의 도움말을 보면 위처럼 주기적으로 재체크 과정을 한다고 하는데, 한달정도 지켜본 결과 삭제를 하거나 수정을 한 글이 적용이 되지는 않더군요.(이 부분은 몇달간 계속 지켜보니 주기적으로 아주 오래된(3-4년)이 지난 글들도 다시 검색을 해서 중복인지, 아닌지를 체크를 하니 당장 급한것이 아니라면 고객센터에 신고하지 않고, 기다리셔도 좋을듯 합니다.)

뭐 생각을 해보면 이해가 가는것이 제가 글을 하나 포스팅을 할때 한국의 모든 사이트의 글을 검색해서 유사판독을 할수는 없는것이고 네이버 서버의 database에 저장해놓은 글을 통해서 유사문서를 판독하게 될텐데... 그러다보니 이런 문제가 발생하는듯하고, 또한 네이버에서 저장해놓은 글이 엄청난 양일텐데, 이걸 수시로 다시 체크를 하기도 어려울것이며, 앞으로 db가 쌓여가면 갈수록 이런 문제는 좀 더 큰문제가 될수도있지 않을까 싶습니다.

결론

1. 남의 글(공적이고 공개되고, 펌글을 허용해도)을 함부로 펌질, 스크랩, 과다 인용을 하지 말자.

2. 유사문서가 아닌데, 유사문서로 분류되었거나.. 문제가 있는 부분을 수정했다면 고객센터에 문의하거나, 기다리면 반영이 됨

3. 언젠가 유사문서로 인해서 손해나 불이익을 당할수도 있으니 시간날때 해당글을 정리할것

뭐 네이버에서 갑자기 넌 유사문서가 많아서 나쁜 블로그야라고 하면서 검색에서 제외를 시키거나 그러지는 않겠지만, 정말 만약에 대비해서 유사문서를 한번 정리하시는것도 좋지 않을까 싶습니다.

티스토리 블로그(Tistory Blog)에 작성한 글이 네이버(Naver)와 다음(Daum) 검색엔진에 등록되었는지 확인하고 누락시 고객센터에 신고하는 방법

Naver Analytics, 네이버에서 제공하는 홈페이지, 블로그 방문자 통계 로그 분석 툴과 간단한 설치와 사용방법(티스토리도 사용 가능)

티스토리 블로그, 네이버 검색 유입 감소가 오류로 인한것이라는 사과 공지와 앞으로의 대응책

네이버 검색 트래픽 감소로 티스토리 블로그의 방문자 급감을 보며 우리의 대책은?