블로그 중복문서/유사문서 확인하는법
중복문서/유사문서란?
티스토리 블로그를 운영하다 보면, 유사문서에 조심하라는 말을 자주 들어보셨을 것으로 생각됩니다. 유사문서란 블로그에 포스팅한 글이 기존 블로그, 뉴스 등 인터넷 상에 같은 문구, 내용이 반복해서 있을 경우, 플랫폼에서 자체적으로 판단하여 검색을 제한하는 것을 뜻합니다. 따라서, 애드센스, 일명 애드고시를 빨리 통과하기 위해 타 블로그의 글을 복사+붙여 넣기 하여 게시글을 작성하거나, 다른 글들의 내용을 변경 없이 똑같이 작성하는 행위는 매우 위험합니다. 블로그 글을 작성할 때 자신만의 독창성을 가지라는 이유기도 합니다.
위처럼 고의적으로 블로그 글을 퍼오는 것을 제외하고도, 나도 모르게 작성한 글이 유사문서가 되지 않을까 하는 걱정이 생길 수 있습니다. 정보성 글을 작성할 때 어쩔 수 없이 같은 내용이 포함되는 경우나, 해당 키워드의 문서 수가 너무 많아 비슷한 글이 생기는 등의 일이 발생하는 등의 이유로 말이죠. 그럼, 내가 쓴 글이 유사문서에 해당하는지 어떻게 확인할 수 있을까요?
유사문서 확인 사이트
인터넷 안에는 무수히 많은 글들이 있으며, 유사문서는 우리의 힘으로는 완벽하게 파악할 수 없습니다. 때문에, 중복되는 내용을 파악하여 표절률을 알려주는 사이트를 이용해야 하는데요. 이번에 소개해드릴 사이트는 바로 Copy Killer(카피킬러)입니다.
www.copykiller.com/myspace/result-list
카피킬러라이트
표절검사의 기준! 무료표절검사, 논문표절, 자소서표절, 레포트표절 검사 서비스와 글쓰기 핵심도구를 제공합니다.
www.copykiller.com
물론, 이 사이트가 모든 표절률, 또는 유사도를 계산하여 알려줄 수는 없겠지만, 60억 건 이상의 빅데이터를 대상으로 비교검사하기 때문에 어느 정도 신뢰성은 보장하고 있습니다.
사용방법
사용하는 방법은 간단합니다.
1. 로그인하기
표절검사를 위해 회원 로그인, 아이디가 없다면 회원가입을 진행합니다.
2. 문서업로드
문서 업로드를 클릭하여 표절검사를 실시할 수 있습니다. ppt, pdf 등에서 작성한 파일을 첨부하여 검사할 수 있고, 블로그 글을 긁어 직접 입력으로 검사할 수도 있습니다. 저는 임의의 뉴스 글을 복사하여 표절검사를 진행해 보겠습니다.
3. 검사 결과
표절검사를 실시하면 위 사진과 같은 창이 뜨게 됩니다. 누른 직후에는 검사대기로 뜨며, 약간의 시간이 지난 후 표절률이 나오게 됩니다.
짧은 글이기 때문에 1분도 안 되는 시간 사이에 검사 결과가 나왔습니다. 저는 발행한 지 2분 된 뉴스 글을 복사하여 표절 검사를 진행했는데, 불과 2분 전 글임에도 표절률이 38%로 매우 높게 나왔습니다. 또한, 의심 문장 별로 비교 문장의 출처와 범위를 알려주기 때문에 쉽게 확인이 가능합니다. 비교적 최근 이슈임에도 표절 검사가 원활히 진행되는 것을 보아 사이트의 빅데이터는 계속해서 쌓이고 있다고 확인 가능합니다.
마치며..
표절률이 어느 정도 이상이 되어야 유사문서로 파악되는지에 대한 사항은 알 수 없습니다. 대부분의 대학교 논문 표절률의 경우, 10%~15% 내외를 요구하고 있고, 아무리 허용해줘도 25%를 마지노선으로 보고 있습니다. 블로그 글의 특성상 논문 수준의 표절률을 요구하지는 않겠지만, 인터넷 상의 글과 유사성이 적은, 독창적인 글이 검색 상위에 오를 가능성은 더욱 높을 것이기 때문에, 자신만의 글을 작성하는 것을 추천합니다.