コピーコンテンツのチェックができるCCD(CopyContentDetector)の使い方・活用方法!

クラウドワークスやランサーズでWebライティングの案件を受注すると、

「コピーコンテンツのチェックをします」

「コピーコンテンツとならないように執筆してください」

などと、言われることはありませんか?

Web上の記事は、カンタンにコピペできてしまうので、依頼主からすると納品された記事がコピペされたものでないか、気になるところです。

今回は、そんなコピーコンテンツのチェックをカンタンに行うことができる、CCD(Copy Content Detector)の使い方から、活用方法を紹介します。

なぜWebライターがコピーコンテンツのチェックをする必要があるか

「クライアントに言われたからやる」というのも答えの一つですが、冒頭でもお話したとおり、Web上の記事はカンタンにコピペができてしまいます。

少しでもネットリテラシーがあるクライアントなら、多少なりともコピペ記事でないかは気にすることでしょう。

特にクラウドソーシングサービスを使ったWebライティングのお仕事というのは、誰でも気軽に行えるので、最初からライターを完全に信頼してくれるクライアントはいません。

相手の顔も素性も見えない状態なので、仕方ないといえば仕方ないですよね。

 

自分が思うWebライターがコピーコンテツのチェックをする必要性は、

  • 自分が納品した記事が、オリジナルであることを保証するため

だと思っています。

 

オリジナルと言っても、Web上にない完全なオリジナルの文章である必要はありません。

というより、そんな文章をかけるのであれば、Webライターとしてかなり優遇されることでしょう。

あくまでも、「他のサイトの記事からコピペしてきたものではありません」ということの保証という意味です。

コピペしていないことの保証は、数多のWebサイトから関連する記事を一つずつチェックしないとできないものですが、人力で行うのは無理があります。

そこで、カンタンにチェックするためのツールとして紹介するのがCopy Content Detector(CCD)です。

コピーコンテンツチェックツール「CCD」の使い方


Copy Content Detector(CCD)
Copy Content Detector(CCD)

Webライターに限らず、ブロガーなどWeb上で文字を書く人なら覚えておきたい、コピーコンテンツのチェックツールCCDの使い方を紹介します。

そもそも「CCD」とは

CCDは、登録不要かつ無料で使用できるコピペチェックツールです。

株式会社ウェブサークルが提供しているツールで、CCDの利用者はWebライターや個人のメディア運営者から、大手企業・学校法人などで使用されています。

無料プランでは、4,000文字を上限として何回でもWeb上に公開されている記事とのコピペチェックを行えます。

 

有料プランも用意されていて、月額980円(税抜)で1回で調査できる上限文字数が8,000文字です。

ほかにも、Microsoft Wordのファイルをそのままチェックしたり、広告が表示されなくなったりとメリットは多いのですが、Webライターとして利用するのであれば、無料プランでも十分です。

 

CCDにユーザー登録すると、「CSV一括登録」や「テキスト一括登録」機能が使えますが、自分はユーザー登録せずに利用しています。

1回のチェックでかかる時間も少なく、3,000文字のチェックでは1分少々で完了しました。(2019年08月05日 13:00時点)

CCD内の処理状況によっても変わってきますが、混雑時でも体感では10分もかからないぐらいではないでしょうか。

「CCD」の3ステップ利用手順

便利なCCDですが、使い方もとてもカンタンです。

CCDの3ステップ利用方法
  1. チェックしたい文章を調査対象テキストに貼る
  2. 「チェックする」ボタンをクリック
  3. 完了したらページを更新して、調査結果を確認する

チェックしたい文字を貼り付けてチェックするボタンを押すだけ!

※画像の中では要注意やコピーの疑いを出すためにわざとコピーコンテンツ判定される文章を使っています。

 

いくつかチェック時の設定項目がありますが、基本的に変更しなくても問題ありません。

もし、自分のブログ記事をチェックしたい場合などがあったら、「除外ドメイン」にあなたのブログのドメインを入力しましょう。

「除外ドメイン」に入力されたドメインは、チェックの対象から外すことができます。

 

チェックが完了したかどうかは、ブラウザのタイトル表示を確認します。

「チェック中」から「完了」に変わったあとに、ページを更新することで結果が表示されます。

 

チェックした結果は、「類似度判定」「一致率判定」「テキスト判定」の3つからなります。

基本的にはどの項目も「良好」となるように記事の執筆を行いましょう。

結果は「良好」「要注意」「コピーの疑い」の3段階です。

コピーコンテンツチェックツール「CCD」の活用方法

CCDを使えばカンタンにコピーコンテンツのチェックができますが、チェックした結果をどのように捉えればよいのか解説します。

注視すべき判定は「類似度判定」と「一致率判定」

3つの判定項目がありますが、特に注意してみるべき判定は「類似度判定」と「一致率判定」です。

「類似度判定」は、Web上の記事との類似度チェックであり、「一致率判定」は、Web上の記事との一致率チェックとなります。

類似度と一致率の違いは、似たような文章かどうかの判断と、単純なテキスト一致の違いです。

たとえば、次の文章は類似度判定ではひっかかりますが、一致率判定にはひっかかりません。

類似度判定と一致率判定の違い
変更前の文章:私はうさぎを飼っている。兎種は耳が垂れ下がったホーランドロップだ。
変更後の文章:僕はラビットを飼っています。ホーランドロップという垂れ耳の兎種です。

主語を変えたり、文章の入れ替えをしたりしていますが、同じ文章ですよね。

「ホーランドロップ」「兎種」などでテキスト一致を検出しますが、「私→僕」、「うさぎ→ラビット」、「耳が垂れ下がった→垂れ耳」の言い換えで、テキスト一致は避けられるでしょう。

 

とはいえ、実際にチェックしてみるとわかりますが、類似度よりも一致率のほうがパーセンテージは高くなる傾向にあります。

一致率判定はテキストの単純一致を検出しているので、繰り返し同じ文言を使用すると高くなってしまいます。

ノウハウや解説系の記事は、どうしてもそれが顕著に出てしまいがちです。

 

実際にどの部分が類似や一致と判定されているかは、「コピペチェック結果一覧」から該当するチェック結果の「詳細表示」ボタンをクリックして確認できます。

「コピペチェック結果一覧」で詳細を確認したい結果の「詳細表示」をクリック

チェック結果の詳細画面。類似度判定・一致率判定を始めとして、いろいろな詳細が確認可能

どの文章が一致と見なされたかを色付きで確認可能

 

自分基準となりますが、チェック結果は類似度判定は10%未満、一致率判定は45%未満となるように記事を作成しています。

執筆する記事は、なるべく主語を除かないようにしているため、一致率判定は高目に設定しているわけです。

主語を減らせば一致率も減らせますが、記事の目的はユーザーに読んでもらうことであり、コピーコンテンツを回避することを目的としてしまうと本末転倒だと考えます。

少なくとも、類似度判定では10%未満であるため、コピーコンテンツではないと言えるでしょう。

 

一致率も類似度同様にパーセンテージを低くするように指示するクライアントもいますが、こちらの考えを伝えた上で説明し、一致率が45%程度でも問題なく納品できた例もあります。

 

最後にテキスト判定ですが、こちらは今までにあなたがCCDでチェックしたテキストとの判定となります。

Webライターとしては、特に意識して使用することはないので、あまり気にしなくてもOKです。

文字数オーバー(4,000文字以上)のときの対処方法

無料プランでは、上限文字数が4,000文字となります。

納品する記事によっては、4,000文字以上の記事の場合もあるでしょう。

そんなときに考えられる対処方法は次の3つです。

4,000文字以上をチェックしたい場合
  1. 有料プランを利用する
  2. テキストを分割してチェックする
  3. テキスト内の改行を削除してチェックする

有料プランを利用すれば8,000文字までチェックできます。

「無料でチェックしたい」というのであれば、分割するか改行を削除してチェックすることを考えましょう。

 

基本的に文章が短くなるほど、類似度や一致率は高くなる傾向にあります。

5,000文字ぐらいの記事であれば、2,500×2回に分けてチェックした上で、類似度や一致率を確認しましょう。

 

4,300文字ぐらいであれば、改行を削除するだけで4,000文字内に収まる可能性があります。

自分の場合はサクラエディタを使って、改行を一括削除しています。

正規表現が使えるので、置換機能で「¥r¥n」を空白に置換することでカンタンに改行を削除できますので、試してみてください。

改行がない場合でもCCDは正常に動作しますので、文字数がちょっとだけオーバーしている際には、改行を削除することをおすすめします。

まとめ:「CCD」で執筆記事の保証をしましょう

コピーコンテンツはGoogleも嫌っているので、メディア運営者としては特に気をつけたい部分です。

Webライターとして、執筆した記事がコピーコンテンツでないことを保証することは、クライアントに信頼してもらえることに繋がります。

特にクラウドソーシングを使ってWebライティングのお仕事をする場合は、クライアントに安心してもらうために、言われなくてもCCDでチェックした結果を納品時に記事と合わせて送付すると良いでしょう。

あなたが執筆した記事が、コピーコンテンツでないことを保証するためにも、CCDを有効活用していきましょう。

おすすめの記事