Le Scraper Report : Outil contre le vol 2.0

Un nouveau tweet de Matt Cuts a informé le web de la mise en place d'un nouvel outil pour dénoncer le vol de contenu. Le bien nommé "Scraper Report" est un outil destiné aux webmasters souhaitant dénoncer un site qui, au delà de voler du contenu, est mieux positionné que le site ayant diffusé le contenu original. Retour sur les enjeux du vol de contenu dans le référencement naturel des sites web.

 

Le duplicate content : un thème déjà abordé

Le duplicate content, également appelé "contenu dupliqué" dans la sphère francophone, était déjà un thème récurrent pour Google. En effet, les nombreuses mises à jour des algorithmes de Google se sont souvent tournées vers la répression de ces pratiques. Petit retour sur le passif de Google par rapport au duplicate content.
L'algorithme de Google est prévu pour sonder les sites web et en déterminer la qualité. Finalement, Google recherche des sites au contenu riche en informations, aux contenus mis à jour et plus particulièrement aux contenus origininaux. A savoir, une technique de référencement consistait à créer des pages au contenu similaire reliées entre-elles par des liens. Cette technique permettait aux pages vers lesquelles les liens pointaient de bénéficier d'un meilleur référencement. Mais cette technique de référencement artificiel, une fois détectée par Google, s'est faite interdire.
Ainsi, Google pénalise aujourd'hui les sites utilisant le contenu dupliqué par des pénalités sur leur référencement. 


Le vol de contenu, une pratique courante ?

Selon les propos de Matt Cutts, 25 à 30% du web seraient dupliqués. Seulement, ces 25 à 30% ne sont pas tous du contenu "spammy", c'est à dire malicieux, destiné à tromper Google. Prenons par exemple une longue citation sur un site ou encore des conditions générales de ventes. La citation entraine forcément un contenu dupliqué et les conditions générales de vente, par leur nature, sont très souvent similaires entres-elles (dans une certaine limite, bien entendu). Malgré ces certaines exceptions, il existe toutefois du contenu tout à fait dupliqué, que l'on pourra assimiler à du vol ou à des tentatives d'optimisation du référencement de site internet.
L'objectif est, pour le moteur de recherches, de faire la différence entre ces contenus dupliqués mais "utiles" et les contenus dupliqué et frauduleux.

Toutefois, pour détecter le contenu dupliqué de votre site, vous pouvez faire appel à un professionnel du référencement naturel ou utiliser ces outils en ligne :

 

Google, encore une fois mauvais élève ?

Google demande donc aux webmasters de lui signaler tout contenu dupliqué et volé permettant un meilleur positionnement dans une technique de référencement déloyale. Le lien à suivre pour déclarer ce vol de contenu est le scraper report. Peut-être est-ce pour mieux optimiser son algorithme et permettre encore et toujours d'améliorer la qualité de ses pages de résultats. Ceci dit, pour l'anecdote, nous remarquerons que lorsque l'on saisit une requete du type "référencement naturel définition", un encart aparait sur la page de résultats Google avec... Un contenu dupliqué d'un autre site. Google lui-même copie donc les définitions disponibles sur d'autres sites tels que wikipedia pour les disposer dans ses pages.