Le scraping

par Jean Boucher le 22 novembre 2009

Adsense Scrapping

La dernière trouvaille des paresseux de l’internet est d’utiliser les Fils RSS des blogues et d’insérer le contenu dans leurs propres blogues où ils auront au préalable mis en place des AdSense. De cette façon, ils espèrent faire quelques sous avec le contenu rédactionnel des autres…

Dernièrement, j’ai remarqué que mes billets étaient repris intégralement sur un blogue de ce type. Au début, cela m’a fait rigoler, je me suis dit quelques liens entrants de plus… mais ensuite je me suis senti profané (quelqu’un me vole).

Je me suis alors tourné vers un site WHOIS de façon à connaître le propriétaire un certain Nicolas Sayer, j’ai ensuite contacté le la compagnie qui héberge ce blogue (OVH), mais aucune réponse de leur part, en théorie ils sont responsables…

Étant donné qu’il a implanté des Adsense sur ce blogue, je me suis alors tourné vers Google DMCA, et j’ai déposé une plainte.

À votre avis, suis-je allé trop loin?

Justement, une copie d’écran de mon billet de ce matin sur le blogue en question:

scraping

  • Share/Bookmark
Je suis toujours intéressé de savoir ce que vous en pensez!

 

{ 12 commentaires… allez-y, ajouter votre avis }

Hugo 23 novembre 2009 à 15:37

Absolument pas! De un, si je ne me trompe pas, ca entre dans le « Duplicate content » proscrit par Google. Donc désavantageux pour ton site.

Il y a bien des chances que ce contenu ne soit indexé qu’une seule fois. (Peut-être pour lui, peut-être pour vous, difficile à déterminer)

Martin 23 novembre 2009 à 19:26

Salut Jean, à mon avis la question est la suivante: est-il acceptable que quelqu’un s’abonne à ton flux RSS et le publie sur son blog en prenant de soin de fournir ses sources et le lien vers l’article original. La question du AdSense n’a pas d’influence selon moi car c’est davantage une question de droit d’auteur qu’autre chose. L’objectif du flux RSS étant d’être lu par plusieurs de façon régulière, il est évident que le fait que tes textes se retrouvent sur son blog rend ton objectif doublement atteint. Et les gens qui atteriront sur ton site et jugeront le contenu pertinent s’abonneront également à ton flux RSS donc c’est positif pour toi. Qu’il mette des AdSense où n’importe quoi d’autre ne change rien à mon avis à partir du moment que tu as répondu à la précédente question.
Moi je serais bien content de tomber sur un blog publiant les « Best of » du SEO, en autant que je peux retracer les auteurs pour les suivre par la suite. D’ailleurs, n’est-ce pas un peu ce qui a fait le succès de Google (indexer des annuaires)?

Comme on dit dans le domaine de la pub, parlez-en en bien, parlez-en en mal, mais parlez-en! Cela dit, je comprends ta réaction et ta question…

Robin Faucher 23 novembre 2009 à 19:40

C’est la réalité d’internet, tout le monde croit qu’il n’y a rien là de plagier. C’est comme quand un client nous demande de prendre des photos sur le net. Le problème c’est que nos actions sont limité quand ça nous arrive. Est-ce que tu as pensé à lui envoyer une mise en demeure?

Jean Boucher 23 novembre 2009 à 20:52

@Hugo C’est certains que Google va choisir de présenter l’un ou l’autre des articles, en théorie Google devrait savoir savoir que je suis l’instigateur du billet.

@Martin, Je suis d’accord avec toi, cela me fait de la publicité, mais ce qui me fait le plus « chier », c’est le fait qu’il essaie de faire de l’argent avec les textes des autres. J’ai consciemment décidé de ne pas intégrer des AdSense sur mon blogue.

Je me console en me disant que pour l’instant les billets sur le scraping blogue, n’ont pas de balises nofollow, c’est déjà ça!

Le pire c’est que je me suis pris à lire des articles des autres blogueurs dupés…

S’il était transparent et qu’il y avait un endroit pour le contacter sur le blogue, je crois que ça ne m’aurait pas dérangé.

@Robin, j’ai des clients qui me demandent ouvertement d’aller chercher des textes sur les sites web de leurs concurrents… Je leur réponds d’aller les chercher eux-mêmes et de me les envoyer par email, généralement ça clôt la discussion.

Sonat 24 novembre 2009 à 5:11

Bonjour, je suis le créateur du blog référencer son site et je souhaite avoir un droit de réponse :)

« paresseux de l’internet « :
je ne suis pas si paresseux que cela puisque je reprends les meilleurs information pour référencer un site et que ton blog en fait partie.

« Il y a bien des chances que ce contenu ne soit indexé qu’une seule fois. (Peut-être pour lui, peut-être pour vous, difficile à déterminer) »
En effet le duplicate content va s’appliquer mais uniquement pour moi car google va s’appuyer sur l’age de l’article donc ca va ME pénaliser et T’APPORTER des lecteurs en PLUS.

« L’objectif du flux RSS étant d’être lu par plusieurs de façon régulière, il est évident que le fait que tes textes se retrouvent sur son blog rend ton objectif doublement atteint. Et les gens qui atteriront sur ton site et jugeront le contenu pertinent s’abonneront également à ton flux RSS donc c’est positif pour toi. »
« Et les gens qui atteriront sur ton site et jugeront le contenu pertinent s’abonneront également à ton flux RSS donc c’est positif pour toi. »
Merci Martin pour ton caractère ouvert sur la question.

« Est-ce que tu as pensé à lui envoyer une mise en demeure? »
Envoyer une mise en demeure ne servirait à rien puisque je suis là à en parler avec vous.

« c’est le fait qu’il essaie de faire de l’argent avec les textes des autres. J’ai consciemment décidé de ne pas intégrer des AdSense sur mon blogue. »
Justement je t’amène du lecteur tout frais qui seront intéressé par ton contenu donc bon….

« Je me console en me disant que pour l’instant les billets sur le scraping blogue, n’ont pas de balises nofollow, c’est déjà ça! »
Pourquoi à ton avis j’ai laissé le follow sur mes balises……

« S’il était transparent et qu’il y avait un endroit pour le contacter sur le blogue, je crois que ça ne m’aurait pas dérangé. »
Un commentaire sur mon blog à l’un de tes billets en expliquant que tu ne souhaite pas être publié fait l’affaire, nous sommes entre personnes civilisées….. De plus je suis parfaitement clair sur mon blog car je dis que ce sont les meilleures informations, mais pas forcément les miennes….

« j’ai des clients qui me demandent ouvertement d’aller chercher des textes sur les sites web de leurs concurrents… Je leur réponds d’aller les chercher eux-mêmes et de me les envoyer par email. »

Sans commentaires car tu vas transformer du texte que tu vas t’approprier sans y mettre les copyrights et la source de base, ca s’appelle du « spinning content » et c’est bien pire que du simple plagiat….

Pour finir, tu te dis victime alors que tu utilise certains procédés qui ressemblent étrangement au miens…..
D’ailleurs la favicon.ico que tu utilise pour ton blog n’est pas libre de droits, elle appartient à une société qui utilise un logiciel de promotion de site web qui s’appelle Internet Business Promoter: http://i217.photobucket.com/albums/cc320/aras1977/internetpromoterbusinespd9.jpg .

Si tu veux me répondre tu as mon mail dans le commentaire ainsi que mon ip, la preuve que je ne me cache pas….

Cordialement à tous
Nicolas SAYER

Jean Boucher 24 novembre 2009 à 9:08

1- À nulle part il n’est indiqué sur votre scraping blogue que c’est un amalgame de billets provenant des blogues des autres.

2- Jamais vous ne m’avez demandé la permission de reproduire mes textes, la seule raison pour laquelle vous êtes offusqué aujourd’hui, c’est que vous vous êtes fait prendre la main dans le plat de bonbons comme un gamin et vous cherchez une excuse.

3- Je ne connais personne qui met du contenu sur son site sans qu’il y ait une place pour les contacter, à par ceux qui spam!
http://www.referencement-blog.ca/images/admin.gif
http://www.referencement-blog.ca/images/contact.gif

4- Comparer l’utilisation d’un favicon avec le scraping d’articles intégral, il ne faudrait pas charrier, mais tu as entièrement raison, je le change aujourd’hui même!

Sonat 24 novembre 2009 à 9:24

Autant pour au niveau du contact, je vais changer ca aujourd’hui et aucun problème pour le rss, je l’enlève dès aujourd’hui.
Cordialement
Nicolas

Sonat 24 novembre 2009 à 9:24

Autant pour moi.
Cordialement

Référenceur Google 24 novembre 2009 à 14:57

Voila, cela finit bien. C’est plutôt étrange de scraper du contenu lié au référencement, car les internautes visés connaissent déjà la publicité et les astuces, donc le taux de transfo ne doit pas être génial. ;)

axobox 27 novembre 2009 à 11:30

Etrange en effet de scraper le contenu d’un blog de référenceur, tout bon référenceur va forcément surveiller que son contenu ne va pas être repris quelque part. Et puis quand on fait des splog , autoblog, on cherche avant tout des niches. Y a pas mieux pour des MFA.

Ousmane Diarra 3 décembre 2009 à 12:27

Voici un article intéressant de Cyberpresse:
http://tinyurl.com/yeqfwr9
Comme quoi, ce ne sont pas toujours ceux que l’on soupçonne qui bénéficient le plus de la malhonnêteté intellectuelle…

Jean Boucher 3 décembre 2009 à 14:15

@ Ousmane Merci pour cet article, on comprend pourquoi Google n’est pas pressé de s’attaquer à ce problème!

Je suis intéressé de savoir ce que vous en pensez!