Votre site n'apparait plus dans Google et vous ne savez pas vraiment pourquoi ? Il est possible que votre site ait été pénalisé par Google car il ne suivait pas les Google webmaster guidelines. Cet article brosse les problèmes de votre site et vous aidera a y remédier.

Introduction
Le classement est le plus important objectif dans n'importe quel activité d'optimisation du référencement. Un bon classement signifie un fort trafic et habituellement cela se transforme en chiffre d'affaire pour un site internet commercial. Un bon classement rend un site glamour et populaire. Les autres sites lui veulent être associé (ex: création de lien), car un tel partenariat va accroitre leurs propres trafics. Tous les efforts marketing seront décuplés, simplement en devenant un site avec ce statut.
Le problème avec les sites web de nos jours est qu'ils utilisent des pratiques qui ne sont pas bonnes pour l'optimisation du référencement et quelques fois donnent lieu à des pénalités. Une pénalité dans un moteur de recherche est une situation dans laquelle tous les efforts d'optimisation de réferencement peuvent servir à rien.
Beaucoup de sociétés de réferencement ne respectent pas les directives de Google en matière de réferencement. Le résultat est qu'elles perdent du temps avec des problèmes qui pourraient être très simple à résoudre. Dans le pire des cas, ces prestataires sont si avides qu'ils demandent à leurs clients de payer pour des investigations qui n'aboutiront pas. Nous avons entendu beaucoup d'histoire comme cela entre des clients et des sociétés de référencement.
Le but de cet article est de proposer un guide de dépannage des problèmes classiques qui respectent les Google webmaster guidelines. Ce guide peut-être suivi par n'importe quel webmaster, même un sans projet SEO (Search Engine Optimisation : optimisation du référencement).
En maitrisant ce guide et en comprenant complétement comment mettre en place les solutions, un webmaster ou un propriétaire d'un site n'aura pas besoin de passer par une société de référencement pour sortir des pénalités Google.
Un pré-requis très important pour détecter les problèmes est d'ajouter et de vérifier votre site dans votre compte Google Webmaster Tools. Attention, cela peut prendre plusieurs jours à Google pour afficher des données après que votre site ait été vérifié.

Comprendre les pénalités Google algorithmiques et manuelles
En aucun cas les déclarations de cet article ne doivent être considérées comme provenant de Google ou comme des déclarations officielles. Mais autant que je sache, il y a 2 sanctions évidentes : celles basées sur l'algorithme et celles attribuées manuellement. Les pénalités algorithmiques viennent du fait que votre site a été "filtré" par l'algorithme de Google à cause de liens ou de problèmes sur le site. D'autres filtres existent, dont le plus connu est le "duplicate content".
Les pénalités basées sur l'algorithme proviennent du fait que votre site présente de mauvais indice pour les moteurs de recherche. Cela veut dire qu'une certaine page n'est pas pertinente pour une certaine requête.
D'autres pénalités algorithmiques sont basées sur des infractions mineures : texte caché, texte trop enrichi de mots-clés, proximité de texte et de liens cachés, surtout sur vos pages importantes. Tout cela sera expliqué en détail plus loin.
Depuis que Google préfère les solutions algorithmiques pour combattre le spam, il est évident que la majorité des problèmes sont causés par des problèmes algorithmiques.
L'autre type de pénalités est celle qui sont attribuées manuellement. Certaines pénalités sont si importantes que Google les fixe manuellement. Google donne de type de pénalité lorsqu'il y a de sérieuses violations de son guide de bonnes pratiques. L'homme travaillant chez Google regardera personnellement votre site puis vous enverra un email vous signalant que votre site ne respecte pas les consignes. A défaut de correction, votre site sera banni de Google.

Vérifications basiques
Commençons par notre liste de vérification. Fondamentalement, toute optimisation du référencement joue avec deux zones principales distinctes : la campagne de lien et l'optimisation interne du site. Nous allons couvrir cela pas à pas, et nous approfondirons quelques points.

1) Vérifier si votre site est indexé dans Google
Méthode de vérification : Dans le champ de recherche Google, tapez la requête suivante en remplaçant www.monsite.fr par l'adresse de votre site.

site:www.monsite.fr

Cet exemple suppose que la forme canonique de votre domaine utilise www. Si ce n'est pas le cas, supprimez les pour rendre la requête conforme :

site:monsite.fr

Interprétation des résultats : Si Google ne donne aucun résultat pour les pages de votre site :
a) Vérifiez ceci dans votre compte Google Webmaster Tools : Tableau de bord, Vue d'ensemble. Si le Googlebot (ndt: le robot d'indexation de Google) a des problèmes pour accéder à votre page d'accueil, il retourne un message du type "GoogleBot ne peut pas accéder à votre page car il est bloqué par le fichier robots.txt". Dans ce cas, effacez le fichier robots.txt de la racine de votre site et faite une requête de vérification à Google.
Vous pouvez également vérifier le code source de votre page d'accueil. Vous ne devez pas voir ce code :

<meta name="robots" content="noindex, nofollow">

Ce code dit à Google de ne pas indexer votre page d'accueil et de ne pas suivre les liens dans votre menu de navigation. Si vous voyez cela, supprimez le et faite une requête de vérification.

b) Si le test précédent est négatif, trouvez s'il y a des liens qui pointent vers votre site. Googlebot peut trouver votre site juste en suivant des liens. S'il n'y a pas de lien entrant vers votre site, Google ne le trouvera pas, mais ce n'est pas un problème car il y a plusieurs mode de soumission d'un site à Google.
Vous pouvez vérifier ces informations dans "tableau de bord", "Liens", "Pages avec des liens externes". Si Google ne trouve aucun lien vers votre site, faites en avant de continuer ce diagnostic.

2) Est ce que votre site cache du contenu et des mots clés ?
Contrôlez d'abord votre page d'accueil :

  • Sur votre page d'accueil, appuyer sur control+a. Ceci va tout sélectionner et peut détecter du texte utilisant la même couleur que le fond.
  • Si vous ne pouvez pas voir de problème, essayez de désactiver les CSS avec le plugin webdevelopper tool de Firefox. Ceci va montrer tous les textes dissimulés utilisant CSS. Consciencieusement, cherchez des signes de spam dans le tete qui aurait pu apparaitre.
  • Si aucun texte caché apparait selon les 2 méthodes précédentes, essayez de désactiver le javacript. Dans Firefox, allez dans outils, options, contenu et décocher javascript.
  • Enfin vérifier votre site avec des détecteur de spam SEO tel que tool.motoricerca.info/spam-detector.


Toutefois, ne comptez pas que sur cet outil. Il est important de faire une double vérification du code source. Vérifiez 2 fois chaque partie de votre site, en commeçant par la page d'accueil, enfin faire une vérification simple des vos catégories, de vos pages produits, plan de site et autres. Notez que des mots clés "farceurs" peuvent se glisser dans un texte. Vérifiez la cohérence, par exemple: Je suis vendeur de chaussettes bleues Pamela Anderson dans les rayons vêtements.
Vérifiez donc que vos textes ne contiennent pas de spam.

Copie de contenu (duplicate content) et liens entrants
3) Est ce que votre site copie du contenu d'un autre site ou d'une autre page de votre site ?
Il est possible d'avoir plusieurs versions indexées de votre page d'accueil. Pour voir cela, prenez une phrase simple et copiez la dans Google ou Yahoo. Ajoutez les guillemets pour cherchez exactement cette phrase. Exemple : "C'est ma première expérience de création de site internet".
Il est possible d'avoir plusieurs résultats à cette requête. Si c'est le cas, cela veut dire qu'il y a duplication du contenu. Vous devriez bloquer ces copies ou faire des redirection 301 vers la page d'accueil canonique.
Vous poiuvez estimer le ourcentage de similarité des pages avec cet outil : http://www.webconfs.com/similar-page-checker.php

Les résultats devraient vous indiquer s'il existe des doublons exacts de vos pages sur d'autres sites. Pour cela utilisez également http://www.copyscape.com

Attention : ce n'est pas parce que vous ne détectez rien, qu'il n'y a pas de contenu dupliqué. Cela peut-être uniquement du à un filtre appliqué par les moteurs qui masque des résultats.

4) Quelles est la qualité de vos liens entrants et sortants ?
Soyez honnête. Avez vous acheté des liens et mis vos liens en pied de page sur des pages de domaine qui n'ont rien à voir avec votre activités ? Il est temps pour vous de leur demander de les supprimer et de resoumettre la page à Google.
Maintenant, est ce que des liens placés sur votre site vers l'extérieur n'apporte aucune valeur ajoutée à vos visiteurs ? Si c'est le cas, supprimer les tous un à un. Faire des liens vers des sites web non vérifiés est l'une des principales causes de mauvaise performance dans les résultats de recherche. C'est encore plus vrai si vous avez des pages de liens, annuaires avec votre domaine, forums qui distilleraient des liens. Vous pouvez utiliser Xenu sleuth, un logiciel qui vous permettra de vérifier tous les liens externes de votre site.
Soyez certains que les liens externes sont vraiment pertinents et dignes de confiance par Google.
Quand vous voyez un lien, posez vous la question : est ce que cela aide mes visiteurs. Si non, enlevez le.

Ajoutez rel=nofollow sur tous les liens de vos forums, commentaires de blog et tout ce qui n'a pas à être associé à votre site.

Ce billet est issu de la traduction de l'article "Google Penalty Checklist" paru sur seochat.com