Protéger un site web en construction

bg62 Messages postés 23590 Date d'inscription samedi 22 octobre 2005 Statut Modérateur Dernière intervention 15 avril 2024 - 2 mai 2022 à 18:01

Protéger un site web en construction

C'est une partie que beaucoup trop de gens semblent ignorer...
Webmasters confirmés, amateurs ou débutants, le principe de base de la création d'un site est celui-ci !

Sommaire :


Pourquoi ?

1. Toutes les données trouvées sur le net peuvent et sont enregistrées ; si vous avez une page en "travaux", incomplète, elle le sera ainsi... A fortiori si vous travaillez en premier sur le contenu et que vous ne mettez pas de balises 'title' ou description' correctes si un 'bot' passe il enregistre ce qu'il rencontre !
2. Lorsque vous allez penser "référencement", vous serez le premier à vous étonner de ce que Google, entre autres, vous renvoie, et venir lancer un "SOS" dans le forum webmastering ...

Les inconvénients

Il faut vite comprendre dans ce cas que ce qui a été enregistré par le 'bot' d'un moteur ne correspond pas du tout à ce que va devenir votre page une fois terminée...
Et si vous ne protégez pas, ce qui ne veut absolument pas dire "si vous ne bloquez pas" (dans le sens d'en interdire la visualisation) les pages non terminées qui sont en ligne et que vous n'arrivez pas à faire prendre en compte les changements au niveau des moteurs :
  • Vous l'avez un peu cherché, non ?
  • Vous n'êtes pas sorti de l'auberge...
  • Vous êtes bon pour une bien belle perte de temps supplémentaire, qui aurait pu très facilement être évitée...

Comment faire ?

Il existe des solutions :

1. Le fichier ' robots.txt ':
Placé à la racine de votre site avec ceci dedans:

User-Agent: *  
Disallow: /


Il va demander aux 'bots' des différents moteurs de ne pas parcourir ce site, donc de ne rien enregistrer.
Mais si un lien, le plus infime qui soit, existe quelque part, dans l'une ou l'autre de vos pages... cette demande ne sera certainement ni lue, ni respectée...

2. Les balises metas dans la partie 'head' de votre code source :
La solution est alors, tout simplement, de placer dans le code source de TOUTES vos pages, dans leur partie " head " les lignes suivantes :

<meta name="robots" content="noindex, nofollow, all" /> 


3. Voire, à la limite, si vous avez plus de craintes, d'autres balises plus spécifiques, notamment pour Google...

Cela signifie, tout simplement, que lorsqu'un " bot " arrivera sur une page, quelqu'elle soit, il verra qu'il y a des instructions qui le concernent : "ne pas indexer la page dans le moteur, ne pas en suivre les liens pour aller voir d'autres pages ou...."

Quand le site est "terminé"...

Maintenant que votre site est terminé, vous pouvez alors lever ces différentes protections et commencer à "attirer" les "bots", aussi bien dans le fichier " robots.txt " et dans les balises meta, en plaçant ceci par exemple:

1. Pour le fichier robots.txt :

User-Agent: *  
Disallow:


(tous les moteurs peuvent y accéder...)

2. Pour les balises :

<meta name="robots" content="index, follow, all" /> 


(tous les moteurs peuvent indexer la page, suivre les liens ou... chercher les images et autres fichiers)

OUI, mais je ne savais pas !

Là, vous aller entrer dans le "monde obscur" du référencement, autrement dit de l'inscription de votre site et de ses pages, dans les moteurs de recherche. Monde dans lequel vous commencez déjà par entrer par la mauvaise porte...
Les résultats déjà enregistrés risquent très fort de ne pas changer pour autant... le 'bot' connait ces pages et ne va pas y retourner ou changer quoique ce soit rien que pour vous...
Ces résultats plus que "exotiques" ne serviront à rien pour votre site, si ce n'est qu'à en déclasser les pages dans les abîmes des résultats...
(l'objet même de cette astuce finalement...)

Vous aurez alors à faire bien plus de travail que les autres, à perdre bien plus de temps que les autres, pour que votre site finisse enfin par apparaître dans des résultats pertinents quant à leur contenu ou relation avec votre thématique... mais ceci est un tout autre sujet... à suivre dans la même rubrique.

Dans le monde du "référencement" tout commence (même) AVANT !

Prenez donc le temps de mettre en place ces quelques petits conseils, ces quelques petites précautions, ce n'en sera que mieux pour vous et votre site pour la suite .

Ceci n'est qu'un très bref résumé qui se veut, volontairement, simple d'explication et de compréhension, pour que tous vous puissiez comprendre, appliquer et profiter de ces quelques petits points, issus d'expériences personnelles et des différents posts émis dans les forums d'entraide...


Source et article complet : protéger un site en construction,robots.txt et balises meta name