Question 1

Robots.txt bloque-t-il l'indexation d'une page ?

Accepted Answer

Non, robots.txt bloque l'exploration (crawl), pas l'indexation. Une page bloquée dans robots.txt peut quand même apparaître dans Google si d'autres sites y font un lien. Pour empêcher l'indexation, utilisez la balise noindex dans le HTML. Attention : si vous bloquez une page dans robots.txt, Google ne peut pas lire son éventuelle balise noindex, ce qui peut créer des problèmes.

Question 2

Les robots sont-ils obligés de respecter le robots.txt ?

Accepted Answer

Non, le protocole robots.txt est une convention volontaire. Les robots bien configurés (Googlebot, Bingbot) le respectent scrupuleusement. Mais les robots malveillants, scrapers et certains bots ignorent complètement ce fichier. Le robots.txt n'est donc pas un mécanisme de sécurité — n'y placez pas d'informations confidentielles (les URLs bloquées sont visibles de tous).

Question 3

Comment trouver le robots.txt de n'importe quel site ?

Accepted Answer

Le fichier robots.txt est toujours accessible à l'adresse https://votredomaine.fr/robots.txt. Il se trouve à la racine du domaine (impossible de le placer dans un sous-répertoire). Pour les sous-domaines, chaque sous-domaine a son propre robots.txt (blog.exemple.fr/robots.txt). Dans Google Search Console, vous pouvez voir et tester votre robots.txt dans la section "Exploration" > "Testeur robots.txt".

Vérificateur de robots.txt

Le fichier robots.txt : fonctionnement et importance

Erreurs courantes dans le fichier robots.txt

Robots.txt et les bots d'IA : GPTBot, CCBot et autres

Questions fréquentes

Outils similaires

Compteur de caractères SEO

Générateur de liens UTM

Générateur de balises Open Graph

Prévisualiseur SERP Google

Calculatrice de taux de conversion

Calculatrice de CPC (coût par clic)