Qu'est-ce qu'un sitemap XML et pourquoi en avoir un ?
Un sitemap XML est un fichier qui liste toutes les URLs importantes de votre site web dans un format lisible par les moteurs de recherche. Il aide Google, Bing et les autrès moteurs à découvrir et explorer vos pages, surtout celles qui ne sont pas facilement accessibles via la navigation interne. Un sitemap est particulièrement utile pour les sites de grande taille (plus de 500 pages), les sites avec peu de liens internes, les sites récemment créés et les sites avec du contenu multimédia ou des actualités.
Structure d'un sitemap XML
Un sitemap XML suit le protocole sitemaps.org. Il commence par une déclaration XML et un élément racine <urlset> avec le namespace approprié. Chaque page est représentée par un élément <url> contenant : <loc> (l'URL absolue, obligatoire), <lastmod> (date de dernière modification au format ISO 8601), <changefreq> (fréquence de changement : always, hourly, daily, weekly, monthly, yearly, never) et <priority> (priorité relative de 0.0 à 1.0). Un sitemap peut contenir jusqu'à 50 000 URLs et ne doit pas dépasser 50 Mo.
Soumettre et maintenir votre sitemap
Soumettez votre sitemap dans Google Search Console (section Sitemaps) et Bing Webmaster Tools. Ajoutez aussi une référence dans votre fichier robots.txt avec la directive Sitemap: https://example.com/sitemap.xml. Maintenez votre sitemap à jour : ajoutez les nouvelles pages, supprimez les pages 404, et mettez à jour les dates lastmod quand le contenu change. Pour les sites dynamiques, générez le sitemap automatiquement avec votre CMS ou framework. Si votre site dépassé 50 000 URLs, utilisez un sitemap index qui référence plusieurs fichiers sitemap.