Robots.txt - Manuel d'implémentation

Supprimer Rendre public Rendre privé Add tags Delete tags

866 shaares
101 liens privés

866 shaares · 101 liens privés

Filtres

Liens par page

20 50 100

Robots.txt - Manuel d'implémentation

Le protocole d'exclusion des robots, plus connu sous le nom de robots.txt, est une convention visant à empêcher les robots d'exploration (web crawlers) d'accéder à tout ou une partie d'un site web.

Le fichier robots.txt, à placer la racine d'un site web, contient une liste de ressources du site qui ne sont pas censées être explorées par les moteurs de recherches. Ce fichier permet également d'indiquer aux moteurs l'adresse du fichier sitemap.xml du site.

Par convention, les robots consultent le fichier robots.txt avant d'explorer puis d'indexer un site Web. Lorsqu'un robot tente d'accéder à une page web, comme par exemple http://www.mon-domaine.fr/page.html, il tente d'accéder également au fichier robots.txt situé à la racine de votre site web : http://www.mon-domaine.fr/robots.txt

web

August 8, 2024 at 10:15:57 PM GMT+2 * · permalien

https://robots-txt.com/

Filtres

Liens par page

20 50 100