Les éditeurs de sites internet souhaitant prévenir l’utilisation de leurs données et contenus par l’assistant IA de Google, Google Bard, peuvent désormais le faire en utilisant Google-Extended. Cette initiative de Google fait écho à la démarche d’OpenAI, qui permet de bloquer son robot d’apprentissage IA, GPTBot, donnant aux webmasters un meilleur contrôle sur l’utilisation de leur contenu.
Sommaire
Google-Extended : Un Nouvel User-Agent de Google
Google a annoncé l’introduction de Google-Extended le 28 septembre 2023. Ce nouvel user-agent offre aux administrateurs de sites web un contrôle amélioré sur la manière dont leur contenu est utilisé par les technologies IA génératives de Google, notamment le chatbot Google Bard et la plateforme d’apprentissage automatique Vertex AI.
Les Enjeux pour les Éditeurs de Sites Web
La principale avantage pour les éditeurs est de reprendre le contrôle de leurs données. Cependant, des questions subsistent. Les contenus qui ont déjà été utilisés pour former les modèles IA peuvent poser problème. De plus, avec l’importance croissante de l’IA dans la recherche en ligne, les éditeurs qui bloquent les robots IA pourraient perdre de la visibilité à long terme, car leurs sites ne seraient pas listés en tant que sources dans les réponses générées par les chatbots.
Comment bloquer le Robot d’Exploration de Google Bard?
Pour empêcher le robot d’exploration de Google Bard d’accéder à vos contenus et de les utiliser pour son apprentissage, il suffit d’ajouter la ligne de code suivante dans le fichier robots.txt situé à la racine de votre site
User-agent: Google-Extended
Disallow: /
Si vous souhaitez également bloquer le robot d’exploration d’OpenAI, GPTBot, ajoutez la ligne suivante à votre fichier robots.txt :
User-agent: GPTBot
Disallow: /
Ces lignes de code doivent être ajoutées en plus de celles qui existent déjà dans votre fichier robots.txt.
En Conclusion
L’initiative de Google avec Google-Extended offre davantage de transparence et de contrôle aux éditeurs. Cependant, il s’agit d’un équilibre délicat entre la protection des droits des éditeurs et les avantages potentiels de l’IA pour l’optimisation de leur visibilité en ligne. Les éditeurs doivent réfléchir aux implications à long terme de leurs décisions avant de bloquer les robots d’exploration des chatbots IA tels que Google Bard et ChatGPT. Il est essentiel de prendre en compte ces aspects dans leur réflexion sur le blocage des robots d’exploration de ces technologies émergentes.