Comment bloquez-vous l'accès de Seekportbot ou d'autres robots d'exploitation à un site Web

La plupart du temps, lorsque vous devez bloquer l'accès SeekportBot ou à d'autres crawl bots Sur un site Web, les raisons sont simples. Le Web Spider fait trop d'accès dans un court laps de temps et nécessite les ressources Web du serveur, ou provient d'un moteur de recherche dans lequel vous ne souhaitez pas que votre site Web soit indexé.

Il est très bénéfique pour un site Web visité par Crawl Bots. Ces spires Web sont conçus pour explorer, traiter et indexer le contenu des pages Web dans les moteurs de recherche. Google et Bing utilisent de tels robots d'exploration. Mais il existe également des moteurs de recherche qui utilisent des robots pour collecter des données à partir des pages Web. Seekport Il s'agit de l'un de ces moteurs de recherche, qui utilise le Crawler Seekportbot pour indexer les pages Web. Malheureusement, il l'utilise parfois de manière excessive et fait du trafic inutile.

Qu'est-ce que le Seekportbot?

SeekportBot C'est un web crawler développé par l'entreprise Seekport, qui est basé en Allemagne (mais utilise des IP de plusieurs pays, dont la Finlande). Ce bot est utilisé pour explorer et indexer des sites Web afin qu'ils puissent être affichés dans les résultats de recherche sur le moteur de recherche Seekport. Un moteur de recherche non fonctionnel, pour autant que je sache. Au moins, je n'ai pas rendu les résultats pour aucune phrase clé.

SeekportBot UTILISER user agent:

"Mozilla/5.0 (compatible; SeekportBot; +https://bot.seekport.com)"

Comment bloquez-vous l'accès de Seekportbot ou d'autres robots d'exploitation à un site Web

Si vous êtes arrivé à la conclusion que ce Web Spider ou un autre, il n'est pas nécessaire de scanner l'intégralité de votre site Web et de faire un trafic inutile par le serveur Web, vous avez plusieurs façons de bloquer leur accès.

Pare-feu Le niveau Web du serveur

Le pare-feu s'applique-t-il open-source qui peut être installé sur les systèmes d'exploitation Linux et peut être configuré pour bloquer le trafic sur plusieurs critères. Adresse IP, emplacement, ports, protocoles ou agent utilisateur.

APF (Advanced Policy Firewall) Il s'agit d'un tel logiciel à travers lequel vous pouvez bloquer les bosses indésirables, au niveau du serveur.

Pentru ca SeekportBot si alti web spideri folosesc mai multe blocuri de IP-uri, cea mai eficienta regula de blocare, este pe bazauser agent. Asdar, daca doriti sa blocati accesul SeekportBot avec l'aide APF, tout ce que vous avez à faire est de vous connecter au serveur Web par SSH, et ajoutez la règle de filtrage au fichier de configuration.

1. Ouvrez le fichier de configuration avec nano (ou autre éditeur).

sudo nano /etc/apf/conf.apf

2. Cauti linia care incepe cuIG_TCP_CPORTSsi adaugi user agent-ul pe care doresti sa il blochezi la sfarsitul acestei linii, urmat de o virgula. De exemplu, daca doresti sa blochezi user agentSeekportBot, linia ar trebui sa arate astfel:

IG_TCP_CPORTS="80,443,22" && IG_TCP_CPORTS="$IG_TCP_CPORTS,SeekportBot"

3. Enregistrez le fichier et redémarrez le service APF.

sudo systemctl restart apf.service

AccesulSeekportBotva fi blocat.

Filtration web crawls cu ajutorul CloudflareBlochezi accesul SeekportBot

Avec l'aide de CloudFre, il me semble la méthode la plus sûre et la plus pratique par laquelle vous pouvez limiter de diverses manières l'accès à certains bits à un site Web. La méthode que j'ai utilisée dans le cas de SeekportBot pour filtrer le trafic vers une boutique en ligne.

En supposant que vous avez déjà ajouté le site Web au cloudflore et que les services DNS sont activés (c'est-à-dire que le trafic vers le site est effectué par cloud), suivez les étapes ci-dessous:

1. Ouvrez le compte Clouflare et accédez au site Web pour lequel vous souhaitez limiter l'accès.

2. Allez à: Security → WAF et ajouter une nouvelle règle. Create rule.

3. Vous choisissez un nom pour la nouvelle règle, Field: User AgentOperator: ContainsValue: SeekportBot (sau alt nume de bot)Choose action: BlockDeploy.

Comment bloquez-vous votre accès Seekportbot
Vous bloquez l'accès de Seekportbot à Cloudflare

En quelques secondes, la nouvelle règle WAF (Web Application Firewall) Il commence à faire son effet.

Événements de pare-feu dans Cloudflare
Événements de pare-feu dans Cloudflare

En théorie, la fréquence par laquelle une toile d'araignée pour accéder à un site peut être définie à partir de robots.txt, insaeste doar in teorie.

User-agent: SeekportBot
Crawl-delay: 4

De nombreux robots Web (en dehors de Bing et Google) ne suivent pas ces règles.

En conclusion, si vous identifiez un web d'exploration qui accéde excessivement à votre site, il est préférable de bloquer son accès total. Bien sûr, si ce bot ne vient pas d'un moteur de recherche où vous êtes intéressé à être présent.

Passionné par la technologie, j'écris avec plaisir sur Stealthsetts.com à partir de 2006. J'ai une riche expérience dans les systèmes d'exploitation: macOS, Windows et Linux, mais aussi dans les langages de programmation et les plateformes de blogs (WordPress) et pour les magasins en ligne (WooCommerce, Magento, Presashop).

Maison " Votre source de tutoriels informatiques, des conseils et des nouvelles utiles. " Comment bloquez-vous l'accès de Seekportbot ou d'autres robots d'exploitation à un site Web
Laisser un commentaire