7 de abril de 2023 Em 7 de abril de 2023

por

Postado por Stealth

0

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

Curiosity, Internet, Surf de rede, Tutoriais e Novidades de TI, Hospedagem na web

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

Postado por

Stealth

7 de abril de 2023 Em 7 de abril de 2023

0

Na maioria das vezes, quando você precisa bloquear o acesso SeekportBot ou outros crawl bots com um site, os motivos são simples. O web spider faz muitos acessos em um curto espaço de tempo e solicita os recursos do servidor web, ou vem de um mecanismo de busca no qual você não deseja que seu site seja indexado.

contente

É muito benéfico para um site visitado por bots de rastreamento. Esses web spiders são projetados para explorar, processar e indexar o conteúdo de páginas da web em motores de busca. Google e Bing usam esses bots de rastreamento. No entanto, também existem motores de busca que utilizam robôs para coletar dados de páginas web. Seekport é um desses motores de busca, que usa o rastreador SeekportBot para indexar páginas da web. Infelizmente, às vezes ele usa excessivamente e cria tráfego desnecessário.

O que é SeekportBot?

SeekportBot É um web crawler desenvolvido pela empresa Seekport, que tem sede na Alemanha (mas utiliza IPs de vários países, incluindo a Finlândia). Este bot é usado para rastrear e indexar sites para que possam ser exibidos nos resultados de pesquisas. Seekport. Um mecanismo de busca não funcional, pelo que sei. Pelo menos, não retornou resultados para nenhuma frase-chave.

SeekportBot USAR user agent:

"Mozilla/5.0 (compatible; SeekportBot; +https://bot.seekport.com)"

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

Se você chegou à conclusão de que este web spider ou outro não é necessário verificar todo o seu site e gerar tráfego desnecessário para o servidor web, você tem vários métodos pelos quais pode bloquear o acesso deles.

Firewall em nível de servidor web

Eles são aplicativos de firewall open-source que pode ser instalado em sistemas operacionais Linux e configurado para bloquear o tráfego com base em vários critérios. Endereço IP, localização, portas, protocolos ou agente do usuário.

APF (Advanced Policy Firewall) é um software através do qual você pode bloquear bots indesejados, no nível do servidor.

Como o SeekportBot e outros web spiders usam vários blocos de IPs, a regra de bloqueio mais eficaz é baseada em “user agent“. Então, se você quiser bloquear o acesso SeekportBot com a ajuda APF, tudo que você precisa fazer é conectar-se ao servidor web via SSHe adicione a regra de filtro no arquivo de configuração.

1. Abra o arquivo de configuração com nano (ou outro editor).

sudo nano /etc/apf/conf.apf

2. Procure a linha que começa com “IG_TCP_CPORTS” e adicione o agente do usuário que deseja bloquear no final desta linha, seguido de uma vírgula. Por exemplo, se você quiser bloquear user agent “SeekportBot“, a linha deve ficar assim:

IG_TCP_CPORTS="80,443,22" && IG_TCP_CPORTS="$IG_TCP_CPORTS,SeekportBot"

3. Salve o arquivo e reinicie o serviço APF.

sudo systemctl restart apf.service

acesso “SeekportBot” será bloqueado.

Filtração web crawls com a ajuda da Cloudflare – Bloquear o acesso ao SeekportBot

Com a ajuda do Cloudflare, parece-me o método mais seguro e conveniente pelo qual você pode limitar o acesso de alguns bots a um site de várias maneiras. O método que também usei no caso SeekportBot para filtrar o tráfego para uma loja online.

O que vejo o Googlebot e outros rastreadores da Web ao acessar um site?

Supondo que você já tenha o site adicionado à Cloudflare e os serviços DNS estejam ativados (ou seja, o tráfego para o site passa pela Cloudflare), siga os passos abaixo:

1. Abra sua conta Clouflare e acesse o site cujo acesso deseja limitar.

2. Vá para: Security → WAF e adicione uma nova regra. Create rule.

3. Escolha um nome para a nova regra, Field: User Agent – Operator: Contains – Value: SeekportBot (ou outro nome de bot) – Choose action: Block – Deploy.

Como bloquear o acesso ao SeekportBot — Bloquear o acesso ao SeekportBot da Cloudflare

Em apenas alguns segundos, a nova regra WAF (Web Application Firewall) começa a fazer efeito.

Em teoria, a frequência com que um web spider acessa um site pode ser definida a partir de robots.txt, mas… é apenas em teoria.

User-agent: SeekportBot
Crawl-delay: 4

Muitos rastreadores da web (além do Bing e do Google) não respeitam essas regras.

Concluindo, se você identificar um web crawl que acessa excessivamente o seu site, é melhor bloquear seu acesso total. Claro, se este bot não for de um mecanismo de busca no qual você tenha interesse em estar presente.

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

robôs Agentes de usuário do navegador rastreador da web

Curiosity, Internet, Surf de rede, Tutoriais e Novidades de TI, Hospedagem na web

Sobre Stealth

Apaixonado por tecnologia, escrevo com prazer no StealthSettings.com desde 2006. Tenho uma vasta experiência em sistemas operativos: macOS, Windows e Linux, bem como em linguagens de programação e plataformas de blogging (WordPress) e para lojas online (WooCommerce, Magento, PrestaShop).

Veja todos os posts de Stealth

Você também pode estar interessado em...

31 julho

O que é e como bloqueamos o acesso de um agente do usuário (bot ou navegador) em um site [NGINX TIPS]

Em primeiro lugar, vamos ver em termos gerais o que é esse user-agent de um navegador de internet e para que serve. O que é agente de usuário (ou...

Continuar lendo

06 Março

Como podemos acessar versões móveis de sites a partir do computador

Hoje, a maioria dos sites também oferece versões mobile, mais fáceis de acessar e navegar a partir de dispositivos como smartphones...

Continuar lendo

22 novembro

Explore novos mecanismos de pesquisa: Cuil.com & Ódio (GIGABASE)

Percebi que desde o início de novembro, as configurações Stealth são limpas por cada vez mais robôs de SEs menos conhecidos...

Continuar lendo

25 abril

Qihoo!

Título interessante, certo? :) Provavelmente interessante para quem gerencia um site ou um servidor de hospedagem (especialmente webhos...

Continuar lendo

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

O que é SeekportBot?

Como você bloqueia o acesso do SeekePortBot ou de outros rastreamentos para um site

Firewall em nível de servidor web

Filtração web crawls com a ajuda da Cloudflare – Bloquear o acesso ao SeekportBot

Sobre Stealth

O que é e como bloqueamos o acesso de um agente do usuário (bot ou navegador) em um site [NGINX TIPS]

Como podemos acessar versões móveis de sites a partir do computador

Explore novos mecanismos de pesquisa: Cuil.com & Ódio (GIGABASE)

Qihoo!

Deixe uma resposta Cancelar a resposta