¿Qué es y cómo bloqueamos el acceso de un agente de usuario (bot o navegador) en un sitio web [consejos Nginx]

En primer lugar, veamos a grandes rasgos qué es este agente de usuario de un navegador de Internet y para qué sirve.

¿Qué es el Agente de Usuario (o Usuario-Agente)?

Todos los navegadores de Internet (Internet Explorer, Safari, Opera, Firefox, Chrome, etc.) tienen un software agente que interactúa con el sitio web que visita, a nivel del servidor host. Este software realiza la conexión a Internet con el sitio web, comprende, verifica y mostrará el contenido de la página visitada. En resumen, asegura la interacción entre el usuario y el servidor host que sirve al usuario las páginas web solicitadas accediendo a una URL específica en el protocolo HTTP/HTTPS.
El Agente de Usuario contiene en el encabezado entregado al servidor al que accede, información relacionada con el software utilizado por el usuario, el sistema operativo y la versión del paquete de software del navegador. Por ejemplo, el agente de usuario de Google Chrome devolverá al servidor información sobre la versión de Google Chrome utilizada y el sistema operativo del usuario.

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3163.100 Safari/537.36 

El encabezado de agente de usuario anterior significa que una versión de Google Chrome 70 en una computadora con procesador AMD, arquitectura de 64 bits con sistema operativo Windows 10.
Probablemente te preguntarás por qué Mozilla aparece como agente de usuario para Chrome. Se trata de una especie de truco utilizado por Google (y por Microsoft en IE) para facilitar el acceso de los usuarios de Chrome a todos los sitios compatibles con Mozilla y Safari. AppleWebKit es el motor de renderizado de contenidos.

Los webmasters o administradores de servidores web pueden bloquear el acceso de ciertos agentes de usuario en sitios web alojados. La mayoría de las veces, esta limitación se impone robots web (robots web) que accedan de forma caótica o excesiva a las páginas web de un sitio web. Afortunadamente, estos bots tienen un agente de usuario específico y pueden detectarse muy fácilmente en los registros del servidor web.

Cómo bloquear el acceso de un user-agent a un servidor web con NGINX

Tomemos el escenario en el que ya no queremos permitir el acceso al sitio web a usuarios con sistemas operativos Windows XP y el navegador de Internet Mozilla Firefox 5.0.

Agregamos el siguiente código al archivo de configuración de nginx, para “servidor” bloquear:

  if ($http_user_agent = "Mozilla/5.0 (Windows NT 5.1; rv:52.0) Gecko/20100101 Firefox/52.0"){
 return 403;
 }

Guarde el archivo nginx.conf o el archivo específico de un sitio web, si utiliza una configuración personalizada (como sitios disponibles), entonces reinicie el servicio NGINX.
Todos los usuarios con Firefox 5.0 (incluidas todas las versiones hasta 5.9) en Windows XP serán redirigidos a error 403 (Prohibido).

No elegí este ejemplo por casualidad. A partir de Firefox 52.9.0, Mozilla dejó de brindar soporte para usuarios de Windows XP y Windows Vista. Sistemas operativos cuyo soporte fue suspendido por Microsoft en 2014, respectivamente en 2017 para Windows Vista.

Apasionado por la tecnología, escribo con placer en Stealthsetts.com a partir de 2006. Tengo una rica experiencia en sistemas operativos: macOS, Windows y Linux, pero también en lenguajes de programación y plataformas de blogs (WordPress) y para tiendas en línea (WooCommerce, Magento, Preshop).

Hogar Su fuente de tutoriales de TI, consejos útiles y noticias. ¿Qué es y cómo bloqueamos el acceso de un agente de usuario (bot o navegador) en un sitio web [consejos Nginx]
Deja un comentario