anuncio
Términos de referencia
de Wikipedia, la enciclopedia libre

1

2

rastreador web

Un rastreador web también conocido como araña web o robot web es un programa o script automatizado que navega por la World Wide Web de manera metódica y automatizada.

Este proceso se llama rastreo web o spidering.

Muchos sitios legítimos, en particular los motores de búsqueda, utilizan spidering como medio para proporcionar datos actualizados.

Los rastreadores web se utilizan principalmente para crear una copia de todas las páginas visitadas para su posterior procesamiento por un motor de búsqueda, que indexará las páginas descargadas para proporcionar búsquedas rápidas.

Los rastreadores también se pueden usar para automatizar tareas de mantenimiento en un sitio web, como verificar enlaces o validar código HTML.

Además, los rastreadores se pueden usar para recopilar tipos específicos de información de páginas web, como la recolección de direcciones de correo electrónico generalmente para correo no deseado.

Nota : El texto anterior está extraído del artículo de Wikipedia " rastreador web ", que se ha publicado bajo el Licencia de documentación libre de GNU .
Historias relacionadas

1

2


Informática y noticias de matemáticas
23 de julio de 2020

Los investigadores están explorando nuevas formas de crear interacciones mecánico-cuánticas entre electrones distantes. La investigación marca un avance importante en ...
Los ingenieros han diseñado un 'cerebro en un chip', más pequeño que una pieza de confeti, que está hecho de decenas de miles de ...

La inteligencia artificial produce nuevos antibióticos

Utilizando un algoritmo de aprendizaje automático, los investigadores han identificado un nuevo compuesto antibiótico poderoso. En pruebas de laboratorio, el medicamento mató a muchas de las bacterias causantes de enfermedades más problemáticas del mundo, ...

Control de luz con luz

Los investigadores han desarrollado una nueva plataforma para la computación totalmente óptica, lo que significa computaciones hechas únicamente con haces de ...
Últimos titulares
actualizado 12:56 pm ET