lunes, 5 de septiembre de 2016


Web Superficial & Web Profunda

Durante nuestras búsquedas en la web tenemos que tener en cuenta que los buscadores tradicionales no tienen la capacidad de indexar toda la información disponible en la web por lo cual tenemos que buscar otras alternativas de búsquedas, en algunos casos se vuelve necesario que nos "sumerjamos" en la web profunda para emprender nuestra búsqueda

Web Superficial: 

comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda; Entre sus características se encuentran
  • Su contenido es de libre acceso
  • Su información no está contenida en bases de datos
  • No se requiere un proceso de registro para acceder a la información
  • Mayoritariamente son Webs estáticas (poseen URLs fijas)

La Web Profunda Invisible (También llamada Web no indizable)

Se usa dicho término para referirse colectivamente a la información disponible en Internet que no puede ser obtenida al interrogar a los buscadores tradicionales, generalmente es almacenada y accesible mediante bases de datos
Dicha información no es accesible a buscadores tradicionales debido principalmente a que la búsqueda se realiza mediante la contestación a una pregunta directa y se almacena en enlaces de carácter dinámico y temporal
Se identifican 4 tipos de estos contenidos en la Web:
  1. Web Opaca: compuesta por archivos que aunque podrían ser incluidos por buscadores tradicionales no lo están por motivos de extensión de indización, de frecuencia de indización, por el número máximo de resultados visibles, o por URLs desconectadas
  2. Web Privada: que son excluidas deliberadamente de la indización de los buscadores ya sea por la protección con contraseñas o la inclusión de archivos que evitan que sean indizadas
  3. Web Propietaria: en la que se debe realizar un registro ya sea gratuito o pagado para poder revisar su información
  4. Web Realmente Invisible: compuesta de páginas que no pueden ser indizadas debido a limitaciones de los buscadores puesto que dichas páginas se generan a partir de los datos que incluye el usuario (son dinámicas); su información no puede ser extraída a menos que se realice una petición específica
Muchas Gracias Por Su Atención

No hay comentarios:

Publicar un comentario