Web superficial frente a web profunda

          A la hora de realizar la búsqueda de información no se recupera toda la información que hay disponible en la red (online) sino que existe gran parte de la información que no es posible obtener por diversas circunstancias ( resultados de consultas a bases de datos o catálogos, exigencia de contraseñas para entrar en el sitio web, contenido no indizado, etc.). La información que podemos recuperar en un buscador tradicional se denomina web superficial, mientras que la que permanece oculta se llama web profunda.

         La web superficial corresponde pues a aquella información que está indizada por los buscadores y por tanto se puede recuperar casi en su totalidad mediante un consulta en los formularios o cajas de búsqueda. Se caracteriza por:
- información no contenida en bases de datos, 
-libre acceso, 
-no se necesita un registro para acceder a la información, 
-mayoritariamente formada por sitios web estáticos y accesibles desde otro enlace.

         La web profunda corresponde a la información que no se recupera en los buscadores tradicionales , generalmente porque está almacenada en base de datos, aunque pueden concurrir otras circunstancias.Hay cuatro tipos de contenidos invisibles en la red:

- web opaca: formada por archivos que no están indizados en los robots de búsqueda por diversos motivos: por economizar, por frecuencia de la indización (muchas páginas actualizadas no son indizadas), por el número de resultados que es limitado e impide ver todas las páginas (sólo se muestran 100 o 200 resultados), por desconexión (no tienen enlaces link desde otras páginas para que puedan ser referenciadas por relevancia que es el criterio de muestra de los resultados).
- web privada:podrían estar indizadas pero no lo están por alguno de estos motivos: páginas protegidas por contraseñas, contienen archivos que impiden ser indizados o campos con comandos que también evitan su registro
- web propietaria: necesario registrarse para poder entrar en el sitio web ya sea de forma gratuita o previo pago
-web invisible: no pueden ser indizadas por limitaciones técnicas de los buscadores (programas ejecutables o archivos comprimidos, páginas generadas dinámicas, información en bases de datos)


Más información:


Comentarios

Entradas populares de este blog

Programas de la 23 Campaña

23 Campaña de Fomento de la Lectura: Promoviendo la pasión por los libros