- Photo credit: Eleni Zazani via Visualhunt / CC BY-NC-SA
La Web profunda
La Web profunda, invisible o oculta está formada por aquellas páginas en la Internet que no son indizadas por los motores de búsqueda de uso general. Incluye los siguientes elementos:
- Páginas dinámicas: aquellas que se generan automática al momento de realizar una consulta en la Red.
- Contenidos no enlazados: páginas que no tienen vínculos entrantes desde otras páginas.
- Páginas de acceso limitado: se necesita darse de alta para acceder al contenido.
- Contenidos scripted: sólo son accesibles a través de enlaces producidos por java script.
- Contenidos no textuales: archivos multimedia.
¿Cómo se clasifica la Web profunda?
- Web opaca
- extensión del indizado
- frecuencia del indizado
- Número máximo de resultados visibles
- URL`s desconectadas
- Web privada
- protegida por contraseña
- archivo robots.txt
- contiene un campo "noindex"
- Web propietaria
- es necesario registrarse para tener acceso
- Web realmente invisible
- conformada por bases de datos
- archivos en formato pdf, postscript, flash, etc.
- páginas dinámicas
¿Cómo buscar en la Web profunda?
- A través de buscadores generalistas como Google que han agregado funcionalidades nuevas para encontrar recursos en este lado de la Web
- Mediante buscadores especializados como los mencionados en el vídeo de la clase.
Forman parte de la Web profunda ...
- Catálogos de bibliotecas
- Revistas electrónicas
- Catálogos de editoriales
- Repositorios de literatura gris
- Directorios de bases de datos
- Páginas blancas/amarillas
- Organismos públicos de gobiernos, ONG`s

