viernes, 26 de febrero de 2016

Published 8:15 a.m. by with 0 comment

La Web profunda: cuando los buscadores no pueden hacer el trabajo...

Photo credit: Eleni Zazani via Visualhunt / CC BY-NC-SA


La Web profunda

La Web profunda, invisible o oculta está formada por aquellas páginas en la Internet que no son indizadas por los motores de búsqueda de uso general.  Incluye los siguientes elementos:


  • Páginas dinámicas: aquellas que se generan automática al momento de realizar una consulta en la Red.
  • Contenidos no enlazados: páginas que no tienen vínculos entrantes desde otras páginas.
  • Páginas de acceso limitado: se necesita darse de alta para acceder al contenido.
  • Contenidos scripted: sólo son accesibles a través de enlaces producidos por java script.
  • Contenidos no textuales: archivos multimedia.


¿Cómo se clasifica la Web profunda?

  • Web opaca
    • extensión del indizado
    • frecuencia del indizado
    • Número máximo de resultados visibles
    • URL`s desconectadas
  • Web privada
    • protegida por contraseña
    • archivo robots.txt
    • contiene un campo "noindex"
  • Web propietaria
    • es necesario registrarse para tener acceso
  • Web realmente invisible
    • conformada por bases de datos
    • archivos en formato pdf, postscript, flash, etc.
    • páginas dinámicas

¿Cómo buscar en la Web profunda?

  • A través de buscadores generalistas como Google que han agregado funcionalidades nuevas para encontrar recursos en este lado de la Web
  • Mediante buscadores especializados como los mencionados en el vídeo de la clase.

Forman parte de la Web profunda ...


  • Catálogos de bibliotecas
  • Revistas electrónicas
  • Catálogos de editoriales
  • Repositorios de literatura gris
  • Directorios de bases de datos
  • Páginas blancas/amarillas
  • Organismos públicos de gobiernos, ONG`s

      edit

0 comentarios:

Publicar un comentario