viernes, 26 de febrero de 2016

Web Superficial y Web Profunda


Web Superficial y Web Profunda

ara buscar bien, es imprescindible tener en cuenta, que además de los buscadores convencionales, hay disponibles otras fuentes específicas de información.
Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. Lo que resta, la Web profunda o invisible, es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional.

La Web Superficial o visible

La Web Superficial comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.

Las características principales de los sitios de la Web visible son:

* su información no está contenida en bases de datos
*  es de libre acceso
*  no se requiere la realización de un proceso de registro para acceder a la información.
*  mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una

URL fija y accesibles desde otro enlace.

La Web Profunda o invisible

Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos. Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.
Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisible Web).

La Web opaca está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por alguno de los siguientes motivos:
*  Extensión de la indización: a veces, por economía, no todas las páginas de un sitio son indizadas en los buscadores.
*  Frecuencia de la indización: los buscadores no poseen la capacidad de indizar todas las páginas existentes; a diario se agregan y modifican muchas y la indización no se realiza al ritmo que permita incluirlas a todas.
*  Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados, generalmente limitan el número de documentos que se muestran (entre 200 y 1000).
*  URL desconectadas: las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. Si un documento no tiene un link a él, desde otro documento, será imposible que la página sea encontrada, pues no se encuentra indizada.

- La Web privada consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:

*  Las páginas están protegidas por contraseñas.
*  Contienen un archivo “robots.txt” para evitar ser indizadas.
*  Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página.

Este segmento de la Web contiene, en general, documentos excluidos deliberadamente por su falta de utilidad. Ya que son los dueños de la información que contienen, los que deciden que no se encuentre disponible, por lo que difícilmente se podrán encontrar mecanismos legítimos para franquear esa barrera.

- La Web propietaria incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada.

- La Web realmente invisible se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.



martes, 16 de febrero de 2016

Herramientas de Busqueda

Las Herramientas de Búsqueda

Buscadores:
Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los documentos referenciados en ellas.
Un buscador está compuesto por cuatro componentes básicos:

*  un robot,
*  un motor de indexación,
*  los índices
*  un motor de búsqueda.



viernes, 5 de febrero de 2016

Infoxicación - Sobrecarga informática


La “sobrecarga informativa” (information overload) es una expresión que acuñó Alvin Toffler en su libro “Future Shock” (1970) y hace referencia al estado de contar con demasiada información para tomar una decisión o permanecer informado sobre un determinado tema. Ante una gran cantidad de información para analizar, o contradicciones en la información disponible, o no disponemos de un método para comparar y procesar diferentes tipos de información, estamos frente a una “infoxicación”. Este último término, introducido por Alfons Cornella en 1996, refiere actualmente a la idea de que la sobrecarga de información que recibe un usuario, en especial de Internet en todas sus formas, puede causarle la sensación de no poder abarcarla ni gestionarla y, por tanto, llegar a generarle una gran angustia.


En la siguiente liga se habla más sobre el tema:
http://alfonscornella.com/thought/infoxicacion/


infoxicacion-ruca_co





1. ¿Qué es la infoxicación? ¿Es lo mismo la infoxicación y el "overload information"?
La infoxicación es el exceso de información. Es, pues, lo mismo que el information overload. Es estar siempre "on", recibir centenares de informaciones cada día, a las que no puedes dedicar tiempo. Es no poder profundizar en nada, y saltar de una cosa a la otra. Es el "working interruptus". Es el resultado de un mundo en donde se prima la exhaustividad ("todo sobre") frente a la relevancia ("lo más importante").

2. ¿Quiénes son más propensos a ser "infoxicados"?
Los que pretenden que siguiendo todos los inputs que reciben estarán más informados. No es leer todo lo que está a tu alcance lo que te hace más informado, sino recibir información de calidad. Los que confunden cantidad de información con calidad son los más propensos a salir infoxicados. Estar todo el día conectados a decenas de fuentes confunde más que informa. La ansiedad por la información infoxica.



3. ¿Cuáles son los efectos de la entrada constante de información y cómo puede afectar el funcionamiento del ser humano?
Demasiada información limita nuestra capacidad para comprender. Para procesar mucha información hay que saberla dominar. Sólo alguien que ha profundizado en una materia, que ha leído mucho sobre el tema, puede procesar rápidamente información: sabe lo que es cierto, lo que es probablemente cierto, y lo que es obviamente falso. Para procesar con rapidez información hay que tener mucho conocimiento previo sobre el tema. Esta es una de las paradojas de nuestra era: no tenemos tiempo de profundizar en nada, de ser un experto, lo que nos daría capacidad para manejar rápidamente mucha información; en lugar de ello, procesamos más y más información antes de convertirnos en expertos en algo. Devenimos “comepalabras” antes de que podamos saborearlas. Leemos demasiado y entendemos muy poco de lo que leemos.


4. ¿Cómo una persona puede identificar que está "infoxicado"?
Cuando siente que no puede manejar toda la información que cree que debería manejar. O sea, cuando la información que le rodea en su día a día le angustia. Uno está infoxicado cuando no puede absorber más información, cuando todo lo que hace es remitir la información que recibe a otros, a sus amigos, a sus contactos en las redes sociales. Pero hay un síntoma incluso más claro: estás infoxicado cuando te resulta difícil leer un texto de forma pausada, palabra a palabra; cuando lees saltando palabras, porque te has acostumbrado a leer así en diagonal. Estás infoxicado cuando lees sin entender lo que lees.

Búsqueda Avanzada

La búsqueda avanzada es un tipo de búsqueda que posee características adicionales
soportadas por un motor de búsqueda o buscador. Suele ser una opción de elección libre en
los buscadores, programas, herramientas y servicios online.
Una búsqueda simple generalmente consta de un cuadro de texto en el que se ingresa una cadena
de caracteres, en cambio, las búsquedas avanzadas suelen contar con múltiples cuadros de texto,
casillas de verificación y otros elementos incluidos habitualmente en los formularios. Por lo
general, estos elementos permiten aplicar filtros a la búsqueda básica, para obtener resultados
más exactos.

Presentación:

https://docs.google.com/presentation/d/1SYVXKYkeUcY-478rse_bFfBW8z5cQJ3SM7Htd2t0rdA/edit?usp=sharing