Noticias sobre las Noticias 14

Mirar la prensa y el periodismo, y comentarlos

 

"Por su estructuración, por el vigor de su expansión y por su estructura y dinámica auto-organizada, la web es –definitivamente- un entorno en el que todo está revuelto." 

 

Por su estructuración, por el vigor de su expansión y por su estructura y dinámica auto-organizada, la web es –definitivamente- un entorno en el que todo está revuelto. La debilidad de las fronteras, lo fluido de los desplazamientos y emplazamientos, el dinamismo de las apariciones y emergencias de sitios, contenidos y data desalienta cualquier tentativa de trazar, delimitar o clasificar qué hay en ella. El único modo de nombrarla, al precio de eludir cualquier referencia a sus contenidos, es el número y la cifra. En 2005 se calculaba que la web visible o superficial consideraba 11,5 x 109 de sitios web. De acuerdo con algunos, la web superficial (o indexada en los motores de búsqueda) considera hoy un poco más de 45 mil millones de sitios (45 x 109). Ver Figura 1. Algunas publicaciones afirman que la web visible en la actualidad es el 0,03% de toda la web. Chris Sherman en 2001, en The Guardian, cita un estudio de BrighPlanet según el cual la web profunda era 400 y 550 veces más grande que la web visible, y contaba con cerca de 500 mil millones de documentos. Sin embargo, Sherman (2001) era más cauto y estimaba entonces que la web profunda era entre dos y cincuenta veces más grande que la visible. Es decir, en las estimaciones más desbordadas el 99,07% de la web sería profunda. Esto es, la web profunda tendría 145 x 1012 sitios[1], frente a los 45 x 109 sitios de la superficial o visible a los motores de búsqueda. Si proyectáramos la proporción establecida por BrighPlanet en 2001, la web profunda consideraría 225 x 1011 sitios web. Las estimaciones de Sherman, más conservadoras, indicarían que la web profunda tiene entre 90 x 109 y 2,25 x 1012 sitios[2]. Es bueno aclarar que web profunda no es web ilegal, dedicada a actividades delictivas[3] (ver Figura 2): incluye repositorios digitales, directorios digitales, archivos digitales en bibliotecas, bases de datos, sitios web no indexados, catálogos, páginas personas, páginas amarillas, blogs, y una galaxia de sitios que los motores de búsqueda no registran.

 

Figura 1: Número de Sitios Web de acuerdo con búsquedas de Google y Bing. Tomado de http://www.worldwidewebsize.com/

 

Diversa, profusa y cambiante, este magma de datos no se deja delimitar, y esta falta de delimitación permite traficar en ella usufructuando poderosamente esa ausencia de delimitación. Contrario al no lugar que subrayara Auge (1998) para designar esos entornos refractarios a las marcas y señales del devenir antropológico y cultural de las personas, la web es sobre todo cualquier lugar, y parece metamorfosearse y aparecérsele al usuario según los rasgos y atributos particulares que espera encontrar quien bucea en ella.

 

Figura 2: Título del artículo de The Time que retoma un tema tratado un mes atrás por Graham Templeton (2013). También la revista Semana publicó una nota periodística (Revista Semana, 2013) que opera sobre la misma asociación: web profunda=web criminal y secreta.

 

Una tarde cualquiera buscaba datos acerca de cómo funcionan las ventanas de avión, cómo regulan la presión y el sonido, y qué función cumplen los pequeños agujeros en una de sus superficies[1]. El buscador Google arrojó un poco más de 3 millones de entradas. Por supuesto, puede hacerse búsquedas más restringidas en Google (búsquedas avanzadas) u operar mediante buscadores especializados. Pero me interesa en esta ocasión destacar la dinámica de una búsqueda no sistemática. Como puede apreciarse (Figura 3), la primera búsqueda ofrece una diversidad de tipos de entradas: publicaciones periodísticas (p.e. Muy Interesante), redes sociales (vg. Taringa, la red social creada en 2004 en Argentina por  Fernando Sanz), diversas referencias y notas periodísticas burlonas y críticas a Mitt Romney, candidato presidencial republicano, que el 25 de septiembre de 2012 se preguntaba por qué no se podían abrir las ventanas de los aviones; blogs, publicidad de Avianca y Homecenter (demarcada en un recuadro rosado), foros, videos en Vimeo, You Tube, páginas de diseñadores e ingenieros, notas de diversos medios periodísticos (como Huffington Post, La Tercera, El País de España), wikipedia, etc.

 

Figura 3: Tres millones de entradas arrojo Google al buscar “ventanas de avión”, en noviembre 7 de 2013.

 

Estas listas Google en que se yuxtaponen páginas y sitios web muy diversos, este entreveramiento de noticias en medios de alguna reputación, blogs de factura variada, publicidad, espacios de conocimiento colaborativo tipo foros y wikis, convierte a cada persona que navega en chequeador de datos más o menos avezado, más o menos ingenuo, más o menos incauto. He sugerido una escala de 1 a 10 para determinar la dificultad en el rastreo y construcción de datos en periodismo, en un entorno crecientemente googleado[1]. Los niveles de dificultad de búsqueda y construcción de data es una función que combina tres variables: 1) cantidad de información producida y disponible, 2) accesibilidad y 3) capacidad de la persona para discriminar, inferir y construir datos. Si la disposición y capacidad de la persona que busca/produce datos es muy baja (no discrimina, no contrasta, no realiza inferencias, no establece relaciones) la abundancia de entradas que ofrece Google –resultado combinado de profusión de información y fácil acceso- se convierte en océano en el que la persona pesca indiscriminadamente, procediendo al copy and paste desbordados. Cuando no hay abundancia de datos, un agente buscador sin mayor capacidad para tratar y recrear los datos arrojados por Google se contentará con los que ofrece este motor de búsquedas, sin más ni más. En ambos casos estamos ante el modo 1 o más básico de búsqueda y apropiación de datos. En el modo 10 el papel de Google es, cuando más, periférico y marginal, y el fundamento del dato está casi completamente cifrado en el agente buscador/productor (institución, persona, grupo de personas). Los modos intermedios 4-7, implican procedimientos de búsqueda dentro y fuera de la web, presencia no abundante de datos y prácticas de decantación y discriminación cuidadosas.

¿En qué modo navegan los usuarios de la web cuando usan Google? Eso depende del tipo de proyectos de búsqueda. Probablemente el rastreo de datos para tareas escolares se desarrolla en los modos más bajos. Pero el interés por comprender de qué se trata el melanoma que acaba de serle diagnosticado a un pariente querido propicie búsquedas de modo intermedio. Y el interés por comprender si además del carbono y el silicio podría haber otro tipo de elementos químicos para generar formas exobiológicas, puede conducir a búsquedas del modo 7-10.

Tráficos, canales, búsquedas, servicios

Entonces una web revuelta, poco delimitada, magma en que se mezclan publicidad, información periodística, rumores, trampas e información malintencionada, prédicas ingenuas y desinformadas, literatura experta y profana, puede favorecer el tráfico oportunista que engancha y arrastra a las personas que se mueven en modo 1 y 2, esto es ingenuamente, aquellos que son guiados por las flores del camino, por asuntos triviales que les llaman la atención. El comercial de Nivea fue difundido por diversos canales. Uno de los más importantes fue Yahoo Noticias (información, entretenimiento, finanzas y deportes). El modelo Yahoo, dirigido a capturar clics, es rico en pseudonoticias, factoides y notas en que se dan cita mercadeo de artistas, marcas, productos e información periodística. Es, en otras palabras, un sitio harto revuelto y entremezclado.

Como decía, llegué a Nivea Estrés a través de Yahoo Noticias.  Y llegué a Yahoo Noticias porque iba a ver mi correo electrónico (Figura 4). Es relevante hacer esta pequeña anotación porque permite destacar trayectorias de navegación muy distintas: una cosa es navegar buscando (googleando); otra, dirigirse a un sitio específico y mientras se navega tropezar con algo que llama tu atención; y una muy distinta es pasearse por ahí, saltando de una página a otra despreocupadamente, sin destino previsto. Es importante distinguir esos tres tipos de trayectorias a efectos de entender mi planteamiento general. Por supuesto, uno puede estar googleando en busca de un dato y, de repente, tropezar con algo que le llama la atención, y de repente comenzar a deambular. Es decir, los tres tipos de maneras de navegar pueden presentarse mientras uso mi computador. Pero lo relevante es entender que se trata de tres modos distintos, tres disposiciones diferentes, durante la navegación.

 

Figura 4: Con la flecha roja, el destino de mi recorrido inicial: el correo electrónico. Con flecha verde, el tipo de recuadro en que encontré el video Nivea Stress. Esta trayectoria es de una naturaleza distinta a las trayectorias de búsqueda Google. En este caso, el usuario no está buscando algo y más bien  tropieza con algo que llama su atención.

 

Es usual que se denomine “tráfico” al número de usuarios que pasan por un sitio web, tal como llamamos tráfico a las personas, animales y vehículos que pasan por una calle. Sin embargo también uno podría llamar tráfico a los contenidos que pasan por delante de uno mientras recorre la web: en este caso, uno va de un sitio a otro y, conforme avanza, va viendo pasar sitios y datos que son el tráfico que circula delante de uno. Cuando uno va en un auto y ve pasar por la ventana otros carros, fachadas de casas, negocios, árboles, personas, avisos luminosos, etc., ese paisaje móvil que pasa delante de uno es tráfico para el viajero; mientras para el planificador urbano o para el agente de tránsito el auto en el que se desplaza el viajero es parte del tráfico. En una palabra, el tráfico es algo que alguien ve pasar, independientemente de que ese alguien se mueva (el viajero de un auto viendo pasar cosas por su ventana) o permanezca inmóvil en medio del fluir (el guarda de tránsito controlando la circulación). De otro lado,uno puede llamar trayectoria al conjunto de tramos recorridos por el usuario en la web: ese recorrido produce el tráfico de sitios web y data que el usuario atisba en sus recorridos. La trayectoria son los movimientos y estaciones, tramos, del usuario. Cuando uno hace una búsqueda en Google su trayectoria es más o la menos modulada por la búsqueda (estoy tras algo que espero). Pero cuando yo voy a revisar mi correo electrónico y topo con algo que me atrae, mi trayectoria no es guiada por mi búsqueda. Cambia debido a que topé con algo inesperado.

Cuando mi trayectoria es modulada por búsquedas el tráfico se dualiza (procedo discriminando lo que importa y lo que no importa), voy pasando de un listado de entradas googleadas a otro, seleccionando rápidamente lo que es pertinente y desechando lo que no. Cuando voy a un sitio específico (mi correo electrónico) sólo un objeto extraño, inesperado, puede desviar el curso de mi trayectoria. Si voy paseando por allí, navegando sin más, todo se iguala, todo puede ser interesante y todo puede ser irrelevante. Se pueden advertir, entonces, tres maneras o disposiciones para recorrer la web, y de esas tres maneras emergen tráficos distintos (ver Tabla 1).

 

Tabla 1: Tres tipos de trayectorias distintas derivadas de tres disposiciones distintas respecto a la navegación en la web: la trayectoria de primer tipo sigue listas google; la de segundo tipo se dirige a un sitio web preciso; y las de tercer tipo, son erráticas, consisten en un deambular sin rumbo preciso. Cuando se habla de “navegar en la web” suele asimilarse a las trayectorias de tercer tipo, y estimo que esto introduce una visión distorsionada de la actividad de las personas en la web.

 

Seguir las trayectorias

Nótese que la oferta de entradas que el motor de búsquedas ofrece en los primeros pantallazos cuando rastreo el término “ventanas de avión” es enorme. Yo no recorrería 3 millones de entradas para comprender el funcionamiento de las ventanas de avión. Echaría un vistazo a la primera pantalla, luego a la segunda pantalla y así sucesivamente, hasta encontrar una que llamara la atención. Este primer tramo de revisión o visionaje no se extendería por muchas pantallas. Si a los primeros pantallazos no encuentro nada, es probable que abandone esa búsqueda y refine los términos de rastreo en Google. Es decir, emprendería una  nueva búsqueda en la siguiente lista y así sucesivamente, hasta encontrar algo relevante. Podemos llamar Trayectoria 1 (Figura 5) a esta primera fase.

 

Figura 5: El recorrido y visionaje del listado de entradas arrojadas por Google constituye la Trayectoria 1