Dark Data, el lado olvidado del Big Data

06 marzo 2017

Imagen Destacada
Igual que los astrofísicos postulan la existencia en el universo de una materia y energía oscuras no detectables, pero que pueden constituir el 95% de todo lo que existe, la mayor parte de la información que circula por las redes queda fuera del rango de estudio de las empresas. Es lo que se conoce como Dark Data o Datos Oscuros, para algunos una fuente de riqueza potencial y para otros un motivo de riesgo.

Pablo Rodríguez Canfranc

La consultora Gartner define el Dark Data como aquellos activos de información que una organización recoge, procesa y almacena durante sus actividades de negocio, pero que no llega a poner en valor ni explotar. De acuerdo con International Data Corporation (IDC), el 90% de los datos no estructurados no se analizan nunca (algunos hablan del 80%). Se trata de una ingente cantidad de información que obra en poder de las empresas y que estas no saben, no pueden o no quieren monetizar.

Isaac Sacolick, experto en transformación digital en StarCIO, aporta una definición más amplia del fenómeno de los datos oscuros. Coincide en que se trata de información almacenada por la empresa que no es analizada ni utilizada y describe tres posibles tipos:

  • Datos que existen en el seno de la empresa y en un formato accesible que no han utilizados hasta el momento.
  • Datos que están en poder de la empresa, pero que se encuentran en formatos que resulta muy costoso procesar para su uso.
  • Datos que no son capturados por la empresa o que se encuentran fuera de su rango de actuación.

Para hacernos una idea de este concepto podemos describir a modo de ejemplo algunas categorías de información que se pueden considerar como Dark Data: información diversa que deja el cliente en sus relaciones con la empresa, archivos de registro (log files), información de antiguos empleados, datos sin procesar de encuestas realizadas, registros de llamadas de clientes, coordenadas de geolocalización, registros de todo tipo de sensores, cadenas de correos electrónicos… Realmente cualquier pista o rastro que dejamos en la red, por banal o insignificante que parezca, puede ser utilizado por una empresa para conocernos mejor o estudiar nuestro comportamiento. De ahí que algunos vean en el Dark Data una poderosa herramienta de marketing.

Algunas empresas tecnológicas han empezado a desarrollar sistemas para explotar el Dark Data. Watson en IBM Cloud es una de ellas y la propia compañía nos cuenta sus funciones en el siguiente vídeo:

El tema es que aparentemente los denominados datos oscuros parecen ser morralla sin valor que nos llega sin querer y, sin embargo, si los combinamos con otros datos que, bien recopilamos para algún fin, bien compramos para explotar comercialmente, podemos encontrar una importante fuente de valor añadido sobre los entresijos de los comportamientos de los consumidores que nos aporte una ventaja competitiva frente a la competencia.

La propia Gartner, que nos aportaba un poco más arriba la definición del fenómeno, se muestra cautelosa -si no escéptica-, acerca de la posible utilidad de toda esta información oscura. Con un ímpetu abiertamente desmitificador, desmonta la supuesta máquina de hacer dinero que algunos ven en estos retales de información, o cuando menos, matiza acerca de sus aireados beneficios potenciales. Básicamente, nos recomienda: “a no ser que usted, el que lleva el negocio, tenga alguna idea sobre qué le quiere preguntar a este Dark Data, no tiene sentido preocuparse por ello”. Lo que nos quiere transmitir es que toda esta información en bruto nos tiene que ayudar a probar una idea, una teoría o responder a una pregunta que hagamos relacionada con el marketing de negocio, y si no es así, no es más útil que los muebles viejos que no tiramos y guardamos en el desván, “por si algún día nos hacen falta”.

Aparte de que el Dark Data pueda ser un activo estratégico o no para la empresa, hay quien ve en este fenómeno un riesgo potencial para el negocio, que puede abrir brechas de seguridad e incluso traer consigo problemas legales. Ed Tittel de CIO.com resume los peligros que vislumbra en los datos oscuros, tanto si son utilizados por un negocio en concreto como si lo hace su competencia:

  • La protección legal de gran cantidad de datos (financieros, confidenciales, sanitarios…) puede convertir en un delito su uso por la empresa.
  • Podría hacerse pública, al explotar el Dark Data, información estratégica sensible de negocio, como las operaciones, las alianzas o los factores de ventaja competitiva, poniendo en riesgo el funcionamiento comercial de la organización.
  • Cualquier posible brecha o fuga de información de la empresa redunda negativamente en la reputación de la organización.
  • Si una empresa ha decidido no invertir en explotar sus Dark Data podría llegar algún agente de la competencia para aprovecharse de ellos y de la pérdida de inteligencia competitiva.

El progresivo despliegue del Internet de las Cosas (IoT) no hará sino aumentar el universo del Dark Data. Un crecimiento exponencial del número de dispositivos y sensores, que se prevé de más de 20 de billones para 2050, sin duda multiplica la cantidad de información volcada en la red, de forma, que las estimaciones arrojan que la IoT generará ya en 2019 una cantidad de datos 269 más grande que la que se transmite entre centros de datos o entre dispositivos, y la mayor parte será Dark Data.

Resulta llamativo que, aparte de la información desestructurada en formatos “clásicos” o de texto, perfectamente legibles actualmente, el estudio del Dark Data se centra en otro tipo de datos no estructurados en formatos que hasta ahora no habían podido ser interpretados y analizados en masa. Entre estos se encuentran archivos de vídeo, de audio e imágenes, que de acuerdo con los expertos en Big Data, pueden ser una rica fuente de información para entender aún mejor a los clientes, empleados, las operaciones y los mercados.

Por ejemplo, las cámaras de seguridad de una tienda nos pueden ofrecer mucha información acerca de los compradores analizando sus gestos y expresiones. Con una tecnología que sea capaz de aplicar analítica al vídeo y al audio en tiempo real se nos abre un universo de posibilidades para estudiar sobre la marcha el comportamiento del cliente y ofrecer la respuesta oportuna. Otro ejemplo, analizando los sonidos que se producen en el interior de las cañerías podemos recabar información sobre su funcionamiento y prevenir averías, algo que pueden aplicar las refinerías.

Toda la información está ahí, esperando. Solamente hace falta que aprendamos a leerla y aprovecharla para poderle dar un valor inestimable.

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada.