Academia

Retos y oportunidaddes del big data
"Ante la cuarta revolución industrial"

Por Osvaldo I. Larancuent Cueto

La big data se refiere a una cantidad masiva de datos disponibles en internet, de los cuales podemos obtener respuestas a través de algoritmos informáticos para la toma de decisiones. Se le reconoce en nuestro idioma por macrodatos, datos masivos, inteligencia de datos, entre otros. Estamos ante la cuarta revolución industrial, donde la economía de datos impulsan la productividad, e incluso ha sido comparado con el rol y valor del petróleo en el pasado (The Economist, 2017). Ante este panorama, los informáticos de las organizaciones interesadas en sacar provecho a las tecnologías de la información han expandido las capacidades de los dispositivos electrónicos para mejorar la productividad, reducir los costos y, por tanto, la rentabilidad. Así, los dispositivos actúan como sensores y toman datos del mundo físico, lo convierten en datos y estos son utilizables con fines académicos, comerciales, de mercadeo. Ahora algunos pueden capturar informaciones sobre su entorno, transmitir, monitorear y recibir instrucciones que comparten con otros dispositivos o máquinas localizadas en la web de forma estructurada. Estas máquinas utilizan algoritmos informáticos para analizar el entorno para tomar decisiones y/o predecir o “aprender” a reaccionar en función de los datos que reciben y, finalmente responder con la decisión de vuelta a estos dispositivos inteligentes. Imagínense epidemias como la del virus de la gripe aviar, la chikungunya o la zika. La gente de comunidades afines, afectadas por alguna de estas epidemias “guglea” buscando remedios mientras un algoritmo inteligente con fines sanitarios en un país esté alerta a palabras claves que se acumulen en los buscadores. Estos podrían predecir cuáles comunidades probablemente estén afectadas. Al advertirlo notifican instantáneamente a las autoridades para iniciar una investigación que prevenga que el brote se convierta en epidemia.

Aplicación y oportunidades

Un emprendimiento dominicano (AIME, 2018) ha creado un servicio que utiliza esquemas similares para identificar focos epidémicos de estos virus de forma similar a la descrita. También los utilizan Google, Netflix, Amazon, Facebook, entre otros proveedores de contenidos de internet, aunque aplicados a sus servicios específicos, es decir para recomendar opciones, películas, libros, productos o amistades afines.
En el ámbito de la web todo es grande y masivo, los datos fluyen a altas velocidades y, dada la cantidad de usuarios, esta se expande de forma extraordinaria. Si graficáramos una curva que refleje su crecimiento parecería una letra “J”, es decir una curva exponencial. Esto ocurre porque estamos interconectados en una gran red, tanto a quienes seguimos, nos siguen o buscan. Todo lo que transmitimos se multiplica y hace viral de forma exponencial. Para ilustrarlo hagamos otro ejercicio. Se estima que la cantidad de usuarios (cuentas) en internet alcanza ya los 4.2 millardos, representando casi el 55% de la población global (We Are Social, 2018). De forma similar, los dispositivos móviles que se conectan alcanzan los 5.1 millardos (67% de la población). Y aún más: Facebook tiene 2.7 millardos de cuentas; YouTube, 1.9 millardos; WhatsApp 1.5 millardos; Instagram, 1.0 millardos; entre otros. Y los dispositivos IdC (Internet de las cosas, loT del inglés) crecen también de forma vertiginosa, estimándose que en el año 2020 alcanzarán los 20 millardos de dispositivos en operación (CISCO, 2017).

¿Cuándo se consideran “masivos”?

¿Pero, cuántos datos se generan en la actualidad para denominarse masivos? Antes de proseguir, conviene recordar que la unidad para medir los datos informáticos almacenados es el byte (equivalente a la representación de una letra, número o carácter alfanumérico). Y dependiendo del tamaño del contenido digital, sus magnitudes pueden escalar a: un millar de caracteres (kilobyte o KB); millón (megabyte o MB); millardo (gigabyte o GB); billón (terabyte o TB); billardo (petabytes o PB); trillón (exabyte o EB); trillardo (zetabyte o ZB); cuatrillón (yotabyte o YB). Entre estos datos masivos se registran también nuestras interacciones, gustos, fotos, lugares, relacionados y publicaciones en internet, creando nuestra huella digital, lo que impacta en nuestra privacidad, expone nuestros datos y permitiendo que facilitando que se perfile y conozca nuestro comportamiento. Por lo que esto que se sabe sobre nosotros puede ser interpretado aplicando técnicas de inteligencia artificial para personalizar en nuestro perfil la toma de decisiones. Para darnos una idea de la cantidad de cosas que en nuestra rutina diaria se podrían almacenar en un petabyte (Hardzone, 2018), veamos:

Retos

En esta Era de la Sociedad de la Información y del Conocimiento, diferentes tecnologías de la información, emergentes o disruptivas, convergen para promover la productividad, la innovación, el bienestar de la sociedad. Pero las tecnologías disruptivas también plantean retos y amenazas: estos métodos de extracción e interpretación de los datos tienen un aspecto controversial, siendo cuestionados por su carácter invasivo en la privacidad de las personas; ya se aplica en algunos esta-dos para predecir el comportamiento de sus ciudadanos con fines non sanctus.
Osvaldo Larancuent

Es coordinador del programa de Ingeniería de Ciberseguridad del Área de Ingenierías del INTEC. Es también docente de asignaturas de tecnologías de la información en los niveles de grado y posgrado de la escuela de Ingeniería.

Suscríbete