Te conocen. Te ven. Te leen. Te siguen. Y recuerdan todo de vos. Pero no son espías. Tampoco es una conspiración internacional. Se trata simplemente de todo lo que te rodea en la vida diaria. El teléfono, la computadora, los registros médicos, las tiendas online, las tarjetas de crédito. Todos los actos cotidianos hoy se convierten en datos digitales y sacarles el mejor provecho es una de las grandes batallas de estos tiempos. Esto es lo que se conoce como Big Data.
A partir de este año, la Facultad de Ingeniería de la Universidad ORT Uruguay ofrece el Diploma de Especialización en Analítica de Big Data, cuyo objetivo es que profesionales universitarios cuenten con capacidades técnicas para resolver problemas complejos en un mundo de grandes volúmenes de datos. Este postgrado les brinda herramientas para adaptarse rápidamente a los cambios tecnológicos en su ámbito laboral.
Si bien es un tema que parece estar de moda, las cifras le dan un respaldo incuestionable: más de 2,5 trillones de bytes (sí, un número con 18 ceros) de información se generan día a día. Y esto recién comienza: los expertos prevén que el actual número se multiplique con más velocidad en los próximos años.
¿Pero de qué hablamos cuando nos referimos a estos volúmenes diarios de datos?
- 300 mil millones de correos electrónicos.
- Más de 250 millones de tuits.
- Unos 800 millones de posts en Facebook.
- Más de 432.000 horas de video que se suben a la Web.
- Dos billones de búsquedas que se hacen en Google.
- 9,5 mil millones de transacciones que se ejecutan con tarjetas de crédito solo en Estados Unidos.
Todas estas acciones cotidianas generan datos, que se suman a otras cuestiones como registrarse al tomar un avión, pagar cuentas de la casa desde el celular, comprar en el supermercado, bajar una aplicación al celular, anotarse en un club, comprar entradas de cine online, buscar una dirección en Google Maps, ir al médico u hospedarse en un hotel.
Todas estas huellas que quedan de nuestras acciones son almacenadas digitalmente, y actualmente también son analizadas. Allí, dicen los expertos, está la gran riqueza de estos tiempos: en la información disponible y la capacidad para estudiarla y usarla con algún fin.
Hito a hito
Como suele suceder con los cambios sociales, Big Data no es un fenómeno nuevo ni aislado, sino que forma parte de una larga cadena de hechos y desarrollos vinculados a la captura y el uso de datos.
Desde las primeras bibliotecas en Babilonia hace más de 5.000 años hasta el siglo XX, cuando surgió la necesidad de gestionar la cantidad de información que comenzaba a producirse en masa, pasaron muchas cosas. Entre ellas, desarrollos de sistemas para automatizar tareas, predecir el clima y almacenar datos, que llevaron a lo que sucede en la actualidad.
“En los últimos años el disparador fue el acceso a tecnología que pudiera procesar y analizar esa cantidad de datos que se genera. Cada vez se puede almacenar más y cada vez las computadoras tienen más poder de análisis de esos datos”, detalló Sergio Yovine, Doctor en Informática por el Institut National Polytechnique de Grenoble, profesor de la Facultad de Ingeniería y coordinador académico del Diploma de Especialización en Analítica de Big Data de la universidad.
Big Data como un “gran hermano”
Hoy, Big Data se puede aplicar a una gran variedad de áreas, aunque quizás uno de los ámbitos más populares es el análisis de la información que navega en redes sociales. Su uso, a su vez, puede aplicarse en la política, los estudios sociales, económicos o empresariales.
También se puede utilizar en el área médica —empleando los registros de las historias clínicas de varios hospitales para precisar el tratamiento de una enfermedad, por ejemplo—, en la investigación científica, en la detección de fraudes, en la toma de decisiones en una organización, en la creación de campañas publicitarias a partir de datos más precisos, en la elección de inversiones y en la organización de recursos humanos dentro de una empresa, por solo citar algunos ejemplos.
Big Data, de hecho, fue un elemento central en las recientes elecciones presidenciales de Estados Unidos.
“Estudiar la distribución geopolítica del electorado, pero además saber qué compran, si tienen créditos hipotecarios y qué nivel de estudios alcanzaron, es útil para fijar objetivos de campaña y saber qué mensaje es mejor recibido”, ejemplificó Yovine.
“Una de las cosas que fue más eficaz en la campaña de Donald Trump fue identificar de inmediato los mensajes que estaban funcionando bien y cuáles no, y de esa forma eliminarlos”, agregó.
Tres partes de un ciclo
Al trabajar con Big Data se pueden observar tres grandes áreas, detalló Yovine. La primera supone la captura de los datos; es decir, la tarea de obtenerlos, limpiarlos y dejarlos listos para ser analizados. “Es una de las tareas que consume más tiempo”, planteó.
El segundo paso es, precisamente, el análisis. Ahí es donde surge una figura relativamente nueva, la del llamado científico de datos, “el trabajo más sexy del siglo XXI” según catalogaron Tom Davenport, profesor visitante de la Escuela de Negocios de Harvard, y D.J. Patil, de la empresa Greylock Partners, en un suplemento sobre Big Data publicado por Harvard Business Review.
Antes, en 2011, un informe de la consultora McKinsey & Company señaló que en 2018, en Estados Unidos habría un déficit de entre 140.000 y 190.000 científicos de datos, profesionales capaces de sacar partido de la gran cantidad de información disponible. También reveló que habrá una falta de 1,5 millones de gestores que puedan tomar decisiones a partir de la información obtenida.
Básicamente, un científico de datos, explica Yovine, es quien elige un algoritmo de “machine learning” o de aprendizaje a partir de los datos, que permita obtener la predicción más acertada con respecto a la pregunta que alguien se hizo. En general, quien plantea esta pregunta es el que luego usará esos datos; puede ser el gerente de una empresa, un médico o el director de una campaña política.
“Es el trabajo más interdisciplinario, porque tiene que conocer mucho de matemática, probabilidad y estadística y algoritmos, para saber qué buscar y hacerlo de manera más eficiente”, señaló Yovine.
Finalmente, el ciclo se cierra con la presentación y visualización de los resultados. En general, en esta etapa están involucrados aquellos que toman las decisiones a partir de los datos obtenidos, por lo que la información que llega a sus manos debe estar presentada de un modo accesible.
Big Data en la universidad
El postgrado que se inició en marzo de este año en la Universidad ORT Uruguay se focaliza en la segunda etapa del proceso de Big Data, aunque recorre todo el ciclo, planteó Yovine.
Curricularmente, este diploma tiene una parte teórica y otra práctica. Los docentes, profesionales elegidos por su conocimiento y experiencia en el área, dictan seis materias centrales y tres talleres prácticos en las áreas Análisis de Datos, Sistemas y Gestión de la Información.
Según detalló Yovine, el diploma está inspirado en propuestas de universidades de Argentina, España y Estados Unidos, en especial el Master of Information and Data Science de University of Berkeley.
Actualmente están cursando este postgrado 28 profesionales; dos tercios de ellos Ingenieros en Sistemas y un tercio proveniente del área económica, con formación en econometría y estadística o que trabajan en empresas que realizan Business Intelligence, dijo Yovine.
“En el mercado actual, el manejo de Big Data es una capacidad requerida y necesaria”, afirmó. De hecho, el postgrado surgió en parte por el interés de empresas que se acercaron a la universidad interesadas en una propuesta que aborde Big Data y también por la creciente cantidad de tesis de graduación de la facultad cuyos temas están vinculados a Big Data.
A nivel académico, Yovine agregó que quienes terminen el diploma pueden continuar su formación para obtener en la facultad el Master en Ingeniería (por investigación).