Verdades y mitos sobre el Big Data, el “petróleo del siglo XXI”
A menudo se cree que con los datos a gran escala es posible predecir cualquier fenómeno, pero no siempre es así. Un especialista del área de la ingeniería y ciencia de datos, explica los siete mitos del Big Data más extendidos en los últimos tiempos.
El Big Data y el manejo de los datos parecen ser la nueva ciencia que es capaz de predecirlo todo, y han llevado a medios de comunicación e instituciones académicas en numerosas ocasiones a definir los datos como el “petróleo del siglo XXI”.
Aunque es cierto que la ingeniería informática ha avanzado mucho en los últimos tiempos, el big data no es la solución a todos los problemas. A pesar de la versatilidad de las soluciones basadas en datos, también hay creencias o mitos en torno a esta disciplina que se repiten y que carecen de base.
Así lo afirma Javier García Algarra, director académico del área de Ingeniería y Ciencias en el Centro Universitario U-tad, que ha identificado y desmentidos los siete mitos del Big Data más extendidos en los últimos tiempos.
1. Muchos datos = Big Data
El primero de los mitos es el que identifica muchos datos como sinónimo de Big data. Esto no siempre es cierto, ya que puede que se esté recogiendo un volumen enorme de información pero que no sirva para el problema que se quiere resolver porque no es representativa.
Por ejemplo, si se tiene acceso a millones de historias clínicas en España, esos datos no permitirán hacer predicciones correctas sobre las posibilidades de un paciente de desarrollar diabetes o melanoma en Filipinas o Guatemala, aunque el sistema sea muy preciso para la población española. Tampoco se pueden deducir los gustos musicales de los mayores de 50 años estudiando las listas de reproducción de los estudiantes de bachillerato.
2. Con Big Data podemos predecir cualquier fenómeno
A menudo se cree que con Big Data es posible predecir cualquier fenómeno. No obstante, para que esto sea cierto es imprescindible que lo que se esté estudiando no sea completamente aleatorio.
De esta manera, no se puede predecir qué número resultará premiado en el sorteo de la Lotería de Navidad, aunque se conozcan los resultados de los cien años previos, porque está relacionado con el puro azar.
Por el contrario, sí es posible estimar que un equipo de fútbol ganará a otro siete de cada diez veces que se enfrenten por el análisis de resultados recientes.
3. El Big Data puede solucionar cualquier problema
Otra concepción errónea sobre los macrodatos es que puede solucionar todos los problemas. Muchas personas esperaban que la ciencia de datos parase el Covid-19 a principios de la pandemia, pero la mayoría de los modelos predictivos sobre su expansión fallaron estrepitosamente.
Esto se debe a que esta pandemia no tiene precedentes, y por ello no existen siglos de experiencia, ni datos, y por eso resultaba muy aventurado hacer predicciones.
Por el contrario, todos los años las autoridades sanitarias prevén con gran acierto cuántos contagios de gripe habrá y en qué semana va a suceder el pico. Esto es así porque la gripe es recurrente y existe una serie histórica de datos representativa.
4. Elecciones sin sorpresas con Big Data
Un mito común es el que predecía que las elecciones se quedarían sin sorpresas con Big Data. La experiencia demuestra que no es posible predecir con exactitud el resultado de las próximas elecciones estudiando lo que sucede en las redes sociales.
Esta es una leyenda que se basa en la predicción exitosa de los resultados de las elecciones presidenciales de Estados Unidos en 2012, cuando Barak Obama resultó reelegido. Sin embargo, esas mismas predicciones fallaron en las elecciones de 2016, cuando Donald Trump fue el ganador contra todo pronóstico.
La realidad es que el comportamiento electoral es extremadamente difícil de modelar, y las redes sociales no son una representación fidedigna de la sociedad, sino solo de su parte más bulliciosa.
5. Tu futuro laboral depende del Big Data
Algunas personas piensan que, en el futuro, los procesos de selección de personal o los despidos los decidirán algoritmos usando big data.
No obstante, si bien es cierto que la toma de decisiones usando datos es una herramienta muy poderosa en manos de las empresas, la última palabra la tendrá siempre un ser humano, según estima García Algarra.
6. Mis datos no le importan a nadie
Otro de los mitos es el de quienes piensan que sus datos no le importan a nadie, o que no hay ningún peligro en compartirlos con aplicaciones o plataformas.
Todo dato que se genera al usar Internet queda en la red para siempre y no se sabe quién lo va a usar ni cómo se va a comercializar, en la actualidad o dentro de 20 años, como destaca el director académico de la U-tad, que destaca la importancia de educar a los jóvenes en la cuidar la información que comparten.
7. El Big Data y los algoritmos son mágicos
Algunas personas ven algo “mágico” en el Big Data, pero en realidad detrás de esta tecnología solo hay matemáticas y computación, nada irracional, y la desarrollan seres humanos que conocen bien lo que están haciendo.
“No hace falta ningún poder sobrehumano para entenderlo, solamente estudio y dedicación”, como concluye García Algarra.
Comenta
Por favor, inicia sesión en La Tercera para acceder a los comentarios.