El Open Science Data Challenge es un concurso realizado anualmente por Ernst & Young y Microsoft, que busca contribuir a resolver problemáticas mundiales. Por ejemplo, en 2021 la temática fue ayudar a combatir los incendios forestales a través de IA y análisis de datos, y en 2022, consistió en construir modelos para localizar la biodiversidad.

En esta oportunidad, el desafío es buscar campos de cultivo de arroz, predecir su productividad y aumentarla a través de imágenes satelitales, procesamiento de datos, algoritmos y el uso de diferentes softwares. Y Chile será uno de los países participantes.

Chile es uno de los países participantes. Foto : Andres Perez

Hoy en día, más de 800 millones de personas se acuestan con hambre a nivel mundial. Vietnam es uno de los principales productores de arroz del mundo y los vietnamitas obtienen más de la mitad de sus calorías de este cereal. Es un alimento básico para más de 4 mil millones de personas y es vital para una quinta parte de la población mundial.

Al mismo tiempo, actualmente estamos inmersos en una revolución de los datos: no hay escasez de datos disponibles, pero carecemos de la comprensión e interpretación de los datos necesarios para extraer conclusiones procesables. En este sentido, a partir de este desafío, se busca obtener soluciones para aumentar la producción de este alimento básico y contribuir así a disminuir el hambre a nivel mundial.

Algoritmos y tecnología

Para ello, los participantes deberán utilizar datos de radar y de satélites ópticos del Planetary Computer de Microsoft para crear una herramienta que identifique los cultivos de arroz en Vietnam. Si bien no hay requisitos de conocimiento previo para participar, ayudará tener conocimientos básicos en matemática, estadística y programación; así como también tener nociones sobre las curvas fenológicas e índices de vegetación. Además, Microsoft, como socio en este desafío, proporcionará a los participantes un número de créditos gratuitos para Azure.

“Participar en este concurso mejorará los conocimientos de Python para la ciencia de datos, la gestión de big data y machine learning de los participantes, ya que consiste en predecir la presencia de cultivos de arroz en 250 geolocalizaciones, utilizando datos obtenidos en tiempo real (RTC) de la constelación de satélites Sentinel-1, Sentinel-2 y Landsat. Para esto, se les entregará un ejemplo de notebook en la plataforma Jupyter, que se conecta a fuentes de datos públicas en Planetary Computer de Microsoft y que podrá generar un archivo .cvs que se deberá ir mejorando durante el tiempo que dure el desafío”, explica Patricio Cofre, socio de Consultoría en Data Analytics de EY Chile.

La iniciativa buscar enfrentar problemáticas globales.

Las oportunidades de mejora incluyen: explorar otras bandas de Sentinel-1-RTC, utilizar combinaciones de muchas bandas de Sentinel-1-RTC, generar varios índices de vegetación para ser utilizados como características, extraer los valores de las bandas VV y VH para todo un año y resumir utilizando métricas de series temporales, explorar el enfoque de la construcción de un cuadro delimitador alrededor de las posiciones de latitud y longitud dadas, probar otros algoritmos de clasificación, y cambiar el ajuste de hiperparámetros.

Este desafío comenzó el 1 de febrero y se cerrará el 31 de marzo. Los participantes pueden inscribirse individualmente o en equipos de hasta cuatro personas. Los finalistas y el ganador obtendrán premios en efectivo de hasta 10 mil dólares y éste último, será invitado a una ceremonia de premiación en Nueva York, Estados Unidos. Para más información, haz clic aquí.