Entrevista a Rodrigo Carrasco: Modelos de datos de la astronomía que pueden ayudar en otros quehaceres

Por Carlos Franco

Investigación en Operaciones es un área del conocimiento escasamente conocida entre las personas ajenas a la ingeniería. «Es la ciencia más usada y que menos se conoce», dicen los profesores de las facultades en que se enseña. ¿De qué se trata? En sencillo: del desarrollo de herramientas para tomar mejores decisiones.

«En Estados Unidos le llaman ‘The Science of Better’ o sea, la forma de hacer las cosas mejor. Básicamente se trata de usar herramientas analíticas (modelos matemáticos, estadísticos) para tomar mejores decisiones (…) Su consolidación se da en la Segunda Guerra Mundia, en el área de operaciones militares. De ahí viene su nombre», me explicó el Profesor Asociado y Director Académico del Magister Ingeniería Industrial en la Facultad de Ingeniería y Ciencias de la UAI, Rodrigo Carrasco, en la conversación que tuvimos hace un tiempo en el programa «Viaje al Centro de los Datos». Hablábamos de eso porque la investigación en operaciones está en el centro de un proyecto interesante que busca tomar modelos de datos que permiten resolver problemas complejos ligados a la astronomía y aplicarlos en otras áreas: la falta de camas en un hospital, por ejemplo. Lo que sigue es parte de esa entrevista.

Hablemos de tu experiencia ¿Qué algoritmo de un área en particular te ha tocado tomar, meterle cabeza y aplicarlo en otra área?

He tenido la suerte de que en los últimos cinco años he estado trabajando con algoritmos de telescopios en Chile. No se ha trabajado mucho el área de operaciones en telescopios desde la investigación de operaciones, entonces hay una capacidad bien chora de problemas, entretenido para mí, no para ellos porque ellos tienen que resolverlos (ríe), pero son problemas muy interesantes, donde tienen un montón de datos para poder analizarlos y tratar de resolverlos. Ahora hemos estado trabajando harto con el Radiotelescopio ALMA en diferentes problemáticas que tienen ellos que se pueden ir modelando. Hay un camino bidireccional de problemas que uno puede llevar y traer. Por ejemplo, hace unos años empezamos a trabajamos en cómo podemos identificar fallas en los sistemas automáticamente. En el caso de ALMA, ellos tienen alrededor de 133 mil puntos de monitoreo sacando muestras cada cinco a diez segundos, así es que están generando en el orden de 50 gigas diarios de datos operacionales. Esos no son datos de imágenes con los que se hace ciencia, son datos de temperatura, ángulos, corrientes, voltajes, que están en los diferentes circuitos y sistemas que ellos tienen, lo cual hace que la posibilidad de ahogarse en datos sea algo real. En el momento que llega un ingeniero y mira esto -50 gigas todos los días- es una gran cantidad de datos que hace muy difícil identificar patrones y cosas así. Desde el principio ellos se dieron cuenta de que mostrar los datos para entender qué pasa no es algo que puedan hacer rápido, por lo cual empezaron a ocupar herramientas más sofisticadas para decir «bueno, yo necesito que me limpien esto y me indiquen dónde mirar», y ahí empezamos a desarrollar algoritmos que identificaban algunos patrones dentro de esto, para poder transformar datos en información útil para ellos. Y ahora estamos trabajando en ocupar esa misma información -porque pasamos de ahogarnos en datos a ahogarnos en información- a poder destilar de nuevo y tener algoritmos que nos permitan decir «bueno, si tengo todas estas banderas levantadas, cuál es la bandera que debiera estar tomando primero yo» ver cuáles son las cosas más críticas que debiese estar viendo para tomar decisiones.

Y ese mismo tipo de algoritmos, ese mismo tipo de problemas es lo que tú vas a ver como algo mucho más común hoy día, en sistemas de producción o sistemas de transporte que están mucho más automatizados. La línea 7 del metro (Santiago de Chile) va a estar full automatizada, va a tener una gran cantidad de datos operacionales. Será tremendamente útil, creo yo, que esos mismos sistemas estén revisando qué cosas pueden estar fallando. A veces la causa será un fusible que vale cien pesos en la Casa Royal, como también puede ser, como ocurre con ALMA, que sea una pieza que necesitas mandar a hacer y debas esperar seis meses a que alguien la fabrique.

Tomando la frase, cada vez más popular, «los datos son el nuevo petróleo» y considerando la relevancia que tiene Chile en astronomía y todo ese mundo que tú has explorado, ¿vamos a ser país petrolero?

Ese es el sueño. Llevamos muchos años en los cuales hemos ido desarrollando capacidad gracias a los telescopios. Los astrónomos llevan varias décadas haciendo esto.

Más allá de los datos, el petróleo que tenemos es el cielo, la calidad de cielo que tenemos. Es el incentivo para que tengamos todas estas máquinas de generación de datos. Y ahí la ventaja nuestra es que se ha ido desarrollando una capacidad técnica en el país, tremendamente grande. Hemos aumentado la cantidad de astrónomos que tenemos. De ahí han venido grupos de científicos que están desarrollando sensores ahora para estos equipos, gente que está desarrollando sistemas de detección, sistemas de control. Hace 20 ó 30 años atrás muy poca gente lo hacía en telescopios, eran cosas que importábamos y armábamos acá. Ahora, el hecho de que tengamos estos aparatos con gran financiamiento y a largo plazo, que eso es súper importante, te permite desarrollar en cierta forma una industria del conocimiento alrededor de eso, y el sueño que tenemos quienes trabajamos en esta área es que la generación de datos es cada vez más grande. ALMA está generando teras y los telescopios que vienen después como el Vera Rubin Observatory van a estar generando cantidades aún mayores. El SKA que va a estar en Australia también, son cantidades de exabytes/año de datos los cuales hay que empezar a procesar, saber cómo identificar cosas adentro y obviamente si tú tienes acceso a esa información y tienes acceso a esos problemas tú puedes entrenar esos problemas y desarrollar capacidad local para poder para agarrar esos problemas y llevarlos a otros lados también. El hecho de que tú puedas analizar imágenes rápidamente e identificar supernovas quizá pueda ayudarte a, el día de mañana, identificar rápidamente barcos que están en imágenes satelitales y los puedas ayudar ante una emergencia o en el caso de un tsunami. Ese tipo de cosas que necesitas rápido, porque obviamente cuando se produzca el tsunami y recibas los datos no vas a tener la capacidad de desarrollar el algoritmo; mientras que, con todos los datos que te dan las estrellas hoy ya estás desarrollando esos algoritmos que son transferibles.

Cuando se presentó el proyecto DATA OBSERVATORY, de la Universidad Adolfo Ibáñez, se dijo «mirar al cielo para resolver los problemas de la tierra», ¿coincides?

Así es. Y de hecho es más cercano de lo que uno piensa. Hoy tenemos una gran cantidad de sistemas que generan imágenes satelitales cuyo acceso es gratis. Tú puedes entrar a plataformas en Estados Unidos o Australia y hacer ciencia con eso. Hay un concurso impulsado por la Agencia Espacial Europea en el cual están usando imágenes satelitales para que la gente ocupe gratis esas imágenes y pueda ver qué aplicaciones y desarrollos se les ocurren para recuperar mejor Europa después de la pandemia. Y pueden ser cosas complejas o simples; por ejemplo, identificar terrenos que tengan agua cercana pero no son ocupados como predios para plantar, tú puedes impulsar que se desarrolle una mejor capacidad de producción agrícola en un lugar donde está muy decaída la alimentación. Estoy inventando algo muy al vuelo, pero quizá no es tan loco pensarlo, porque hoy en día he visto hartos ejemplos de datos que se están ocupando con imágenes satelitales para tener el historial de una zona 10 ó 15 años hacia atrás y graficar cómo fue la vegetación en ese espacio, cómo se ha reducido la cantidad de agua, cómo han aumentado los caudales de algún río ahí. Lo puedes hacer directamente con imágenes satelitales. Que es el mismo proceso que haces cuando miras hacia arriba y buscas galaxias y cosas por el estilo. Es mucho más parecido de lo que a uno se le podría ocurrir.

Respecto de ese futuro que nos muestras, ¿estamos bien parados como país, para quedar en una buena posición de cara a ese futuro?

Yo creo que sí, que se ha hecho una inversión gigante en ciencia. Obviamente estamos al debe en política macro, pero tenemos científicos muy reconocidos en algunas áreas y la investigación de operaciones es una de ellas, mucho más que en otros países vecinos.

Revisa la entrevista completa aquí:

Algoritmos para identificar noticias falsas: ¿cómo funcionan?

K-Vecino, redes neuronales, modelos híbridos, se han convertido en palabras claves si buscamos información sobre algoritmos asociados a la detección de fake news o contenido engañoso. Aquí te presentamos un ejemplo un Naive Bayes Multinomial. Reproducido por Rafael Cereceda, profesor del Diplomado en Periodismo de Datos y Fact-checking, en su charla «Programar para comunicar: un lenguaje al alcance de todos».