Inteligencia Artificial en la Prevención del COVID-19
Estudiante de Ingeniería en Ciencias y Sistemas - USAC
sebastiantuchez0@gmail.com
Estudiante de Ingeniería en Ciencias y Sistemas - USAC
franklinvelasquez35@gmail.com
Deep Learning y Redes Neuronales Convolucionales
El área del Deep Learning o aprendizaje profundo es un campo de la inteligencia artificial que se encarga de desarrollar sistemas capaces de realizar tareas imitando las habilidades humanas, utilizando aprendizaje supervisado y redes neuronales. Algunos ejemplos son reconocimiento de imágenes o reconocimiento de audio y voz. Esto con el objetivo de automatizar tareas repetitivas que requieren la inversión de esfuerzo y tiempo de personal humano, es un área que promete tener muchas aplicaciones y que está siendo revolucionaria en la industria tecnológica.
Para crear un sistema de este tipo es fundamental contar previamente con una gran cantidad de datos correctamente clasificados. Posteriormente, se procede a entrenar el modelo de forma supervisada, esto quiere decir que se define una función de coste o error para medir que tan erróneas o acertadas son las predicciones hechas por el modelo, en base a esto se actualizan los parámetros de la red con el objetivo de minimizar el error, es decir optimizar la función de coste, para ello se utiliza el algoritmo del descenso del gradiente. Al inicio del entrenamiento las predicciones del modelo suelen ser poco acertadas, es por ello que se entrena el modelo varias veces con el objetivo de ajustar los parámetros hasta llegar a una precisión acertada.
Dentro de las diversas arquitecturas existentes de redes neuronales, se encuentran las redes que utilizan operaciones de convolución, estas de forma simplificada, son filtros que se aplican sobre imágenes para detectar características de las mismas, como contornos de figuras y objetos, para reconocer imágenes y clasificarlas.
Detección de Rostros y Mascarillas con el Algoritmo YOLO
El algoritmo YOLO por sus siglas You Only Look Once sirve para detectar Bounding Boxes o cajas de ajuste para detectar objetos dentro de una imagen. Se entrena utilizando imágenes con las cajas delimitando a los objetos previamente clasificadas, posteriormente el modelo debe aprender a predecir nuevos objetos dentro de la imagen y su localización.
Como en toda aplicación de aprendizaje supervisado, una parte esencial es definir una función de coste para medir el error en las predicciones del modelo y de esta manera buscar optimizar el modelo para minimizar este error. En el caso del algoritmo YOLO mide este error por el porcentaje de intersección entre las cajas de ajuste por el modelo y las cajas de ajuste reales de las imágenes que se utilizan para el entrenamiento. De esta manera se puede medir que tan acertadamente se está prediciendo la detección de un objeto dentro de la imagen.
Debido a que los archivos de datos con imágenes de rostros y mascarillas no eran sumamente abundantes antes de la pandemia, se pueden utilizar técnicas como Transfer Learning y Fine Tuning que consisten en tomar redes neuronales pre-entrenadas en detección de imágenes en general, para posteriormente agregar capas y entrenarlas para detectar nuevos objetos, en este caso mascarillas; Otro punto importante que fue considerado fue el balanceo entre la cantidad de imágenes con rostros de personas con y sin mascarillas.
Medición de Temperatura con Computer Vision
La temperatura del cuerpo es uno de los signos vitales más importantes, al monitorearlo podemos determinar si el paciente tiene o no fiebre e incluso podríamos determinar el tratamiento a utilizar con esta condición. Debido a la crisis actual y tomando en cuenta que uno de los principales síntomas de COVID-19 es la fiebre, los sistemas de medición de temperatura se han transformado en un tema de investigación y la meta actual es medir la temperatura del cuerpo con exactitud.
Se propuso una solución utilizando inteligencia y una cámara térmica por miembros de la National Taiwan University of Science and Technology [1]. En esta solución se propone crear un modelo de aprendizaje automático que reciba como entrada imágenes captadas por una cámara térmica, las redes neuronales son capaces de detectar y localizar los rostros, por lo cual se necesitan miles de datos para entrenar el modelo. Al detectar el rostro de las personas y analizar los valores de la cámara térmica, esto con la ayuda de la red neuronal, es posible determinar la temperatura de las personas vistas a través de la cámara.
El uso de inteligencia artificial y más específicamente del deep learning está liderando una nueva revolución respecto a la forma en que se crea tecnología y resuelven problemas, en donde las máquinas cada vez toman más protagonismo y obtienen habilidades más complejas.
La automatización a lo largo de las últimas décadas se ha establecido en diferentes áreas y soluciona problemas que podrían ser complejos o riesgosos, como determinar síntomas o prevenir el contagio de COVID-19.
A mediano plazo los contenidos que se enseñan en las Facultades de Ciencias de la Computación de las universidades, deberán cambiar de diferentes formas para agregar a su contenido el uso de las tecnologías revolucionarias como machine learning, deep learning, etc. El uso de visión por computadora puede ser bastante útil para detectar si las personas están acatando el uso de medidas como portar mascarillas o detectar su temperatura corporal de forma automática, permitiendo dar servicio a un gran número de personas y sin la necesidad de tener muchas personas disponibles para brindar el servicio.
Referencias
[1] Jia-Wei Lin; Ming-Hung Lu; Yuan-Hsiang Lins, «National Taiwan University of Science and Technology», A Thermal Camera based Continuous Body Temperature Measurement System, 2019. [En línea]. Disponible en: https://bit.ly/2NPUSRZ. [Último acceso: 06 febrero 2021].
[2] Álex Escolá Nixon, «Towards Data Science», Face Mask Detection using YOLOv5, 09 noviembre 2020. [En línea]. Disponible en: https://bit.ly/3fdgoLZ. [Último acceso: 06 febrero 2021].
[3] Joseph Redmon; Santosh Divvala; Ross Girshick; Ali Farhadi, «University of Washington», You Only Look Once: Unified, Real-Time Object Detection, 2015. [En línea]. Disponible en: https://bit.ly/3rpSgYO. [Último acceso: 06 febrero 2021].