Proyecto WeedDL – Un poco de teoría

Después de presentar nuestro proyecto, en esta segunda entrada queremos dar a conocer una serie de conceptos previos necesarios para facilitar el entendimiento de la parte práctica. Estos conceptos son los siguientes:

  • Agricultura de precisión (AP): La agricultura de precisión se puede definir como el conjunto de actividades que permite la toma de decisiones económicas y ambientales a partir de la recolección y el manejo de información obtenida [1]. Este tipo de agricultura requiere de un conjunto de tecnologías, como pueden ser Sistemas de Posicionamiento Global (GPS), sensores o imágenes, entre otros, que permiten estimar, evaluar y entender las decisiones tomadas. La agricultura de precisión suele estar formado por tres etapas diferentes, en las cuales se realiza la recolección de datos, el procesamiento e interpretación de la información obtenida y la aplicación de los insumos [2].
  • Inteligencia Artificial (IA): Durante los últimos años, la Inteligencia Artificial se ha definido como una herramienta capaz de resolver tareas que, aunque intelectualmente son difíciles para los seres humanos, pueden ser descritas formalmente por una serie de reglas matemáticas. Un ejemplo puede ser la victoria lograda por el sistema Deep Blue de IMB sobre el campeón de ajedrez Garry Kasparov en 1997 [3].
    En la actualidad, uno de los retos que la Inteligencia Artificial trata es la resolución de tareas que son aparentemente muy fáciles de realizar por el ser humano, pero son difíciles de describir formalmente. Son tareas que se resuelven intuitivamente, que parecen automáticas, como puede ser el reconocimiento del habla o el reconocimiento de un determinado objeto dentro de una imagen.
  • Redes neuronales: Las redes neuronales artificiales se basan en el funcionamiento de las redes neuronales biológicas, intentando simular el cerebro humano [4]. Durante las últimas décadas los modelos neuronales más utilizados fueron los perceptrones con una única capa oculta con aprendizaje “Back propagation” [5]. Este tipo de redes son aproximadores universales en el sentido de que pueden implementar cualquier problema entrada-salida suponiendo que el número de neuronas en la capa oculta es suficientemente grande. Por otro lado, para resolver los problemas de forma más eficiente la red neuronal venía precedida de una etapa de extracción de características diseñada por el usuario. Por ejemplo, en el caso de visión artificial son muchos los extractores de características como análisis en componentes principales (PCA), filtros de HOG, HAAR, matrices de coocurrencia de niveles de grises, etc. En definitiva, se trata de encontrar un vector de características de dimensión generalmente mucho más pequeña y con mejores propiedades que si usáramos simplemente los valores de los píxeles de la imagen.
  • Deep Learning: El Deep Learning es el último avance dentro del Machine Learning y está aportando resultados sorprendentes en el campo del procesamiento de imágenes, procesamiento del lenguaje natural, etc. Estos tipos de algoritmos destacan por no requerir la utilización de la etapa de preprocesamiento diseñada a priori por el usuario, sino que el propio sistema es capaz de aprender por si mismo a realizar la extracción de características como parte de la fase entrenamiento. Para ello, estas redes generalmente están formadas por una red convolutiva con sucesivas etapas de convolución y pooling seguida generalmente de un perceptrón multicapa. [6]. La red convolutiva es la que se especializa en la extracción de características entregando el vector de características extraído del patrón de entrada al perceptrón multicapa al que va conectada.
  • Detección de objetos: A diferencia de la clasificación de imágenes en la detección de objetos no basta con asignar una imagen a una determinada categoría, sino que se trata de encontrar los posibles objetos y la ubicación de los mismos que existan dentro de la imagen. Tradicionalmente este proceso se resolvía mediante el algoritmo de ventana deslizante, es decir, se trata de aplicar una red neuronal entrenada para clasificar imágenes de manera sucesiva en distintas posiciones de la imagen [7]. Este proceso es poco eficiente computacionalmente debido a que hay que ejecutar la red neuronal miles de veces por imagen. Los últimos avances del Deep Learning han ofrecido algoritmos muy eficientes para detección de objetos que solo requieren que la imagen completa pase una vez por la red neuronal disminuyendo a valores por debajo del segundo el procesamiento de una imagen completa. Ejemplo de estos algoritmos son R-CNN, Fast R-CNN, Faster R-CNN, SSD y YOLO, entre otros.

En nuestro proyecto se utilizan técnicas de reconocimiento de imágenes basadas en aprendizaje automático, concretamente Deep Learning y computación de altas prestaciones, para desarrollar un sistema de detección automática de malezas en tiempo real. En cuanto a los algoritmos de detección de objetos probaremos algunos de los más actuales y que mejores rendimientos están dando en cuanto a precisión y tiempos de ejecución.

Referencias:

[1] Bragachini, M., Martellotto, E., Bianchini, A. & Bongiovanni R. (1998). Nuevas herramientas para el ajuste del diagnóstico agrónomico y aplicación precisa de insumos. INTA. Disponible en http://www.agriculturadeprecision.org/

[2] Bongiovanni, R., Chartuni Mantovani, E., Best, S. & Roel, A. (2006). Agricultura de precisión: integrando conocimientos para una agricultura moderna y sustentable. Montevideo, Uruguay. PROCISUR/IICA.

[3] Hsu, F.-H. (2002). Behind Deep Blue: Building the Computer that Defeated the World Chess Champion. NJ, USA. Princenton University Press.

[4] Khepri, W (2018). Redes Neuronales, ¿qué son? Disponible en https://medium.com/@williamkhepri/redes-neuronales-que-son-a64d022298e0

[5] Haykin, S. (2009). Neural Networks and Learning Machines (3a Ed.). NJ, USA. Prentice-Hall.

[6] SmartPanel. ¿Qué es el Deep Learning? Disponible en https://www.smartpanel.com/que-es-deep-learning/

[7] Vázquez Rull, M. (2016). Reconocimiento de Objetos usando Deep Learning. Trabajo Fin de Grado, Grado en Ingeniería de Tecnologías Industriales, Universidad de Sevilla. Disponible en    http://bibing.us.es/proyectos/abreproy/91070/fichero/Marina+Vazquez+Rull+Reconocimiento+de+Objetos+usando+Deep+Learning+TFG.pdf

No hay comentarios aún... ¡Se el primero en dejar una respuesta!