Los avances continuos en la visión artificial permiten resolver problemas de distinta índole, como pueden ser la conducción autónoma, el reconocimiento biométrico, la detección de defectos industriales o la interacción entre humanos y robots.
Este libro es una readaptación y ampliación del libro de Visión Artificial mediante aprendizaje automático con Tensorflow y Pytorch, publicado anteriormente por los autores, y es una guía esencial para cualquier persona que desee comprender cómo las máquinas interpretan el mundo visual. De forma secuencial y con numerosos ejemplos prácticos, se desglosan los conceptos básicos, las tecnologías de procesamiento de imágenes más novedosas y las últimas tendencias de programación mediante aprendizaje automático.
En la primera parte del libro se realiza una introducción a la visión artificial y se presentan los componentes básicos de los sistemas de visión. En la segunda parte se muestran las últimas tendencias en procesamiento con Deep Learning a través ejemplos en Tensorflow y Pytorch, de manera que el lector sea capaz de implementar y utilizar, desde modelos sencillos, hasta otros más complejos como por ejemplo los modelos generativos mediante redes GAN o de difusión, entre otros.
El libro presenta numerosos modelos incluyendo VAEs, U-Nets, YOLO, Mask R-CNN, etc., los componentes básicos de los sistemas de visión.