marzo 22, 2021 10:00 am

Jesús

Si has revisado mis redes sociales últimamente, te habrás dado cuenta de que escribí un libro.

¡Sí! ¡Un libro!

¿Sobre qué? Pues de computer vision, claramente. Específicamente acerca de computer vision con TensorFlow 2, la versión más reciente de este fabuloso framework.

Por los momentos el libro se encuentra únicamente en inglés, aunque ya estoy en negociaciones con Packt, la editorial, para traducirlo al castellano.

Si te gustaría adquirirlo, ¡haz clic acá!
TensorFlow 2.0 Computer Vision Cookbook

Es hermoso, ¿no crees? ?

Acerca de TensorFlow 2.0 Computer Vision  Cookbook

La visión computarizada es un campo científico que le permite a las máquinas identificar y procesar tanto imágenes como videos digitales. Este libro se enfoca en recetas independientes para ayudarte a llevar a cabo varias tareas de computer vision usando TensorFlow.

Este libro comienza con un tour de los aspectos más básicos y fundamentales de deep learning para computer vision; también cubre las características clave de TensorFlow 2.x, tales como el API de alto nivel Keras, y tf.data.Dataset. Aprenderás todo lo necesario sobre tareas de computer vision, como la clasificación de imágenes, transfer learning, mejoramiento y estilizado de imágenes, y detección de objetos. El libro también cubre la aplicación de autoencoders a dominios como motores de búsqueda y eliminación de ruido en imágenes, mientras que ofrece información acerca de las múltiples arquitecturas utilizadas en las recetas. Entre estas arquitecturas tenemos a las redes neuronales convolucionales (CNNs), CNNs basadas en regiones (R-CNNs), VGGNet y YOLO (You Only Look Once).

Al final de este volumen sobre TensorFlow, podrás atacar con total confianza un amplio espectro de problemas de computer vision armado con TensorFlow 2.x.

Tabla de Contenidos de TensorFlow 2.0 Computer Vision Cookbook

Chapter 1: Getting Started with TensorFlow 2.x for Computer Vision

  1. Working with the basic building blocks of the Keras API
  2. Loading images using the Keras API
  3. Loading images using the tf.data.Dataset API
  4. Saving and loading a model
  5. Visualizing a model's architecture
  6. Creating a basic image classifier

Chapter 2: Performing Image Classification

  1. Creating a binary classifier to detect smiles
  2. Creating a multi-class classifier to play rock-paper-scissors
  3. Creating a multi-label classifier to label watches
  4. Implementing ResNet from scratch
  5. Classifying images with a pre-trained network using the Keras API
  6. Classifying images with a pre-trained network using TensorFlow Hub
  7. Using data augmentation to improve performance with the Keras API
  8. Using data augmentation to improve performance with the tf.data and tf.image APIs

Chapter 3: Harnessing the Power of Pre-Trained Networks with Transfer Learning

  1. Implementing a feature extractor using a pre-trained network
  2. Training a simple classifier on extracted features
  3. Spot-checking extractors and classifiers
  4. Using incremental learning to train a classifier
  5. Fine-tuning a network using the Keras API
  6. Fine-tuning a network using TFHub

Chapter 4: Enhancing and Styling Images with DeepDream, Neural Style Transfer, and Image Super-Resolution

  1. Implementing DeepDream
  2. Generating your own dreamy images
  3. Implementing Neural Style Transfer
  4. Applying style transfer to custom images
  5. Applying style transfer with TFHub
  6. Improving image resolution with deep learning

Chapter 5: Reducing Noise with Autoencoders

  1. Creating a simple fully connected autoencoder
  2. Creating a convolutional autoencoder
  3. Denoising images with autoencoders
  4. Spotting outliers using autoencoders
  5. Creating an inverse search image index with deep learning
  6. Implementing a variational autoencoder

Chapter 6: Generative Models and Adversarial Attacks

  1. Implementing a deep convolutional GAN
  2. Using a DCGAN for semi-supervised learning
  3. Translating images with Pix2Pix
  4. Translating unpaired images with CycleGAN
  5. Implementing an adversarial attack using the Fast Gradient Signed Method

Chapter 7: Captioning Images with CNNs and RNNs

  1. Implementing a reusable image caption feature extractor
  2. Implementing an image captioning network
  3. Generating captions for your own photos
  4. Implementing an image captioning network on COCO with attention

Chapter 8: Fine-Grained Understanding of Images through Segmentation

  1. Creating a fully convolutional network for image segmentation
  2. Implementing a U-Net from scratch
  3. Implementing a U-Net with transfer learning
  4. Segmenting images using Mask-RCNN and TensorFlow Hub

Chapter 9: Localizing Elements in Images with Object Detection

  1. Creating an object detector with image pyramids and sliding windows
  2. Detecting objects with YOLOv3
  3. Training your own object detector with TensorFlow's Object Detection API
  4. Detecting objects using TFHub

Chapter 10: Applying the Power of Deep Learning to Videos

  1. Detecting emotions in real time
  2. Recognizing actions with TensorFlow Hub
  3. Generating the middle frames of a video with TensorFlow Hub
  4. Performing text-to-video retrieval with TensorFlow Hub

Chapter 11: Streamlining Network Implementation with AutoML

  1. Creating a simple image classifier with AutoKeras
  2. Creating a simple image regressor with AutoKeras
  3. Exporting and importing a model in AutoKeras
  4. Controlling architecture generation with AutoKeras' AutoModel
  5. Predicting age and gender with AutoKeras

Chapter 12: Boosting Performance

  1. Using convolutional neural network ensembles to improve accuracy
  2. Using test time augmentation to improve accuracy
  3. Using rank-N accuracy to evaluate performance
  4. Using label smoothing to increase performance
  5. Checkpointing model
  6. Customizing the training process using tf.GradientTape

¡Espero que hayas disfrutado este pequeño vistazo al contenido de mi libro!

Nuevamente, si te interesa adquirirlo, haz clic acá. Cuando tenga noticias de la traducción al castellano, te lo haré saber ?.

¡Adiós!

Sobre el Autor

Jesús Martínez es el creador de DataSmarts, un lugar para los apasionados por computer vision y machine learning. Cuando no se encuentra bloggeando, jugando con algún algoritmo o trabajando en un proyecto (muy) cool, disfruta escuchar a The Beatles, leer o viajar por carretera.