top of page

VISIÓN POR COMPUTADOR

La visión por computadora es un subdominio de la IA que imita el sistema visual humano. Los expertos se enfocan en crear software para ayudar a las computadoras a adquirir, procesar, analizar y comprender imágenes o videos digitales.

Esta es una de las últimas innovaciones en Inteligencia Artificial, donde las máquinas pueden analizar e interpretar imágenes y videos. El aprendizaje automático aprovecha las fortalezas de los humanos y las computadoras. Los seres humanos sobresalen en comunicación, compromiso, contexto y conocimiento general, así como en creatividad y empatía.

Las computadoras y los sistemas de software son ideales para tareas repetitivas, matemáticas, manipulación de datos y procesamiento paralelo, proporcionando la potencia y la velocidad para dominar soluciones complejas.

COMPUTER VISION
Amigo IQ Logo (38).png

¿Cómo funciona la visión artificial?


Hay tres componentes principales de la visión por computadora:

  1. Adquisición de una imagen

  2. Procesamiento de imágenes

  3. Análisis

Adquisición de una imagen: una cámara digital o un sensor captura la imagen o los datos y se almacenan como números binarios; unos y ceros. A esto se le llama datos brutos.

Procesamiento de imágenes:

 

Este proceso incluye los métodos utilizados para extraer los elementos geométricos básicos que pueden dar información sobre la imagen. El procesamiento de imágenes también incluye el paso de procesamiento previo. El preprocesamiento es necesario para obtener un análisis más preciso al eliminar elementos no deseados como el ruido.

Clasificación de imágenes:


La clasificación de imágenes tiene como objetivo clasificar el contenido de la imagen según su tipo. La técnica de aprendizaje profundo más utilizada son las redes neuronales convolucionales (CNN).

Las imágenes preetiquetadas crean un conjunto de datos de entrenamiento. Cada una de las clases en las que se incluirán las imágenes tiene propiedades independientes y estas propiedades están representadas por vectores. Estos vectores se entrenan con CNN y se realizan mejoras con nuevos conjuntos de datos. Si la calidad del clasificador no es suficiente, se pueden agregar más conjuntos de prueba o conjuntos de entrenamiento.

Detección de objetos:


La identificación de los objetos en una imagen tiene un principio de funcionamiento diferente al de la clasificación de imágenes. Para clasificar los objetos en la imagen, esos objetos deben determinarse en los cuadros delimitadores. Para clasificar los objetos en la imagen, esos objetos deben determinarse en los cuadros. Aunque estas cajas son de diferentes tamaños, pueden contener imágenes de la misma clase. Además, la detección de imágenes que contienen una gran cantidad de objetos también requiere una cantidad cada vez mayor de potencia informática. Se han desarrollado algoritmos como R-CNN, Fast R-CNN, YOLO, (SSD) y redes totalmente convolucionales basadas en regiones para encontrar rápidamente estas ocurrencias.

Seguimiento de objetos:


El rastreo de objetos es el método que rastrea el movimiento del objeto en una imagen al encontrar el mismo objeto en la siguiente imagen.

 

Las técnicas de seguimiento de objetos se pueden dividir en tres categorías según los métodos de observación:

 

Técnicas generativas: en esta técnica, el problema de seguimiento se formula como la búsqueda de las regiones de la imagen que son más similares al modelo de destino. El análisis de componentes principales (PCA), el análisis de componentes independientes (ICA), la factorización matricial no negativa (NMF) son ejemplos de modelos generativos que intentan encontrar una representación adecuada de los datos originales.

Técnicas discriminatorias: en los métodos discriminativos, el seguimiento se considera un problema de clasificación binaria, cuyo objetivo es encontrar un límite de decisión que separe mejor al objetivo del fondo.

 

A diferencia de los métodos generativos, tanto la información de fondo como la de destino se utilizan simultáneamente. Ejemplos de métodos discriminativos son los codificadores automáticos apilados (SAE), las redes neuronales convolucionales y las máquinas de vectores de soporte (SVM).

Técnicas híbridas: estas dos técnicas se utilizan de forma conjunta y se adaptan diferentes técnicas según el problema.

Segmentación de imagen:
El proceso de dividir una imagen digital en objetos de imagen o conjuntos de píxeles. El propósito de la segmentación de imágenes es simplificar la representación de una imagen y facilitar el análisis.

Amigo IQ Logo (2).png
bottom of page