Un algoritmo cuántico para la segmentación de un objetivo en movimiento en videos en escala de grises.
14 de octubre de 2023 característica
Este artículo ha sido revisado de acuerdo con el proceso editorial y las políticas de Science X. Los editores han destacado los siguientes atributos al tiempo que se asegura la credibilidad del contenido:
- verificación de hechos
- publicación revisada por pares
- fuente confiable
- corrección de pruebas
por Ingrid Fadelli, Tech Xplore
Los algoritmos de visión por computadora se han vuelto cada vez más avanzados en las últimas décadas, lo que ha permitido el desarrollo de tecnologías sofisticadas para monitorear entornos específicos, detectar objetos de interés en imágenes de video y descubrir actividades sospechosas en grabaciones de circuito cerrado de televisión (CCTV). Algunos de estos algoritmos están diseñados específicamente para detectar y aislar objetos en movimiento o personas de interés en un video, una tarea conocida como segmentación de objetivos en movimiento.
Aunque algunos algoritmos convencionales para la segmentación de objetivos en movimiento han obtenido resultados prometedores, la mayoría de ellos tienen un rendimiento deficiente en tiempo real (es decir, al analizar videos que no están pregrabados, sino que se están capturando en el momento presente). Algunos equipos de investigación han estado tratando de abordar este problema utilizando tipos alternativos de algoritmos, como los llamados algoritmos cuánticos.
Investigadores de la Universidad de Información Científica y Tecnología de Nanjing y la Universidad del Sureste en China desarrollaron recientemente un nuevo algoritmo cuántico para la segmentación de objetivos en movimiento en videos en escala de grises. Se descubrió que este algoritmo, publicado en Advanced Quantum Technologies, supera a los enfoques clásicos en tareas que implican el análisis de imágenes de video en tiempo real.
"Nuestro trabajo anterior se ha dedicado a los algoritmos de segmentación de imágenes cuánticas y hemos publicado varios artículos, pero todos se han centrado en objetivos estáticos", dijo Wenjie Liu, uno de los investigadores que llevaron a cabo el estudio, a Tech Xplore. "Nos preguntamos si podríamos segmentar aún más objetivos en movimiento y extender la aplicación de la imagen al video. Revisamos la investigación relacionada sobre el video cuántico y descubrimos que hay poca investigación en esta área".
El algoritmo desarrollado por Liu y sus colegas utiliza procesos mecánicos cuánticos para segmentar rápidamente objetivos en movimiento en videos en escala de grises. Esta persona u objeto segmentado luego puede reconocerse como un objetivo y monitorearse utilizando métodos computacionales adicionales.
"Primero, almacenamos el video en escala de grises clásico en qubits, dejamos que el cuadro y las posiciones de los píxeles estén en estado de superposición y dejamos que los valores de escala de grises de los píxeles estén entrelazados con ellos para obtener el video cuántico Vk", dijo Liu. "Luego, el video se desplaza circularmente para obtener otros dos nuevos videos, Vk-1 y Vk+1, en los que las posiciones de los cuadros se desplazan hacia adelante y hacia atrás en una unidad, respectivamente, en comparación con el video original. Estos tres videos comparten qubits posicionales. Luego, los dos videos recién obtenidos se someten a una operación de resta de valor absoluto con el video original, es decir, Bk-1=|Vk-Vk-1|, Bk+1=|Vk-Vk+1|. Luego, Bk-1 y Bk+1 se binarizan para obtener bk-1 y bk+1. bk-1 y bk+1 se suman para obtener el resultado final, y luego se realizan medidas para restaurar el video clásico".
Para permitir que su algoritmo discrimine entre umbrales y valores de escala de grises, Liu y sus colegas incorporaron un denominado comparador cuántico que requiere menos potencia computacional. Además, el equipo diseñó varias unidades de circuito cuántico utilizando menos bits y compuertas cuánticas.
"El circuito cuántico completo se ensambló en base a estas unidades", dijo Liu. "En comparación con su contraparte clásica, lograron una aceleración exponencial y la complejidad del algoritmo es también superior a los algoritmos cuánticos existentes. Las posiciones de los píxeles en una imagen se almacenan en bits cuánticos en estado de superposición, y luego los bits cuánticos de información del valor de gris se entrelazan con los bits cuánticos de información de posición para que una imagen o un video esté en estado de superposición. La operación computacional en un píxel en la imagen (o video) en estado de superposición es equivalente a la operación computacional en toda la imagen (o todo el video), de manera que la complejidad computacional puede reducirse de manera exponencial".
Liu y sus colegas evaluaron su algoritmo en una serie de pruebas, comparando su rendimiento con el de un algoritmo clásico para la segmentación de objetivos en movimiento. Se descubrió que su algoritmo era significativamente más rápido que los modelos clásicos, al tiempo que mantenía la misma precisión.
'The complexity of the algorithm is exponentially decreased compared to its classical counterpart,' Liu said. 'In addition, we designed a quantum comparator with fewer quantum gates and qubits, which can be used in any task that requires comparison of values and can effectively reduce the complexity of the algorithm.'
In the future, the algorithm created by this team of researchers could be developed further and tested on more real-world footage. Concurrently, this work could inspire the development of new highly performing quantum algorithms for other advanced computer vision applications.
'Currently, our research focuses on how to process images more simply in the spatial domain with quantum circuits, and the effect can be further improved,' Liu added. 'In the future, to get better processing results, we will expand our research to processing images with quantum neural networks. In addition, the existing quantum technology cannot realize the use of large-scale qubits in the short term, so the hybrid classical-quantum neural network is also a better choice.'
© 2023 Science X Network