Un algorithme quantique pour la segmentation d'une cible en mouvement dans des vidéos en niveaux de gris.
14 octobre 2023 fonctionnalité
Cet article a été examiné selon la procédure éditoriale de Science X et ses politiques. Les éditeurs ont souligné les attributs suivants tout en assurant la crédibilité du contenu:
- vérifiés par des faits
- publication évaluée par des pairs
- source fiable
- corrigé
par Ingrid Fadelli , Tech Xplore
Les algorithmes de vision par ordinateur sont devenus de plus en plus avancés au cours des dernières décennies, permettant le développement de technologies sophistiquées pour surveiller des environnements spécifiques, détecter des objets d'intérêt dans des vidéos et repérer des activités suspectes dans des enregistrements de vidéosurveillance. Certains de ces algorithmes sont spécifiquement conçus pour détecter et isoler des objets en mouvement ou des personnes d'intérêt dans une vidéo, une tâche appelée segmentation de cible mobile.
Alors que certains algorithmes conventionnels de segmentation de cible mobile ont obtenu des résultats prometteurs, la plupart d'entre eux fonctionnent mal en temps réel (c'est-à-dire lors de l'analyse de vidéos qui ne sont pas préenregistrées mais sont capturées à l'instant présent). Certaines équipes de recherche tentent donc de résoudre ce problème en utilisant des types d'algorithmes alternatifs, tels que les algorithmes quantiques.
Des chercheurs de l'Université des sciences de l'information et de la technologie de Nanjing et de l'Université du Sud-Est en Chine ont récemment développé un nouvel algorithme quantique pour la segmentation des cibles mobiles dans des vidéos en niveaux de gris. Cet algorithme, publié dans Advanced Quantum Technologies, a été trouvé pour surpasser les approches classiques dans des tâches qui impliquent l'analyse de vidéos en temps réel.
'Notre travail précédent a été consacré à des algorithmes de segmentation d'images quantiques et nous avons publié plusieurs articles, mais tous concernent des cibles statiques', a déclaré Wenjie Liu, l'un des chercheurs ayant réalisé l'étude, à Tech Xplore. 'Nous nous demandions si nous pouvions segmenter davantage de cibles mobiles et étendre l'application de l'image à la vidéo. Nous avons vérifié les recherches connexes sur la vidéo quantique et constaté que la recherche dans ce domaine est rare.'
L'algorithme développé par Liu et ses collègues utilise des processus de mécanique quantique pour segmenter rapidement des cibles mobiles dans des vidéos en niveaux de gris. Cette personne ou cet objet segmenté peut ensuite être reconnu comme une cible et surveillé à l'aide de méthodes de calcul supplémentaires.
'D'abord, nous stockons la vidéo en niveaux de gris classique dans quelques qubits, nous mettons les trames et les positions des pixels dans un état de superposition, et nous entrelaçons les valeurs en niveaux de gris des pixels avec eux pour obtenir la vidéo quantique Vk', a déclaré Liu. 'Ensuite, la vidéo est décalée circulairement pour obtenir deux autres nouvelles vidéos, Vk-1 et Vk+1, dans lesquelles les positions des trames sont décalées d'une unité vers l'avant et vers l'arrière par rapport à la vidéo originale. Ces trois vidéos partagent des qubits de position. Les deux vidéos nouvellement obtenues sont ensuite autorisées à effectuer une opération de soustraction de valeur absolue avec la vidéo originale, c'est-à-dire Bk-1=|Vk-Vk-1|, Bk+1=|Vk-Vk+1|. Ensuite, Bk-1 et Bk+1 sont binarisés pour obtenir bk-1 et bk+1. bk-1 et bk+1 sont additionnés pour obtenir le résultat final, puis des mesures sont effectuées pour revenir à la vidéo classique.'
Pour permettre à leur algorithme de faire la distinction entre le seuil et les valeurs en niveaux de gris, Liu et ses collègues ont incorporé un comparateur quantique qui nécessite moins de puissance de calcul. De plus, l'équipe a conçu diverses unités de circuit quantique utilisant moins de bits quantiques et de portes quantiques.
'Le circuit quantique complet a été assemblé sur la base de ces unités', a déclaré Liu. 'Par rapport à son équivalent classique, nous avons obtenu une accélération exponentielle, et la complexité de l'algorithme est également supérieure aux algorithmes quantiques existants. Les positions des pixels dans une image sont stockées dans des bits quantiques dans l'état de superposition, puis les bits quantiques d'informations sur les niveaux de gris sont entrelacés avec les bits quantiques d'information de position de sorte qu'une image ou une vidéo soit dans l'état de superposition. L'opération de calcul sur un pixel de l'image (ou de la vidéo) dans l'état de superposition est équivalente à l'opération de calcul sur l'ensemble de l'image (ou de la vidéo), de sorte que la complexité de calcul peut être réduite de manière exponentielle.'
Liu et ses collègues ont évalué leur algorithme lors d'une série de tests, comparant ses performances à celles d'un algorithme classique de segmentation de cibles mobiles. Leur algorithme s'est avéré beaucoup plus rapide que les modèles classiques, tout en conservant la même précision.
'The complexity of the algorithm is exponentially decreased compared to its classical counterpart,' Liu said. 'In addition, we designed a quantum comparator with fewer quantum gates and qubits, which can be used in any task that requires comparison of values and can effectively reduce the complexity of the algorithm.'
In the future, the algorithm created by this team of researchers could be developed further and tested on more real-world footage. Concurrently, this work could inspire the development of new highly performing quantum algorithms for other advanced computer vision applications.
'Currently, our research focuses on how to process images more simply in the spatial domain with quantum circuits, and the effect can be further improved,' Liu added. 'In the future, to get better processing results, we will expand our research to processing images with quantum neural networks. In addition, the existing quantum technology cannot realize the use of large-scale qubits in the short term, so the hybrid classical-quantum neural network is also a better choice.'
© 2023 Science X Network