Comment la lumière structurée et l'IA façonnent l'avenir de la communication
La technologie de lumière structurée, améliorée par les dimensions spatiales et l'intelligence artificielle, renforce la transmission et la détection d'informations. Les chercheurs ont réalisé des avancées significatives dans le codage et la transmission de données, en utilisant une conversion spatiale non linéaire pour maintenir des taux d'erreurs faibles et une grande précision dans des conditions difficiles. Crédit : Zilong Zhang, Wei He, Suyi Zhao, Yuan Gao, Xin Wang, Xiaotian Li, Yuqi Wang, Yunfei Ma, Yetong Hu, Yijie Shen, Changming Zhao
La lumière structurée améliore la transmission d'informations en combinant le traitement d'images avancé avec l'apprentissage automatique, réalisant une capacité et une précision élevées dans des expériences innovantes.
La lumière structurée a le potentiel d'augmenter considérablement la capacité d'informations en intégrant des dimensions spatiales avec de multiples degrés de liberté. Récemment, la fusion de modèles de lumière structurée avec le traitement d'images et l'intelligence artificielle a démontré un fort potentiel pour progresser dans des domaines tels que la communication et la détection.
Une des caractéristiques les plus notables du champ de la lumière structurée est la distribution en deux et trois dimensions de ses informations d'amplitude. Cette caractéristique peut s'intégrer efficacement à une technologie de traitement d'images mature et peut également réaliser une transmission d'informations transmédiatique grâce à la technologie d'apprentissage automatique qui provoque actuellement des changements profonds. Les champs de lumière structurée complexes basés sur des états de superposition cohérente peuvent transporter des informations d'amplitude spatiale abondantes. En combinant davantage la conversion spatiale non linéaire, des augmentations significatives de la capacité d'informations peuvent être réalisées.
La lumière structurée complexe issue de la conversion non linéaire a une capacité d'informations plus élevée. Crédit : Zilong Zhang, Wei He, Suyi Zhao, Yuan Gao, Xin Wang, Xiaotian Li, Yuqi Wang, Yunfei Ma, Yetong Hu, Yijie Shen, Changming Zhao
Zilong Zhang de l'Institut de Technologie de Beijing et Yijie Shen de l'Université Technologique de Nanyang, ainsi que les membres de leurs équipes, ont proposé une nouvelle méthode pour augmenter la capacité d'informations basée sur des états de superposition cohérente et leur conversion non linéaire spatiale. En intégrant les technologies de vision par ordinateur et d'apprentissage profond, ils ont réalisé une transmission d'informations point-à-multipoint à grand angle avec un faible taux d'erreurs en bits.
Dans ce modèle, des faisceaux gaussiens sont utilisés pour obtenir une conversion non linéaire spatiale de la lumière structurée à travers un modulateur de lumière spatiale. Des réseaux neuronaux convolutifs sont utilisés pour identifier la distribution d'intensité des faisceaux. En comparant le mode de superposition de base et le mode de conversion non linéaire spatiale, on observe qu'avec l'augmentation de l'ordre des modes propres constitutifs du mode de base, la capacité de codage du mode de superposition HG est nettement meilleure que le mode LG, et la capacité de codage de mode après la conversion non linéaire structurée spatiale peut être améliorée de manière significative.
Pour vérifier les performances d'encodage et de décodage basées sur le modèle ci-dessus, une image en couleur de 50×50 pixels a été transmise, comme le montre la Fig.1. Les dimensions RVB de l'image ont été divisées en 5 niveaux de chromaticité, comprenant un total de 125 types d'informations de chromaticité, chacune codée par 125 états de superposition cohérente de HG. De plus, différents degrés de fluctuation de phase causés par la turbulence atmosphérique ont été chargés sur ces 125 modes à travers un modulateur de lumière spatiale DMD et entraînés avec la technologie d'apprentissage profond pour former un ensemble de données.
En utilisant la conversion non linéaire, l'analyse des effets de décodage à plus forte capacité a été mise en œuvre, dans laquelle 530 modes de CNC ont été sélectionnés pour la mesure expérimentale de la matrice de confusion à ces modes par des réseaux neuronaux convolutifs, comme le montre la Fig.2. Les résultats expérimentaux indiquent que en raison de caractéristiques structurales plus distinctes, les modes de CNC peuvent toujours garantir des taux d'erreurs en bits similaires tout en augmentant de manière significative la capacité de données, avec une précision de reconnaissance des données allant jusqu'à 99,5%. De plus, l'expérience a également vérifié la capacité de reconnaissance de modèles de vision par ordinateur dans des conditions de réflexion diffuse, atteignant un décodage haute précision simultané par plusieurs caméras réceptrices avec des angles d'observation allant jusqu'à 70°.
Référence : "Conversion non linéaire spatiale de la lumière structurée pour les réseaux d'informations ultra-précis basés sur l'apprentissage automatique (Laser Photonics Rev. 18(6)/2024)" par Zilong Zhang, Wei He, Suyi Zhao, Yuan Gao, Xin Wang, Xiaotian Li, Yuqi Wang, Yunfei Ma, Yetong Hu, Yijie Shen et Changming Zhao, 9 juin 2024, Revue Laser & Photonics. DOI : 10.1002/lpor.202470039
Financement : Fondation Nationale des Sciences Naturelles de Chine, Université Technologique de Nanyang et Ministère de l'Éducation de Singapour (MOE) subvention AcRF Tier 1