Accueil > L’intelligence artificielle > Les mots-clés de l’IA > Les réseaux de neurones à convolution (CNN)

Les réseaux de neurones à convolution (CNN)

vendredi 16 février 2024, par Formation IA

Principalement utilisés dans le traitement d’images, les CNN trouvent également des applications dans la reconnaissance vocale, la vidéo et d’autres types de données séquentielles. Cet article vise à expliquer de manière claire et accessible ce que sont les CNN et comment ils fonctionnent.

Qu’est-ce qu’un Réseau de Neurones à Convolution (CNN) ?

Un CNN est un type de réseau de neurones artificiels inspiré par le processus biologique de vision chez les humains et les animaux. Il est spécialement conçu pour reconnaître des patterns spatiaux dans les données, ce qui le rend particulièrement adapté au traitement d’images et de vidéos où la reconnaissance des formes, des textures et des objets est cruciale.

Composants Principaux des CNN

Les CNN se composent de plusieurs types de couches qui travaillent de concert pour extraire et hiérarchiser les caractéristiques des données d’entrée :

Couches de Convolution
Les couches de convolution utilisent un ensemble de filtres (ou noyaux) qui balayent l’ensemble de l’image d’entrée pour détecter des motifs spécifiques, tels que les bords, les textures ou d’autres caractéristiques. Chaque filtre produit une carte d’activation (ou carte de caractéristiques) qui met en évidence les régions de l’image où ces motifs sont trouvés.

Couches d’Activation
Après chaque couche de convolution, une fonction d’activation, typiquement la fonction ReLU (Rectified Linear Unit), est appliquée pour introduire de la non-linéarité dans le modèle, permettant au réseau d’apprendre des motifs complexes.

Couches de Pooling
Les couches de pooling réduisent la dimensionnalité des cartes de caractéristiques en combinant l’output des neurones dans une région donnée en un seul output. Cela aide à réduire le nombre de paramètres à apprendre et améliore la robustesse du modèle face aux variations mineures dans l’image d’entrée.

Couches Complètement Connectées
Après plusieurs cycles de convolution et de pooling, le réseau inclut une ou plusieurs couches complètement connectées, où tous les neurones d’une couche sont connectés à tous les neurones de la couche suivante. Ces couches servent à classer les images en fonction des caractéristiques extraites par les couches précédentes.

Fonctionnement des CNN

Extraction de Caractéristiques : À travers les couches de convolution et de pooling, le CNN apprend à identifier automatiquement les caractéristiques importantes des images d’entrée, de la détection des bords simples dans les premières couches à la reconnaissance des formes et objets complexes dans les couches plus profondes.

Classification : Dans les couches finales, le réseau utilise les caractéristiques extraites pour classifier les images selon les catégories apprises pendant l’entraînement.

Applications des CNN

Les CNN sont largement utilisés dans de nombreuses applications de vision par ordinateur, y compris :

Reconnaissance d’images : Identifier les objets dans les images.
Reconnaissance faciale : Identifier et vérifier les visages dans les images ou vidéos.
Classification de vidéos : Comprendre le contenu des vidéos et catégoriser les scènes.
Détection d’objets : Localiser et identifier plusieurs objets dans une image.
Segmentation sémantique : Classer chaque pixel d’une image dans une catégorie spécifique.

Les CNN ont transformé le champ de la vision par ordinateur, offrant des performances sans précédent dans la reconnaissance et la classification d’images. Leur architecture unique, capable d’extraire et de hiérarchiser les caractéristiques spatiales des données, les rend particulièrement efficaces pour comprendre le monde visuel.


À mesure que la technologie progresse, les applications des CNN continuent de s’étendre, ouvrant de nouvelles voies dans la recherche et l’industrie.