L’intelligence artificielle, comment ça marche ?

L’intelligence artificielle, comment ça marche ?

L'intelligence artificielle peut provoquer inquiétude et interrogations quant à son pouvoir sur nos vies et nos libertés. Elle suscite également beaucoup de questions chez les experts du domaine, et aussi d'un point de vue politique, avec la volonté de l’Union européenne de légiférer et d’encadrer son utilisation. Pour mieux appréhender l’IA, mieux vaut savoir comment elle fonctionne…

Geoffrey Hinton, prix Turing d'informatique (l’équivalent du prix Nobel dans le domaine), connu comme étant l’un des "pères fondateurs" de l'IA a un jour posé cette question : « Supposons que vous avez un cancer qui doit être opéré et, à choisir entre un "chirurgien artificiel", une "boîte noire" qui ne peut pas expliquer comment elle fonctionne, mais qui a 90 % de taux de réussite, et un humain qui a 80 % de taux de réussite, voulez-vous que le "chirurgien artificiel" soit illégal ? »

C’était évidemment volontairement provocateur, mais cela illustre bien la conception actuelle associée à l'IA. Les deux possibilités sont présentées comme étant en opposition, perdant de vue le point crucial de l'intelligence artificielle : les humains et l'IA ne le sont pas. L'IA est un outil à la disposition de l’humain. Et les humains et les ordinateurs ont des capacités complémentaires : l'humain est doué pour généraliser ses connaissances, tandis que l'IA est douée pour répéter. Nous allons voir pourquoi en présentant le fonctionnement de l'IA.



Figure 1 – Les humains sont meilleurs pour résoudre des problèmes divers et complexes. Les machines sont très performantes pour les problèmes répétitifs et peu complexes.

Source : [1]

Un court décryptage de l'IA

 

Il est important de comprendre la terminologie associée à l'intelligence artificielle et aussi de comprendre pourquoi l'IA connaît un tel essor actuellement. Intelligence artificielle est un terme générique qui désigne la discipline, tandis que les techniques employées sont par exemple l'apprentissage automatique (Machine Learning) et l'apprentissage profond (Deep Learning). Afin de comprendre le fonctionnement des algorithmes d'apprentissage, mettons en parallèle ce concept avec l'informatique classique.

L'informatique classique suit schématiquement l'approche suivante : le but est d'énumérer toutes les possibilités dans un algorithme permettant ainsi de résoudre le problème. Concernant le Machine Learning, cela consiste à faire comprendre à un algorithme "simple" comment résoudre un problème complexe (pour lequel il est impossible d'énumérer toutes les possibilités) grâce à des données tirées de ce problème.

Enfin, le Deep Learning consiste à faire comprendre à un algorithme (un peu moins) "simple", appelé réseaux de neurones, comment résoudre un problème (encore plus) complexe, grâce à (encore plus) de données tirées de ce problème. Le Deep Learning est un type d'algorithme du Machine Learning.


Figure 2 – Un historique de l’intelligence artificielle, illustrant aussi les imbrications entre techniques.

Source : [2]


De quoi parle-t-on lorsque l’on évoque l'IA?

 

Eh bien, on parle majoritairement de Deep Learning ces dernières années. C’est un concept relativement vieux qui a connu une grande période de disette entre les années 1980 et 2010. Cependant ces techniques connaissent actuellement un essor grâce au Big Data et aux capacités de calculs qui se sont beaucoup développées. Ainsi, ces algorithmes très gourmands peuvent maintenant être suffisamment "nourris" en données pour être efficaces, ce qui n'était pas le cas dans le passé. Les avancées en capacité de calculs permettent de faire des entraînements dans un temps raisonnable.

Mais qu'est-ce que le Deep Learning ? C'est une catégorie d'algorithme inspirée du fonctionnement du cerveau. C'est un réseau composé de ce que l’on nomme neurones par analogie, qui sont interconnectés et qui servent à réaliser des opérations mathématiques. Ainsi, les algorithmes de Deep Learning peuvent être visualisés comme des couches de neurones successives, chaque couche utilisant les résultats des calculs des couches précédentes pour effectuer de nouveaux calculs.

Figure 3 – Le fonctionnement d’un réseau de neurones

Source : [3]

Le Deep Learning a un succès particulier pour différentes raisons : ces techniques permettent de produire tout type de données (image, texte, son, nombre…) contrairement au Machine Learning. Ces algorithmes peuvent donc calculer et résoudre des problèmes plus complexes. Enfin, le travail préalable de mise en forme et d'analyse des données est en général moins complexe avec les algorithmes de Deep Learning.


Une histoire d’apprentissage

 

Vous l'avez maintenant compris, pour que les algorithmes d'apprentissage puissent apprendre, il est nécessaire de leur fournir des données pour leur entraînement. Cela est valable pour tout type d'algorithme d'apprentissage, que ce soit du Machine Learning ou du Deep Learning.

Figure 4 – Un processus classique de Deep Learning. Un modèle, l’algorithme de Deep Learning, va recevoir en entrée des données d’entraînement. Une fois le modèle entraîné obtenu, il est appliqué à des données inconnues pour le tester puis dans l’environnement dans lequel il sera utilisé.

Source :  [4]

Plusieurs types d'entraînements existent, et les deux plus communs sont l'apprentissage supervisé et l'apprentissage non supervisé. Le premier consiste à fournir des données labellisées au modèle pour qu'il comprenne les caractéristiques associées à chacun de ces labels. Supposons que nous travaillons à créer un modèle de classification d'images d'animaux. Pour entraîner le modèle, un grand nombre d'images d'animaux sera donné au modèle avec un label associé correspondant à l'animal qui est présent sur l'image. L'algorithme comprendra alors, grâce à son entraînement, quelles sont les caractéristiques propres aux images de chaque race d'animal.

Concernant l'apprentissage non-supervisé, nous allons cette fois-ci fournir un grand nombre de données au modèle, sans pour autant lui spécifier de label. Ainsi, il va devoir comprendre seul comment distinguer les catégories, mais aussi définir lui-même quelles sont ces catégories. Il est tout de même notable que pour chacune de ces techniques, nous n'expliquons jamais aux algorithmes les caractéristiques des éléments qu'ils doivent analyser. C'est là tout l'intérêt : il comprendra seul quelles seront ces caractéristiques.

Figure 5 – Illustration des différents types d’apprentissage. A gauche, l’apprentissage supervisé illustré par la classification. Ce procédé consiste à associer une classe ou label à une donnée en entrée. Le processus non supervisé, ici étant un algorithme de clustering, c’est-à-dire de partitionnement de données, consiste à regrouper les données similaires dans des groupes. Ces groupes, contrairement au processus de classification, ne sont pas spécifiés dans les données d’entraînement.

Source : [5]

Le fonctionnement pratique

 

Maintenant que nous avons compris le principe de l'entraînement, examinons ce qui se passe d'un point de vu mathématique. Afin que le problème puisse être résolu par un algorithme d'apprentissage automatique, deux grandes hypothèses doivent être vérifiées. Hypothèse 1, le problème suit une fonction mathématique (ou plutôt distribution) inconnue, que le modèle doit approximer. Cette hypothèse sert principalement à s’assurer du fait que le processus que nous cherchons à modéliser n’est pas complètement aléatoire.


Figure 6 – Simplification du fonctionnement d’un algorithme d’apprentissage entraîné. En bleu, la fonction inconnue qu’il faut approximer. En orange, la fonction que l’algorithme aura réussi à apprendre à l’aide des données d’entraînement.


Hypothèse 2, les données d'entraînement décrivent correctement la "fonction inconnue". Cette deuxième hypothèse est particulièrement importante. En effet, un algorithme d'apprentissage, aussi performant soit-il, est totalement dépendant des données qui lui seront fournies en entrée. Si nous entraînons un algorithme de classification d'images d'animaux, l'algorithme entraîné sera probablement performant pour les catégories d'animaux qu'il a déjà vu. Cependant, il aura d'infinies difficultés à généraliser les caractéristiques d'un animal à une espèce animale qu'il n'a jamais vu. De même, il sera extrêmement dépendant de la représentativité des images : si les animaux sont tout le temps de face, il aura probablement des difficultés à catégoriser des animaux de dos. De même, s'il est entraîné uniquement à reconnaître des chiens de race bouvier-bernois, il aura probablement du mal à comprendre ce qu'est un Yorkshire.


Figure 7 – Illustration de la nécessité d’avoir des données d’entraînement représentatives de la fonction recherchée. En bleu, la fonction inconnue. En orange, les données censées représentées cette fonction et permettre au modèle de la « deviner ».


Les algorithmes d'intelligence artificielle sont aujourd’hui en train de révolutionner de nombreux domaines mais présentent encore des limitations. Actuellement, l'IA ne fait qu'approximer une fonction décrivant les données sur lesquelles elle a été entraînée. Elle répond à un problème très précis et n'a qu'une faible capacité à apprendre ce qui ne se trouve pas dans les données d'entraînement. Surtout, l'IA n'a pas appris comment apprendre, elle a simplement appris une fonction mathématique qui s'approche de la "fonction inconnue" sous-jacente, censée être décrite par les données d'entraînement. Nous sommes donc encore bien loin des cas de science-fiction d’IA omnisciente et même de l’intelligence Humaine.


Sources :

[1] https://medium.com/@rbaeza_yates/human-or-robot-cf6777d15de8

[2] https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/

[3]  https://www.youtube.com/watch?v=Rg9CdkwavmY


[4] https://arslanali4343.medium.com/complete-introduction-about-a-career-path-in-al-ml-dl-and-ds-7508d1adaafc


[5] https://blog.westerndigital.com/machine-learning-pipeline-object-storage/

Commentaire ( 0 ) :
28 avril 2021
Auteurs

S'inscrire à notre newsletter

Nous publions du contenu régulièrement, restez à jour en vous abonnant à notre newsletter.