Muffin ou chihuahua ?

Apprentissage automatique 

Que voit-on sur ces photos ?  

Réponds le plus vite possible. 3… 2… 1… GO ! Pour un ordinateur, c’est superdifficile. Mais comme tu l’as vu, il peut apprendre à reconnaître des choses. Grâce à l’apprentissage automatique !  

L’apprentissage automatique est une composante importante de l’IA. On distingue 3 types d’apprentissages automatiques. 

BlurHashmuffinchi

1 Apprentissage supervisé 

Étape 1  

Tu fournis toute une série de données à l’ordinateur en lui précisant de quoi il s’agit. Par exemple, tu peux lui montrer plein de photos de chihuahuas et de muffins, en donnant à chacune l’étiquette « chihuahua » ou « muffin ». En fournissant ces données à l’ordinateur pour qu’il apprenne, tu « entraînes » l’IA.  

Ensuite, l’ordinateur cherchera des motifs dans les deux groupes de photos. Comme elles se ressemblent un peu, tu devras beaucoup entraîner l’IA. Essaie un peu ici. 

BlurHashmufchiNED

Étape 2  

Ton IA est bien entraînée ? Propose une nouvelle photo à l’ordinateur. Sur la base des motifs qu’il a assimilés, il prédira quelle réponse est la plus probable : chihuahua ou muffin ? 

BlurHashmufchiFR

95 % chihuahua 
L’ordinateur est sûr à 95 % qu’il s’agit d’un chihuahua. 

  • Dans ce cas-ci, l’ordinateur apprend d’après des données étiquetées. 

 

2 Apprentissage non supervisé 

Tu en as assez des chihuahuas et des muffins ? Tu peux apprendre bien d’autres choses à l’ordinateur que la différence entre les chihuahuas et les muffins.  

Tu peux par exemple aussi donner plein de données à l’ordinateur sans lui dire de quoi il s’agit. Il recherchera alors des motifs et formera des groupes par lui-même. Il peut par exemple distinguer des photos de crêpes et de gaufres. 

Les crêpes sont d’un côté, les gaufres de l’autre. Reconnais-tu d’autres groupes ? (Regarde un peu l’arrière-plan des photos.)  

BlurHashpannewafel
  • Dans ce cas-ci, l’ordinateur apprend d’après des données non étiquetées. 

 

3 Apprentissage par renforcement  

Cette dernière méthode d’apprentissage est très intéressante. Tu l’as déjà expérimentée dans les jeux vidéo. Quand tu commences un nouveau jeu vidéo, tu n’es pas encore tout à fait au point. Mais avec un peu de pratique, tu apprends ce qui fonctionne bien et moins bien. Tu es récompensé si tu joues bien (LEVEL UP) et pénalisé si tu joues mal (GAME OVER). Ainsi, tu t’améliores de plus en plus. Tu l’auras compris : tu peux aussi apprendre des choses à un ordinateur de cette manière. Il peut par exemple apprendre à jouer à un jeu ou... à trouver la sortie d’un labyrinthe. Regarde un peu les écrans ci-dessous. 

  • Dans ce cas-ci, l’ordinateur apprend d’après des données qu’il reçoit en faisant ce qu’il faut ou pas. En résumé : il apprend par l’expérience. 

Deep learning 

Un cerveau numérique   

BlurHashDeap learningFR

Dans l’apprentissage automatique, tu as aussi ce qu’on appelle l’apprentissage profond (plus souvent appelé « deep learning »). 

Le deep learning est une composante complexe de l’apprentissage automatique, qui fonctionne avec des réseaux neuronaux. Sais-tu de quoi s’inspire ce système ? Du fonctionnement de notre cerveau ! 

Voilà à quoi ressemble un cerveau neuronal 

BlurHashneuraalnetw

Un grand nombre de données   

Ce réseau neuronal est souvent entraîné à l’aide de quantités phénoménales de données. Toute une foule de textes, d’images ou de vidéos. Les sociétés d’IA puisent ces données sur internet. Cette captation de grandes quantités de données sur des pages web s’appelle le « scraping ». Ces entreprises « raclent » internet pour récolter des données, en quelque sorte.  

Beaucoup de réseaux neuronaux résument les principales caractéristiques de toutes ces données dans un espace latent (« latent space »)

Black box  

Une fois notre réseau neuronal complètement entraîné, tu peux y encoder des données et il produira un résultat. L’ennui est qu’on ne sait pas toujours bien ce que le réseau a appris. Nous ignorons souvent pourquoi il nous donne un résultat en particulier. Ce qui se passe entre l’encodage des données de la production et la sortie du résultat est donc une sorte de boîte noire, la « black box »

BlurHashblackbox

Mais si on ne comprend pas pourquoi un modèle IA produit tel ou tel résultat, est-il bien raisonnable de l’utiliser ? Imagine : un modèle IA est entraîné à décider quelles études te conviendraient. Et il décide que tu n’es pas apte à suivre l’orientation qui te plairait. Mais personne ne sait pourquoi. Suivrais-tu quand même sa décision ?