European Commission logo
Créer un compte
Possibilité de sélectionner plusieurs mots avec une virgule de séparation

EPALE - Plateforme électronique pour l'éducation et la formation des adultes en Europe

Blog

En quoi l’éducation aux médias et à l’information contribue-t-elle à l’apprendre aujourd’hui ?

L'IA bouscule nos idées de base sur les données et les sources et nécessite de nouvelles procédures critiques

Profile picture for user divina meigs.
Divina FRAU-MEIGS

L’article d’André Chauvet sur Apprendre aujourd’hui : quelles métamorphoses en cours, quels leviers d’action mentionne la conclusion de mon article sur l’IA et l’EMI « Face aux artifices de l’IA, comment l’Éducation aux médias peut aider les élèves ?

Cette conclusion inspire un droit de suite, que j’exerce ici, car l’accès immédiat et illimité aux ressources sollicite l’esprit critique et ses conditions de développement. Évaluer en quoi l’IA Générative bouleverse l’apprendre nécessite de considérer deux éléments essentiels sur lequel l’esprit critique doit venir s’appuyer en confiance et s’exercer : la donnée d’une part, la source d’autre part. Ce sont deux angles morts de la réflexion actuelle, ce qui peut mener à une régression intellectuelle face à l’intelligence artificielle

Apprendre à partir de données contingentes et biaisées

La donnée, qui vient du participe passé substantivé latin « data », met de facto devant un fait accompli, sans consentement explicite, arbitraire quoiqu’il apparaisse comme authentique par nature numérique.  Or, au lieu d’être sélectionnées sur la base d’un échantillonnage raisonné et représentatif comme établi par les règles du savoir scientifique du XXe siècle, les données actuelles sont moissonnées à l’avenant, récoltées en masse (big data) puis soumises à des algorithmes qui les trient et les organisent pour en tirer de l’information.  Celles-ci sont donc contingentes des conditions de moissonnage en entrée (ce qui est disponible) et des contraintes des algorithmes en sortie (ce qui est manipulable, pondérable). Elles résultent donc d’un arbitraire rendu invisible tant leur taille et leur volume donne le sentiment de donner des résultats proches du réel.

Or ces big data servent de plus en plus de base à l’apprentissage, y compris l’apprentissage profond, sur lequel s’entraînent les LLM (Large Langage Models ou Modèles de langage étendu). GPT-3 a été entraîné sur 175 milliards de paramètres ; chat GPT-4 sur 100 000 milliards. Un LLM fonctionne en analysant les mots qui précèdent dans un texte pour tenter de prédire quel est le mot qui a le plus de chance d’être le suivant. Chat GPT-4 peut prendre en compte 6 000 mots précédents (8 192 tokens ou unités de 4 caractères). Tous ces tokens sont manipulables par la machine, dont la seule puissance de calcul vaut pour authenticité.  

Les corrélations qui en sortent sont arbitraires et peuvent être biaisées. Ceci peut s’avérer problématique, car les LLM vont reproduire les biais sur lesquels ils se sont entraînés, les préjugés pouvant mener à des préjudices, comme l’ont démontré les chercheurs qui ont dénoncé les stéréotypes de genre ou de race en traduction automatique ou en recherche d’emploi par exemple. Ces procédés nous incitent à plus d’exigence dans l’interprétation avant toute prise de décision, sous peine de céder à l’emprise, voire à la tyrannie des algorithmes. Cela implique d’apprendre comment fonctionne la data en entrée (comment la sélection est construite) et en sortie (comment la prédiction est présentée) … et de se méfier de nos propres biais cognitifs et culturels.

Évaluer l’information à partir de sources tertiaires, de synthèse

Quant à la question de la source, elle se niche au creux des systèmes d’IA. Dans chatGPT, les références sont créées par les paramètres d’auto-complétion du programme et peuvent être erronées. Si les sources académiques lui sont demandées, le bot conversationnel ne fournit pas toujours une bibliographie précise ou existante. Les liens web aux articles par exemple sont souvent tronqués ou envoient à des pages vides.  Dans certains cas donc, il est impossible de remonter à la source d’origine, sauf à passer par l’API du système. Les réponses données aux prompts (ou requêtes) peuvent relever de véritables sources primaires, ou de sources secondaires ou encore de sources au statut hybride ou mixte (moitié issu d’autres auteurs, moitié issu de la synthèse opérée par l’IA) ou encore sans rapport aucun avec l’existant. Dans certains cas, les résultats produits par l’IA peuvent être de synthèse, tant leur combinatoire ne permet pas d’attribuer une source claire à la réponse fournie.

Or les sources servent à évaluer le cycle de vie de l’information, essentiel pour l’apprendre. La fiabilité des sources et leur intégrité est en effet cruciale pour vérifier des faits, pour indexer des contenus fiables et pour produire des contenus, qu’ils soient scientifiques ou pas. Elle a pour but et pour effet d’instaurer la confiance dans l’apprentissage et ses diverses étapes, que ce soit à l’école, à l’université ou dans la recherche.

L’existence de cette strate de sources, au-delà des sources primaires et secondaires, pourrait être qualifiée de « sources tertiaires ». Cela implique de réfléchir à un système nouveau des normes fiables, qui les différencient clairement des deux premières façons traditionnelles d’apporter des preuves. Il faut pour cela trouver des moyens de les identifier comme étant partiellement ou entièrement générées par l’IA. Ce système pourrait alors être mis à disposition des étudiants, des enseignants, des bibliothécaires, des journalistes et autres éditeurs de contenus et de ce fait assurer un usage éthique de tout travail fait avec les systèmes d’IA.

Rajouter l’IA-littératie à l’EMI 

Dans les deux cas, qu’il s’agisse des données ou des sources, les usagers des LLM et autres systèmes d’IA doivent exiger plus d’interprétabilité et d’explicabilité de l’IA et récuser l’alibi de la « boîte noire ». L’explicabilité (ou X-AI) demande des preuves mathématiques et statistiques des données d’entrée et de sortie. L’interprétabilité tient compte de l’arbitraire des combinaisons aléatoires pas toujours traçables dans les circonvolutions des réseaux de neurones artificiels.

Les deux doivent désormais faire partie de l’apprendre à apprendre, dont la base est la confiance dans les données d’entrée et de sortie (avec biais reconnus) et dans l’intégrité des sources (sans erreur, sans plagiat et sans vol de propriété intellectuelle). Elles donnent du pouvoir d’agir aux humains face à la machine. L’explicabilité, de plus en plus exigée des systèmes d’IA, permet de faire des audits, de prendre en compte l’impact, voire de mener des actions en justice s’il y a préjudice. L’interprétabilité permet de connaître les facteurs et paramètres pris en compte, leur ordre d’importance, voire les règles qui régissent les paramètres mis en œuvre par les modèles d’IA.   

Toutes ces notions, de données, de sources, d’explicabilité et d’interprétabilité doivent désormais faire partie du design de toute formation qui aborde l’IA. Sans passer par le codage, qui relève des professionnels de l’informatique, mais en passant par le décodage, qui relève des usages au quotidien de l’IA par des non-professionnels. En ce sens, l’IA-littératie, tout comme la data-littératie, peuvent faire partie intégrante de l’Education aux Médias et à l’Information, car celle-ci aiguise l’esprit critique et l’intelligence collective.  


 

Login (2)

Want to write a blog post ?

N'hésitez pas à le faire !
Cliquez sur le lien ci-dessous et commencez à poster un nouvel article!

Dernières discussions

Profile picture for user Agence Erasmus Plus France Education Formation.
Agence Erasmus + France Education Formation
Community Hero (Gold Member).

Quels thèmes souhaiteriez-vous voir traités sur EPALE?

Sondage

Plus
TreeImage.
Johanne Ranson
Community Contributor (Bronze Member).

La nécessité d'éduquer au consentement dès le plus jeune âge

Skills for consent, un projet de création d’un livret d’activités d’éducation au consentement

Plus
Profile picture for user n00aon04.
Marco Cecchinato

Durabilité et formation des adultes : aller au-delà des compétences vertes ?

Rejoignez-nous pour réfléchir aux compétences vertes comme moyen d'aborder des questions complexes et interconnectées telles que le changement climatique et les défis environnementaux.

Plus