Appuyez sur “Entrée” pour passer au contenu

Le Chat GPT passe à Bourg-la-Reine

Patrick Donath, maire de Bourg-la-Reine invitait mardi 27 février à une conférence sur le sujet combien tendance de l’intelligence artificielle en général et de ChatGPT en particulier. « J’ai souhaité cette conférence, dit-il en introduction, car le sujet occupe, inquiète et surtout interroge. » Il ne s’était pas trompé : la grande salle du conservatoire était pleine.

L’assistance importante n’était pas sans rappeler celle de Sceaux, quand il y a un an environ, Laurence Devillers, professeur à la Sorbonne avait été invitée. Le sujet intéresse clairement.

Fayçal Boujemaa, ingénieur au département Data & AI d’Orange Innovation, avait intitulé son intervention : ChatGPT une instance de l’IA générative : révolution ou dérive ?

Il définit l’intelligence artificielle (IA ou AI en anglais pour Artificial Intelligence) comme « la tentative de reproduire par des machines des compétences cognitives qui sont le propre de l’humain et ce à des fins d’aide à la décision. » Parmi les capacités, il place la compréhension du langage, mais aussi l’organisation des connaissances dont il pense qu’elle reste encore mystérieuse. Les machines sont du point de vue des connaissances très loin de l’intelligence humaine. Visiblement, Fayçal Boujemaa souhaitait relativiser la puissance supposée de l’IA.

Au cœur sont les données

Quelques métaphores de son cru. Les données sont le carburant de l’intelligence artificielle, comme le moteur à la voiture. Pas de données (et en grand volume), pas d’intelligence artificielle, du moins au sens de l’apprentissage machine qui, comme son nom l’indique, en a besoin pour « apprendre ».

L’IA générative se distingue de l’IA en général en ce qu’elle vise à créer du contenu qu’il soit textes, images, musique, vidéo, mais aussi code. On tape une demande (en termes élégants, on saisit un prompt). Taper les bons prompts est un sport nouveau. L’orateur nous dit que le prompt engineering est une discipline enseignée dans les écoles de commerce. On s’étonne. Il appuie. « Poser les bonnes questions nécessite autant de talent que de fournir les bonnes réponses. »

Fayçal Boujemaa donne une belle liste de sites. Il ne peut s’attarder, ce serait interminable. Du côté génération de texte (souvent en plusieurs langues), il évoque ChatGPT d’Open AI, Bart de Google devenu Gemini, Perplexity, X-AI de Grok, Deep Mind d’Alphacode.

Pour la création d’images à partir d’un texte (le prompt), on a Mid journey, Dall-e. Pour la création de vidéo, il cite SORA qui a provoqué, dit-il malicieusement, des grèves à Hollywood. La crainte de certains de voir des machines créer des films.

On se bouscule au portillon des logiciels, il y en a plein d’autres. On oublie déjà Aleph Alpha (qui vient d’Allemagne) ou Anthropic d’Amazon. Pour en savoir plus, on pourra jeter un coup d’œil sur les 50 outils d’IA générative les plus utilisés en 2023 (blogdumoderateur.com).

Qu’est-ce qu’il a dans le ventre ?

C’est bien tout ça, mais a-t-on une idée même floue de comment marche ChatGPT ? La génération de texte de manière simplifiée (ou plus réellement à la très grosse louche) repose sur les phases suivantes :

Le système est entraîné sur de vastes ensembles de données textuelles pour apprendre la structure et les règles du langage. Plus les données d’entraînement sont riches, plus le modèle sera performant dans la génération de texte.

L’IA analyse le contexte du prompt, que ce soit une phrase, un paragraphe ou un document entier, pour comprendre le sujet et les informations pertinentes.

En se basant sur sa compréhension du contexte et des règles linguistiques apprises lors de l’entraînement, le modèle génère du texte en prédisant les mots suivants en fonction des mots précédents.

Certains systèmes intègrent des mécanismes d’autoamélioration où ils ajustent leurs prédictions en fonction des retours reçus, ce qui permet d’améliorer la qualité et la pertinence du texte généré au fil du temps.

Et l’IA non générative ?

L’IA non générative, par opposition à l’IA générative, se concentre sur des tâches spécifiques basées sur des règles prédéfinies. Son but n’est pas de créer des contenus, mais de trouver des tendances, de catégoriser des données. Ainsi en prévision des ventes, on analyse les ventes passées pour prédire les tendances futures et aider à planifier efficacement. En « rétention client » c’est le comportement qui intéresse pour identifier les clients susceptibles de partir et s’adresser à eux au plus tôt.

En médecine, elle est utilisée pour l’aide au diagnostic. Les IA peuvent analyser des données médicales complexes pour aider les professionnels de santé à poser des diagnostics plus précis et rapides. Elles sont largement utilisées dans l’interprétation d’imagerie médicale comme les radiographies, IRM ou scanners.

L’analyse des données des patients peut permettre à terme (quand suffisamment de données sont disponibles) une certaine prédiction de l’évolution de la maladie.

Attention dangers !

Soucieux de tempérer le pouvoir de l’IA, Fayçal Boujemaa en campe différentes faiblesses. L’imprécision d’abord, la non-fraîcheur de l’information qui vient du temps nécessaire à la collecte et au traitement des données sur le web. Il pensait peut-être à la version 3 de ChatGPT qui avait arrêté sa collecte en 2021. Depuis, d’autres comme Copilot de Microsoft savent rechercher dans le plus récent.

Les affabulations ou « hallucinations » sont des réponses fausses ou trompeuses présentées comme des faits certains. Ce ne sont pas des erreurs de fonctionnement. Lorsqu’elles « calculent » les réponses, les IA cherchent les mots les plus probables et n’ont aucune notion du vrai et du faux (comment le pourraient-elles ?). Raison de ne pas croire les IA sur parole. 😉

En ce qui concerne l’absence de citation des sources, si elle est réelle avec ChatGPT, d’autres plateformes, Copilot par exemple, sont plus transparentes.

Le manque de respect des copyrights est un sujet important et les contentieux ne font que commencer. Car ChatGPT et ses semblables se nourrissent des écrits publiés sur le net.

Il n’y a pas d’explicabilité des résultats. En effet, l’apprentissage machine a pour particularité d’ajuster lui-même ses paramètres de fonctionnement à mesure qu’il assimile ses erreurs ou découvre de nouvelles occurrences. Cette situation n’est pas propre à l’IA générative, mais le manque de transparence est amplifié quand le grand public s’en mêle.

L’IA générative est un outil puissant de création de fake news, destinées à nuire à des personnes, à des organisations ou à des États. Les impacts sont particulièrement accrus avec la vidéo ou la photo. On sait qu’on arrive à produire des images plus vraies que nature et qui impressionnent les innombrables accros des réseaux sociaux.

Challenge pour les entreprises

Dans les entreprises, les enjeux sont différents. Elles visent à développer des IA pour leurs propres besoins et ceux de leurs clients. En conséquence, une IA générative d’entreprise est personnalisée, elle ne peut être la reprise pure et simple de celles dont on parlait plus haut. Du fait qu’elles mobilisent des données confidentielles ou du moins sensibles vis-à-vis de la concurrence, il faut les protéger absolument. D’où la nécessité qu’évoque Fayçal Boujemaa de mettre à niveau toute la gestion des risques.

Mais une IA ne s’impose pas facilement. Une formation du personnel est indispensable pour s’approprier ces nouveaux environnements en même temps que, ajoute l’intervenant, une adaptation des activités et des organisations est nécessaire. Le plan stratégique d’Orange est campé pour illustrer le propos d’un cas concret.

Il termine, un brin pessimiste, sur la fuite des compétences européennes aux États-Unis ou dans les entreprises américaines. Cela peut sembler contradictoire avec le satisfecit décerné plus tôt dans la conférence aux talents français. C’est qu’en Europe, explique-t-il, on fait des normes avant l’innovation. Aux États-Unis on innove d’abord, on réglemente ensuite.

  1. Jean-Claude Herrenschmidt Jean-Claude Herrenschmidt 9 mars 2024

    J’ai relu avec toujours autant d’intérêt.
    Le paragraphe « Qu’est-ce qu’il a dans le ventre » me laisse une impression bizarre.
    Alors je m’interroge.
    Et puis je me rends compte qu’il suffit de remplacer les mots systèmes, IA et modèle par le mot « élèves » et je comprends l’origine de mon malaise.
    Mais ça doit être du mauvais esprit de ma part.

  2. Jean-Claude Herrenschmidt Jean-Claude Herrenschmidt 7 mars 2024

    Très très intéressant.
    Il est toutefois dommage que le conférencier n’ait pas cité Chat Mistral qui est l’IA développée par une équipe française.
    La différence entre IA générative et IA non générative est signalée avec raison.
    Par exemple, l’IA non générative est déjà largement utilisée. La « finance » embauche depuis plus de 20 ans des ingénieurs/informaticiens/mathématiciens qui ne font que développer ce qu’on appelle des outils (en fait de l’IA) pour aider à la décision spéculative. On m’objecte souvent que les traders sont quand même là pour prendre des décisions. C’est bien vrai. Mais ils ne prennent ces décisions qu’à partir des données fournies par les machines, données qui incluent les décisions des autres traders. C’est un grand jeu ou le bluff y a toute sa place. Évidemment ils le savent bien et toutes les équipes techniques autour d’eux s’ingénient en permanence à trouver des solutions informatiques, donc relevant de l’IA, pour minimiser la part de bluff et maximiser le gain des spéculateurs (investisseurs, banques, assurances et autres grands manipulateurs de monnaies).
    L’IA générative en est a ses tout débuts et focalise sur elle l’attention des médias et de ses victimes dont nous sommes tous. On peut tout craindre et brandir tout un tas d’arguments. Là n’est pas la question. Il y a des milliers d’ingénieurs de toutes spécialités qui travaillent d’arrache-pied et sans vergogne pour développer ces « techniques de l’IA » qui promettent des profits énormes. L’avidité des plus cupides est sans bornes. Je n’entends pas parler de plans de débauchage massifs dans ce domaine.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *