L'ère de l'IA générative : ce qui change

 

L’abondance et la diversité des réactions à ChatGPT et aux autres IA génératives, qu’elles soient sceptiques ou enthousiastes, illustrent les changements qu’elles provoquent et l’impact qu’elles ont bien au-delà des cercles technologiques habituels. Cela contraste fortement avec les générations précédentes d’IA, essentiellement prédictives et généralement limitées à des articles ou des thèses confinés au domaine de la recherche et de l’innovation.

Pour les entreprises, l’IA générative est également différente des intelligences artificielles précédentes. Si on les compare aux technologies les plus similaires, telles que le traitement du langage naturel (NLP) pour les corpus de texte ou la vision par ordinateur pour les données audiovisuelles, les IA génératives apportent quatre changements majeurs que les entreprises commencent à percevoir en les expérimentant.

Premièrement, comparée aux IA précédentes, l’IA générative accélère considérablement le déploiement des cas d’usage, en ce sens qu’elle accélère la preuve de concept. Deuxièmement, elle ouvre un nouveau champ de possibilités, permettant une valorisation plus facile, plus efficace et moins coûteuse des données non structurées. De plus, les résultats obtenus avec l’IA générative sont nouveaux en termes de qualité, de quantité et de diversité par rapport aux modèles utilisés auparavant. Tous ces facteurs impliquent que nous devons répondre aux attentes accrues des utilisateurs finaux, alimentées par le battage médiatique entourant cette technologie. Nous développons ces quatre points ci-dessous.

 

L’IA générative permet de tester plus rapidement la valeur ajoutée des cas d’usage

 

Les 10 meilleures IA pour créer un site web

 

Dans le domaine de l’IA générative, le déploiement des cas d’usage est souvent plus rapide et moins laborieux qu’avec les IA précédentes. L’approche adoptée avec l’IA générative est fréquemment comparée à l’assemblage de Legos, où des composants préexistants peuvent être combinés pour créer de nouveaux résultats. Cette facilité d’expérimentation et de mise en œuvre peut permettre des cycles de développement plus courts. De plus, un mode d’interaction conversationnel avec les utilisateurs accélère également l’adoption.

Un cas d’usage de données peut se réduire à un problème métier, des données, un modèle et une invite. Traditionnellement, la création et l’optimisation du modèle représentent la partie la plus complexe et la plus chronophage du processus. Avec l’IA générative, cette étape devient plus simple. L’IA générative fournit des modèles préentraînés, prêts à l’emploi, permettant aux entreprises de bénéficier d’une expertise avancée sans investir beaucoup de temps dans le développement et le perfectionnement des modèles. En pratique, des modèles (tels que le GPT 4.0 d’Azure) sont accessibles « à la demande » ou peuvent être déployés via des API (comme le Gemini Pro BARD de Google). Certains fournisseurs proposent même des modèles spécialement affinés pour des domaines spécifiques, tels que la génération de textes juridiques, médicaux ou financiers.

Une fois le modèle déployé, il ne reste plus qu’à « ancrer » le modèle d’IA générative, c’est-à-dire à rattacher les résultats générés par le modèle à des informations du monde réel afin de contraindre le modèle à répondre dans un périmètre donné. Cela implique souvent d’ajouter des contraintes ou des informations supplémentaires pour guider le modèle vers des résultats cohérents et pertinents dans un contexte spécifique. Cependant, cela est bien loin du temps nécessaire pour entraîner les modèles d’IA que nous utilisions jusqu’à présent.

Prenons l’exemple d’un cas d’usage d’analyse des verbatims d’un centre d’appel pour illustrer notre propos. Selon une étude d’Artefact, pour développer ce type de cas d’usage en utilisant des modèles basés sur l’IA précédente, il fallait généralement trois à quatre semaines à partir du moment où les données étaient récupérées et rendues utilisables. Aujourd’hui, grâce à l’IA générative, ce processus ne prend qu’une semaine, soit un facteur d’accélération supérieur à trois. Le principal défi consiste à choisir la classification métier appropriée pour adapter le modèle.

 

L’IA générative étend le champ d’application de l’IA à des données auparavant peu utilisées ou mal exploitées

 

Intelligence artificielle et recrutement : un cadre législatif européen pour protéger les droits humains

 

Certains champs pétrolifères ne sont rentables que lorsque les prix du pétrole s’envolent. Le même principe peut être appliqué aux données. Certaines données non structurées peuvent désormais être exploitées grâce à l’IA générative, ouvrant un tout nouveau champ de données exploitables pour l’entraînement ou l’affinage des modèles, et offrant de nombreuses perspectives d’applications spécialisées dans des domaines spécifiques.

Et il y a une promesse émergente : celle des IA génératives capables de traiter et de combiner tout type de données dans leurs processus d’entraînement, en contournant le travail chronophage et fastidieux de structuration et d’amélioration de la qualité des données d’une entreprise pour les rendre utilisables. Une promesse encore non tenue, selon les observations actuelles.

L’IA générative a non seulement bénéficié d’une véritable avancée dans les mécanismes d’attention, mais aussi de la puissance toujours croissante – et nécessaire – des machines.

Les mécanismes d’attention fonctionnent un peu comme la capacité d’une personne à se concentrer sur une partie importante d’une image ou d’un texte lorsqu’elle essaie de comprendre ou de créer quelque chose. Imaginez essayer de dessiner un paysage à partir d’une photographie. Plutôt que de regarder l’image entière d’un coup, vous vous concentrez sur certaines parties importantes, comme les montagnes ou les arbres. Cela vous aide à mieux comprendre les détails importants et à créer un dessin plus précis. De la même manière, les mécanismes d’attention permettent au modèle de se concentrer sur des parties spécifiques d’une image ou d’un texte lors de la génération de contenu. Au lieu de traiter toutes les informations d’un coup, le modèle peut se concentrer sur les parties les plus pertinentes et importantes pour produire des résultats plus précis et significatifs. Cela lui permet d’apprendre à créer des images, du texte ou d’autres types de contenu de manière plus efficace et réaliste.

Les mécanismes d’attention se parallélisent très bien. L’utilisation de plusieurs mécanismes d’attention fournit une représentation des données plus riche et plus robuste, améliorant les performances dans diverses tâches telles que la traduction automatique, la génération de texte, la synthèse vocale, la génération d’images et bien d’autres.

En conséquence, des cas d’usage qui semblaient impossibles il y a peu de temps sont désormais pleinement accessibles. C’est le cas, par exemple, du calcul du temps de parole dans les médias pendant les campagnes présidentielles. Il y a à peine deux ans, calculer avec précision le temps de parole de chaque candidat était une opération fastidieuse. Aujourd’hui, grâce à l’utilisation de l’IA générative, cela est devenu possible.

Concernant les capacités de calcul, OpenAI a publié il y a six ans une analyse montrant que depuis 2012, la quantité de calcul utilisée dans les sessions d’entraînement d’IA les plus importantes augmente de manière exponentielle, avec un temps de doublement de 3,4 mois (en comparaison, la loi de Moore a une période de doublement de deux ans). Depuis 2012, cette mesure a augmenté de plus de 300 000 fois (une période de doublement de deux ans ne produirait qu’une augmentation de sept fois).

 

L’IA générative améliore la diversité, la qualité et la quantité des résultats obtenus

 

L’IA générative se distingue clairement des IA précédentes par son impact sur les résultats générés par ses modèles. Non seulement la quantité de résultats générés a augmenté, mais aussi leur qualité et leur diversité. Cependant, tous ces aspects positifs doivent être tempérés par une reproductibilité plus faible des modèles d’IA générative.

Si l’on considère l’image d’un puzzle, l’analyse de données peut être comparée à son assemblage, où chaque pièce de données représente une pièce à arranger pour révéler une image cohérente. L’IA joue un rôle essentiel en tentant de combler les lacunes des données en utilisant les informations disponibles pour inférer et recréer ces pièces manquantes. L’IA générative va au-delà de la simple complétion des données existantes en créant de nouvelles données inspirées de ce qui existe déjà. Ce processus élargit les capacités d’analyse et permet de découvrir de nouvelles informations à partir de données existantes, mettant en avant l’aspect génératif.

Contrairement aux générations précédentes d’IA, qui tendent à produire des résultats souvent similaires, les modèles d’IA générative sont capables de générer une plus grande diversité de résultats en explorant différentes variations et alternatives. Cette diversité accrue permet de générer des contenus plus riches et plus diversifiés, passant du quantitatif au qualitatif et couvrant un plus large éventail de besoins et de préférences.

OpenAI s’est récemment rendu à Hollywood pour présenter son dernier modèle appelé « Sora », capable de générer des vidéos à partir de textes. « Entendre qu’il peut faire toutes ces choses est une chose, mais voir réellement les capacités était étonnant », a déclaré le producteur hollywoodien Mike Perry, soulignant la diversité et la qualité des capacités offertes par l’IA générative.

Cependant, en raison de leur capacité à explorer un espace de possibilités plus vaste, les modèles d’IA générative peuvent être moins reproductibles que les IA précédentes, et la précision des résultats en pâtit. Concrètement, il est plus difficile de reproduire exactement les mêmes résultats à chaque fois que le modèle est exécuté, ce qui peut poser des problèmes en termes de fiabilité et de prévisibilité dans certaines applications critiques.

Cette limitation constitue un défi majeur pour les applications de l’IA générative qui nécessitent des réponses précises. Et c’est un domaine sur lequel les entreprises travaillent dans leurs développements actuels : mieux spécialiser les modèles dans des domaines très spécifiques pour améliorer la précision des réponses, et combiner la robustesse des modèles basés sur des règles ou des requêtes sur des données structurées avec la facilité d’utilisation et d’interaction des IA génératives en les connectant aux sorties des premiers.

 

Des attentes accrues de la part des utilisateurs finaux

 

En matière de gestion des attentes et de la relation des utilisateurs finaux à la technologie, l’IA générative présente plusieurs défis spécifiques. En raison de sa capacité à produire des résultats rapidement, l’IA générative peut susciter des attentes particulièrement élevées. À l’inverse, l’apparition de « hallucinations » et de résultats indésirables peut grandement saper la confiance des utilisateurs dans ces solutions.

L’IA générative est capable de produire des résultats rapidement et de manière automatisée, ce qui peut donner aux utilisateurs finaux l’impression que la technologie est capable de résoudre tous leurs problèmes instantanément et efficacement. Cela peut conduire à des attentes disproportionnées quant aux capacités réelles de l’IA générative, et à une déception si les résultats ne répondent pas pleinement à ces attentes élevées.

L’IA générative n’est bien sûr pas parfaite et peut parfois produire des résultats inattendus ou indésirables, tels que des contenus incohérents, faux ou inappropriés. L’apparition de tels résultats indésirables peut entraîner une perte de confiance des utilisateurs finaux dans la technologie, remettant en question sa fiabilité et son utilité. Elle peut également soulever des inquiétudes quant à la sécurité et à la confidentialité des données lorsque des résultats inattendus compromettent l’intégrité des informations générées par l’IA générative.

En février 2023, le chatbot Bard de Google (rebaptisé Gemini) a fourni des informations incorrectes lorsqu’il a été interrogé sur les découvertes du télescope spatial James Webb de la NASA. Il a affirmé à tort que le télescope avait pris les premières photos d’une exoplanète. Cette déclaration est incorrecte, car les premières photos d’une exoplanète remontent à 2004, alors que le télescope James Webb n’a été lancé qu’en 2021 (source : équipe de CNET France, 2024).

Il est donc crucial que les utilisateurs finaux des systèmes d’IA générative soient conscients de leurs limitations. C’est pourquoi la plupart des entreprises déployant ces solutions s’efforcent d’accompagner les utilisateurs dans leur utilisation : formation à l’art de l’invite (prompting), explication des limitations de ces systèmes, clarification des attentes réalistes, et rappel des règles applicables en matière de protection des données.

Plus d’un an après la sortie de ChatGPT, les attentes autour de cette nouvelle technologie restent élevées. Cependant, la valeur qui y est associée n’a pas encore été pleinement concrétisée en cas d’usage tangibles. 

Intéressé par le concours Révélation Entreprendre ?
Découvrez notre concours ici
Retour en haut