L’IA générative, ce qui change
L’ère de l’IA générative : ce qui change L’abondance et la diversité des réactions à ChatGPT et aux autres IA génératives, qu’elles soient sceptiques ou enthousiastes, illustrent les changements qu’elles provoquent et l’impact qu’elles ont bien au-delà des cercles technologiques habituels. Cela contraste fortement avec les générations précédentes d’IA, essentiellement prédictives et généralement limitées à des articles ou des thèses confinés au domaine de la recherche et de l’innovation. Pour les entreprises, l’IA générative est également différente des intelligences artificielles précédentes. Si on les compare aux technologies les plus similaires, telles que le traitement du langage naturel (NLP) pour les corpus de texte ou la vision par ordinateur pour les données audiovisuelles, les IA génératives apportent quatre changements majeurs que les entreprises commencent à percevoir en les expérimentant. Premièrement, comparée aux IA précédentes, l’IA générative accélère considérablement le déploiement des cas d’usage, en ce sens qu’elle accélère la preuve de concept. Deuxièmement, elle ouvre un nouveau champ de possibilités, permettant une valorisation plus facile, plus efficace et moins coûteuse des données non structurées. De plus, les résultats obtenus avec l’IA générative sont nouveaux en termes de qualité, de quantité et de diversité par rapport aux modèles utilisés auparavant. Tous ces facteurs impliquent que nous devons répondre aux attentes accrues des utilisateurs finaux, alimentées par le battage médiatique entourant cette technologie. Nous développons ces quatre points ci-dessous. L’IA générative permet de tester plus rapidement la valeur ajoutée des cas d’usage Dans le domaine de l’IA générative, le déploiement des cas d’usage est souvent plus rapide et moins laborieux qu’avec les IA précédentes. L’approche adoptée avec l’IA générative est fréquemment comparée à l’assemblage de Legos, où des composants préexistants peuvent être combinés pour créer de nouveaux résultats. Cette facilité d’expérimentation et de mise en œuvre peut permettre des cycles de développement plus courts. De plus, un mode d’interaction conversationnel avec les utilisateurs accélère également l’adoption. Un cas d’usage de données peut se réduire à un problème métier, des données, un modèle et une invite. Traditionnellement, la création et l’optimisation du modèle représentent la partie la plus complexe et la plus chronophage du processus. Avec l’IA générative, cette étape devient plus simple. L’IA générative fournit des modèles préentraînés, prêts à l’emploi, permettant aux entreprises de bénéficier d’une expertise avancée sans investir beaucoup de temps dans le développement et le perfectionnement des modèles. En pratique, des modèles (tels que le GPT 4.0 d’Azure) sont accessibles « à la demande » ou peuvent être déployés via des API (comme le Gemini Pro BARD de Google). Certains fournisseurs proposent même des modèles spécialement affinés pour des domaines spécifiques, tels que la génération de textes juridiques, médicaux ou financiers. Une fois le modèle déployé, il ne reste plus qu’à « ancrer » le modèle d’IA générative, c’est-à-dire à rattacher les résultats générés par le modèle à des informations du monde réel afin de contraindre le modèle à répondre dans un périmètre donné. Cela implique souvent d’ajouter des contraintes ou des informations supplémentaires pour guider le modèle vers des résultats cohérents et pertinents dans un contexte spécifique. Cependant, cela est bien loin du temps nécessaire pour entraîner les modèles d’IA que nous utilisions jusqu’à présent. Prenons l’exemple d’un cas d’usage d’analyse des verbatims d’un centre d’appel pour illustrer notre propos. Selon une étude d’Artefact, pour développer ce type de cas d’usage en utilisant des modèles basés sur l’IA précédente, il fallait généralement trois à quatre semaines à partir du moment où les données étaient récupérées et rendues utilisables. Aujourd’hui, grâce à l’IA générative, ce processus ne prend qu’une semaine, soit un facteur d’accélération supérieur à trois. Le principal défi consiste à choisir la classification métier appropriée pour adapter le modèle. L’IA générative étend le champ d’application de l’IA à des données auparavant peu utilisées ou mal exploitées Certains champs pétrolifères ne sont rentables que lorsque les prix du pétrole s’envolent. Le même principe peut être appliqué aux données. Certaines données non structurées peuvent désormais être exploitées grâce à l’IA générative, ouvrant un tout nouveau champ de données exploitables pour l’entraînement ou l’affinage des modèles, et offrant de nombreuses perspectives d’applications spécialisées dans des domaines spécifiques. Et il y a une promesse émergente : celle des IA génératives capables de traiter et de combiner tout type de données dans leurs processus d’entraînement, en contournant le travail chronophage et fastidieux de structuration et d’amélioration de la qualité des données d’une entreprise pour les rendre utilisables. Une promesse encore non tenue, selon les observations actuelles. L’IA générative a non seulement bénéficié d’une véritable avancée dans les mécanismes d’attention, mais aussi de la puissance toujours croissante – et nécessaire – des machines. Les mécanismes d’attention fonctionnent un peu comme la capacité d’une personne à se concentrer sur une partie importante d’une image ou d’un texte lorsqu’elle essaie de comprendre ou de créer quelque chose. Imaginez essayer de dessiner un paysage à partir d’une photographie. Plutôt que de regarder l’image entière d’un coup, vous vous concentrez sur certaines parties importantes, comme les montagnes ou les arbres. Cela vous aide à mieux comprendre les détails importants et à créer un dessin plus précis. De la même manière, les mécanismes d’attention permettent au modèle de se concentrer sur des parties spécifiques d’une image ou d’un texte lors de la génération de contenu. Au lieu de traiter toutes les informations d’un coup, le modèle peut se concentrer sur les parties les plus pertinentes et importantes pour produire des résultats plus précis et significatifs. Cela lui permet d’apprendre à créer des images, du texte ou d’autres types de contenu de manière plus efficace et réaliste. Les mécanismes d’attention se parallélisent très bien. L’utilisation de plusieurs mécanismes d’attention fournit une représentation des données plus riche et plus robuste, améliorant les performances dans diverses tâches telles que la traduction automatique, la génération de texte, la synthèse vocale, la génération d’images et bien d’autres. En conséquence, des cas d’usage qui semblaient impossibles il y a peu de temps sont désormais pleinement accessibles.
L’IA générative, ce qui change Lire la suite »