Quand l'industrie de l'IA s'écroulera

Bonjour,

Cf. L'industrie de l'IA au bord du précipice ? La plus grande action collective en matière de droits d'auteur contre Anthropic pourrait ruiner l'industrie de l'IA

Ce que je retiens de plus pertinent est (dixit OuftiBoy) :

L'IA (dans l'état actuel), ne fait que de ressortir une "réponse" basée sur d'anciennes œuvres, sans ajouter la moindre évolution, elle ne "crée" rien. Ce qu'elle fait lorsqu'on l'utilise s'apparente plus au plagiat.

Donc selon vous, votre docteur / expert en ce que vous voulez, lorsqu'il vous donne un diagnostic et qui ne fait que ressortir ce qu'il a appris dans des livres et à l'école en comparant cela à votre cas fait du plagiat ?

La réalité c'est que cela s’apparente davantage à une recomposition ou une synthèse qu’à une copie. Ce n’est certes pas de la création au sens humain, car l'IA n’a pas d’intention, pas de subjectivité et pas de démarche artistique ou créative consciente. Elle ne fait que générer des variations probables à partir de ce qui existe déjà.

Ce n'est pas cela le fond du débat ni l'objet de la plainte. Le vrai problème c'est la potentielle appropriation massive de contenus protégés sans rémunération ni autorisation des auteurs (On parle de cinq à sept millions d’ouvrages potentiellement concernés). Pour continuer avec mon exemple initial, votre docteur / expert en ce que vous voulez a acheté ses bouquins...

Le juge a précédemment reconnu que l’entraînement de modèles d’IA à partir d’œuvres légalement acquises pouvait relever du fair use, mais il a clairement distingué le cas des copies piratées, estimant que cette pratique de constitution d’une "bibliothèque centrale" ne pouvait pas être protégée.

Il y a plusieurs sorte d’IA.
Celle que la pub chatgpt a popularisé est l’IA conversationnelle.
C’est celle que j’appelle évolution des moteurs de recherche.

Le plus qu’elle a sur la première version des moteurs de recherche est, à mon sens, qu’elle peut plus facilement analyser les questions et relier des informations entre elles. Mais la base de donnee initiale est peu différente, juste une question de taille et donc de moyens.
C’est pour cela que je parle d’évolution.

Il n’y a pas de raison que comme les moteurs de recherche classiques elles ne subissent pas des accusations de plagiat et de pillage de propriété intellectuelle.

Les IA génératrice de code sont confrontées au risque de violation des licences propriétaires, GPL ou autres.

Je ne parle pas des autres IA, comme la conduite de processus qui utilisent les mêmes capacités d’analyse pour décider d’actions en fonction d’évènements extérieurs.
La on n’est plus dans la quette de documentation, mais plus dans un programme d’automatisme.
Ces IA là, quasiment personne n’en parle, trop technique, pas assez spectaculaire.

Si on limitait l’utilisation du terme IA aux capacités d’analyse ce serait plus juste,

La connaissance de ”par cœur ” ne relève pas du domaine de l’intelligence.

A mon avis, non, il n’y a pas plusieurs sortes d’IA. L’intelligence artificielle est un champ unique qui repose sur les mêmes principes d’apprentissage et de modélisation. Ce que vous appelez différents types d’IA ne sont en réalité que des applications différentes. Une IA conversationnelle, une IA génératrice de code ou une IA de pilotage industriel utilisent les mêmes bases ; seules les données d’entraînement et le contexte d’utilisation changent. Ce ne sont pas des familles distinctes mais des déclinaisons d’une même technologie.

Un moteur de recherche indexe du contenu existant et renvoie des extraits pertinents en réponse à une requête, alors qu’un modèle conversationnel génère du texte nouveau en temps réel en fonction d’une probabilité statistique calculée sur l’ensemble de ses données d’entraînement.

➜ La différence essentielle est dans la génération versus la récupération. Google reste fondamentalement un moteur de recherche : il indexe des pages existantes et les classe pour répondre à une requête. Même avec BERT ou MUM, l’IA améliore la compréhension du langage et du contexte, mais ne crée pas de texte original ; elle sélectionne et reformule ce qui existe dans son index.

Un modèle conversationnel comme ChatGPT ne se limite pas à pointer vers des sources. Il prédit mot par mot une réponse complète en combinant les informations apprises lors de son entraînement, ça permet de générer du texte inédit, des résumés, des explications ou des conseils, même si ces contenus ne figurent pas exactement dans ses données d’entraînement.

Pour moi, l’évolution des moteurs de recherche consiste surtout à mieux comprendre et relier l’information, tandis que l’IA conversationnelle ajoute la capacité de synthèse et de génération autonome, ce qui est une fonction fondamentalement différente.

L’évolution des moteurs de recherche, c’est, outre fournir les liens comme ils le faisaient déjà, proposer directement dans la page de réponse ce qu’un LLM a à dire sur le sujet.

Tiens, je passais par là, quand j'ai vu un débat entre @J-M-L et @68tjs, je me suis dit que ça pourrait être intéressant... Généralement, j'évite les discussions IA (sauf quand j'ai l'idée bizarre d'en créer une), mais bon, là c'est constructif.

L'idée de @J-M-L est à mon sens juste, effectivement sur un point de vue purement technique, l'IA fonctionne à peu près de la même manière de ce que j'en sais. Par contre, on peut utiliser un modèle pour plusieurs choses, lui donner une fonction unique (générer du code, des images, des sons) ou une autre fonction unique un peu différente, celle que @68tjs a évoqué à savoir la fonction conversationnelle.

Et dans cette branche des modèles d'IA, qui est je pense la plus connue, on peut diviser encore ceux qui sont dans une optique de discussion (les premiers ChatGPT), et celle de recherche (ex: Perplexity). Et c'est là que je rejoins @68tjs par contre, on peut je pense considérer les "modèles conversationnels de recherche" comme des évolutions de moteur de recherche.

Là ou je ne suis pas d'accord, c'est qu'un moteur de recherche est pour moi un moteur de recherche, et une IA (simplement conversationnelle) est une IA. Chaque à un mode de fonctionnement différent, et une utilité différente.

  • Le moteur de recherche ne fait "que" (entre guillemets car c'est déjà beaucoup!) indexer des pages, et les restituer au mieux en fonction d'une requête, telles quelles.

  • Ce qu'ajoute l'IA, c'est que la plupart du temps on ne voit pas les sources (oui, certes, maintenant c'est plus souvent le cas parce que de nombreux modèle sont désormais un peu plus axés "recherche" mais passons) mais la réponse est claire et souvent plus "simple" à utiliser qu'un lien dans lequel il faut encore trouver les infos (c'est une énorme généralité que je fais là, bien sûr il existe plein d'exception à la règle)

Je fais juste un petit arrêt sur les IA comme Perplexity, ou ChatGPT très (très) récemment (et pour ceux qui sont d'accord avec la politique de l'OpenIA). Dans le cas d'une IA qui n'est à la base que conversationnelle pure et dure, mais qui fait des recherches, affiche les sources, et fourni à la fois ce que ferai un moteur de recherche simple et une réponse concise avec des infos claires par rapport à la demande, là je pense qu'on peut considérer ça comme une évolution d'un moteur de recherche, mais on l'utilise avant tout je pense pour le côté IA, avec les sources pour "vérifier", non pour trouver.

Mais moi, quand je vais sur un moteur de recherche, quel qu'il soit, je m'attends à trouver un moteur de recherche en bonne et due forme. Si je voulais utiliser une IA, je serai allé sur une IA. Donc les fonctionnalités de ce genre

Je ne trouve pas ça très utile, je désactive systématiquement.

Je trouve (personnellement hein), qu'il est plus pratique d'avoir une IA qui intègre des fonctionnalité de recherche, et à côté un moteur de recherche pure et dure, qu'un moteur de recherche pure et dure qui essaye d'intégrer l'IA conversationnelle.

Ce n'est que mon avis en tant que jeune inculte :slight_smile:
Ça fait du bien de retrouver des débats constructifs sur le forum, ça m'avait manqué.

l'avantage du moteur de recherche qui donne des pages c'est qu'il intègre une notion de traffic et d'usage (les personnes qui ont cliqué sur ces liens dans des questions similaires) — voire de profil utilisateur (plus dangereux) — qui est dynamique, ajustée plus ou moins en temps réel grace à 'l'énorme traffic généré (ce qui a aussi des biais).

Cette information dynamique n'est pas disponible pour les IA génératives. Elles peuvent vous donner des liens plus ou moins obscurs vers des sources qui n'ont absolument rien à voir parce qu'elle font simplement des associations d'idées qui sont erronées ou des trucs obsolètes.

Donc même si ce n'est pas encore cela, un moteur de recherche qui résume les liens principaux pour donner une vue synthétique, ça peut être pas mal.

Il y a encore du boulot à faire bien sûr :slight_smile:

Ce que j'ai écrit est-il vraiment différent de ta réponse ?
Le sujet était sur les risques juridiques d'accusation de copies illégales.

pfff........

Je me casse de tous les sujets sur l'IA.

Je ne sais pas vraiment évaluer ce risque. C’est à dire quel est la probabilité que l’IA te génère exactement un code déjà existant ?
J’aurais tendance à croire(supposer) que l’effet statistique rend ce risque pas très important.

C’est aussi une question de point de vue.
J’ai une question, dont je veux connaitre la réponse, comment fait l’outil pour t’apporter la réponse n’a pas vraiment “d’intérêt”.
Pour moi l’évolution du moteur de recherche est comme pour @68tjs l’agent conversationnel ou le smart search engine :slight_smile:

Je ne sais pas si on peut appliquer ce genre de séparation, dans les deux cas c’est le LLM qui produit le texte ou le code.
De même pour l’IA génératrice d’image, ou le LLM produit une représentation vectorielle de la demande pour la donner à l’IA d’image.
Comme tu l’indique c’est l’utilisateur qui lui donne la fonction.

C’est quoi pour toi une IA simplement conversationnelle ?
Par définition une IA conversationnelle est une IA génératrice de texte, et une URL reste du texte ?

Cela n’existe pas un modèles conversationnels de recherche, d’ailleurs le LLM de Perplexity est GPT, c’est un outil complexe qui utilise l’IA pour faire une série d’action.
bien que je comprends ce que tu as voulu dire, si cet outil qui est l’évolution des moteurs de recherche est basé sur un LLM, c’est bien que le LLM est un constituant de cette évolution.

Franchement, à titre personnel, je crois que @68tjs l’avait aussi mentionné.
J’ai noté une nette baisse de la pertinences des résultats des moteurs de recherche.
Je ne serais dire c’est cela à avoir avec l’avantage dont tu parle, mais de ce que j’ai constaté l’efficacité global n’est pas au rendez-vous.

Cela veut peut être dire, qu’il est d’accord sur ce sujet :slight_smile: