Autres IA que ChatGPT ?

Dans une autre discussion, j'ai été choqué de constater que seul ChatGPT semble exister !
Il n'y en a que pour chatgpt !

Pourtant, un membre du forum a mis il y a plusieurs mois un lien vers un site rassemblant d'autres IA .
Je le remercie très sincèrement.

ChatGPT-4o mini
Llama 3.3
Claude 3
o3-mini
Mistral small

Dans cette comparaison ChatGPT gratuit est loin d'être le meilleur .
Le pire est quand chatgpt et o3, tous deux développés par OpenAI, divergent.

Je utilise ce site complètement : c'est-à-dire je fais la même recherche sur toutes les IA et je constate que si elles sont assez souvent d'accord, c'est quand même loin d'être l'unanimité.

Ils ne manquent pas de présenter des excuses quand on leur signale des erreurs.
Le champion dans les excuses est ChatGpt, devinez pourquoi :grinning_face:
Mes constatations : Il arrive que les autres IA répondent : désolé je ne connais pas la réponse a votre question, Chatgpt a toujours une réponse, ............des fois suivie d'excuses.

-------------------------------------------------------------------------

S'il y a des courageux pour compléter cette liste ne vous gênez pas.
Je souhaite un peu d'ordre et de méthode :
Je propose de travailler en deux temps ou en deux messages parallèles.
D'abord le recensement des IA.
Après le test des IA et les avis

PS : je pense que personne ne verra d'inconvénient si des IA payantes sont aussi recensées.

------------------------------------------------------------------------------
J'ajoute Yiaho à la liste ;
https://www.yiaho.com/discussion-libre/

pour le recensement j'ajoute deep-seek
https://www.deepseek.com/

Ajoutez aussi Compar IA
Il permet de choisir entre une trentaine de modèles, parmi lesquels :

Il faut en choisir 2 ou lui laisser les proposer, et poser sa question.

Bonsoir!

J'utilise souvent Perplexity:

Bonne soirée!
jpbbricole

Il y a copilot, qui est utilisable directement dans Visual code.

J'ai profité de ce fil de discutions pour essayer DuckDuckGo avec Mistral, que je voulais tester depuis un moment, un point "négatif" c'est que la session est limité à la différence des IA propriétaire.
Ce qui peut être gênant sur des problèmes un peu complexe à décrire.

Salut !

J'espère que mon post n'est pas hors sujet. Je vais me concentrer en partie sur les modèles légers que l'on peut essayer facilement en local (si c'est hors sujet, dites-moi et je supprimerai le post).
Pour les petits modèles, ne vous attendez pas à de bons résultats pour des problèmes généralistes en dessous de 32B, mais notez en revanche que des modèles ultra-spécialisés, en code par exemple, même petits, peuvent donner d'excellents résultats pour leur tâche spécifique. Voyez ça comme un tour d'horizon... Je me permets d'autant plus d'en parler, dans ce monde de DIYers, faire marcher un mini ChatGPT sur son robot en local... c'est cool non ? Moi, je trouve ça cool.
La liste est tout sauf exhaustive, et je ne parlerai QUE des modèles basés sur Transformer, qui ont le plus fait leurs preuves (on laisse xLSTM, Mamba ou autres Coconut au placard).
Le domaine est en ébullition, alors ce post sera sûrement en partie obsolète dans 3 mois.

Je prends aussi le parti de parler des MODÈLES car, perso, ce qui m'intéresse, c'est plus la tech et la science que l'intégration web. Je ne parlerai donc pas des plateformes, qui sont cependant très critiques pour rendre un modèle utilisable, comme le souligne Arthur Mensch (cofondateur de Mistral). Mais voilà, moi l'intégration ça ne m'amuse pas trop...

Open weight :

  • Réflexion (comme O3) :

    • Deepseek R1 671B (et Deepseek R1 Zero qui est le modèle uniquement RL sans SFT).
    • QwQ 32B d'Alibaba qui a de très bons résultats pour du 32B, rivalisant avec R1 671B selon les benchmark.
  • Normaux (qui gèrent généralement les tools pour les récents) :

    • Qwen 2.5 7B, 14B et 72B, surpassant Llama-3-405B : Alibaba, incontournable en ce moment, ils sont complètement SOTA en ce moment...
    • Gemini / Gemma de Google, Gemma3 27B qui bat des records pour du 27B (sorti il y a 2 semaines je crois).
    • Deepseek V3 0324 (650B environ... impossible à la maison bien sûr...) : solides performances, surpassant Deepseek V3 qui affichait déjà de belles performances. Pas testé car sorti il y a quelques jours.
    • Llama 3.3 70B de chez Meta, incontournable mais dur à faire marcher à la maison (pour Llama 3.2 et 3.1il existe en 3B, 7B, 32B, etc...).
    • Phi4 / Phi4 Omni de Microsoft, je ne vais pas m'attarder mais ça marche très bien.
    • Mistral 8x7B : INCONTOURNABLE pour du local (architecture mixture of experts (MoE), comme son nom l'indique, donc pour générer une réponse c'est en gros 2x7B plus la couche de MoE qui fait quelques milliards de paramètres elle aussi). Il existe aussi 8x22B pour les plus audacieux...
    • Mistral-Nemo (collab Nvidia et Mistral), que j'ai trouvé très bon en 14B (pour du 14B évidemment).
    • Falcon 180B de Technology Innovation Institute jamais testé personnelement il parait que c'est bien.
    • Zephyr 7B : j'aime bien parceque c'est de Hugging Face, mais j'ai pas beaucoup joué avec.
    • StarCoder 2 de BigCode (Hugging Face + ServiceNow), pareil jamais testé mais le nom est connu.
  • Bonus :

    • Qwen 2.5 Omni V2... sorti il y a quelques jours, pas encore testé mais il a l'air bluffant et tournable à la maison. Il peut gérer du streaming vidéo, images, texte et son, et sortir en stream du texte ET des tokens audio !
    • Codestral-Mamba : de mistral AI. J'avais dit que je n'en parlerais pas mais je craque : architecture hybride Mamba(SSM)/Transformer, théoriquement plus pertinente pour du code... mais n'a pas encore bien fait ses preuves...
    • Granit de chez IBM, plus pour la culture... SOTA en analyse d'image pour du <3B.
    • Impossible à la maison (sauf si vous avez des dizaines milliers d'euro de GPU sous votre paillasson), les très gros modèles de Nvidia (Nemotron) mais avec de très bons résultats.

Bien sûr, les modèles open sont déclinés en autant de fin-tunings communautaires (ou pro d'ailleurs) qu'il existe d'idées ou d'envies.
Si vous voulez rigoler / avoir froid dans le dos / que le modèle arrête de vous dire "c'est mal, je ne réponds pas", allez découvrir les modèles "uncensored" de "Cognitive Computation" (https://huggingface.co/cognitivecomputations). Ceux qui marchent bien chez moi sont Dolphin-Mistral-8x7B, Dolphin-Llama-7B et Dolphin-Mistral-7B. Vous pouvez leur demander comment tuer vos voisins, ils répondent presque sans poser de questions....au dela du coté rigolo, il parait que le "bridage" des LLM a tendance a nuire a leurs performances globales (c'est ce que j'ai lu, difficile de se faire une vrai idée car les entrainements fait par des grosses boites ne font pas de tels entrainements, en tout cas pas publiquement a ma conaissance).

+++ Notez que pour la majorité, les gros modèles (Deepseek V3, R1, etc.) peuvent être testés sur une plateforme mise à disposition par l'entreprise qui en est à l'origine (sur un modèle freemium en général, comme ChatGPT).

100% propriétaire (je m'y intéresse moins, donc juste ce dont on entend parler) :

  • Le chat de Mistral AI : permettant d'essayer les modèles propriétaires de Mistral (Mistral Large1 et Large2, avec beaucoup trop de paramètres pour les compter lol).
  • ChatGPT (4o, 4o mini, o3, o3 mini, o1, o1 mini) : ....... voilà.
  • Claude (3 Haiku, 3 Sonnet, 3 Opus, 3.5 Sonnet, 3.5 Opus, récemment 3.7 sonnet .... allez savoir pourquoi ils n'ont pas fait 4, ca devait faire too much) d'Anthropic : déjà dit.
  • Grok : de notre "ami" Musk, jamais utilisé perso... mais ça marche bien il paraît.
  • Perplexity : déjà dit.
  • Command R+ de Cohere pour les tâches orientées prod et RAG apparament je connait peu.

Voilà, ce post est excessivement long... je me suis amusé à l'écrire.

Pour le "second temps", je peux si vous voulez faire l'inference chez moi pour des models jusque a 12B en fp32 ou environ 24B en fp16... donc si vous voulez que l'on fasse des essais comparatifs vous me direz!

PS : Notez pour vous y retrouver que Mistral et maintenant Deepseek utilisent des noms de modèles avec la date, comme Ubuntu... on sait si c'est nouveau on le sait du premier coup d'œil maintenant !
PS 2 : Pour les curieux des modèles open qui n'ont jamais fait mumuse, vous pouvez installer les images Docker d'Ollama et OpenWebUI (si vous ne connaissez pas, les projets sont ultra soutenus, 100% open, et complètement hyperactifs du push github), c'est super facile!

Bonjour,

J’ai essayé DeepSeek

philippe

Salut à tous,

un site que je viens de découvrir : https://zzzcode.ai/

Spécialisé dans le code, on peut l'espérer plus pertinent que chatgpt (les spécialistes pourront nous donner leur avis)
Il cause français, bonus pas négligeable
Il prétend (pareil, les spécialistes seront d'un avis bienvenu) corriger, commenter, débugger les codes

Perso je n'ai fait que deux essais rapides en javascript, sur du code assez simple qui a fait ce que je voulais.

J'utilise souvent "Perplexity" pour me donner des morceaux de codes et explications (html, javascript, c, ...).

Je l'utilise aussi pour tout et n'importe quoi de temps en temps.

Très rarement déçu.

Cordialement.

Pierre.

Je viens de faire un essais rapide, sur du code pas très standard car c'est du XML pour créer un installeur avec Wix.

Cette IA, je trouve assez intéressant le fait de pouvoir remanier le prompt, mais du coup cet avantage devient un inconvénient lorsque l'on doit recadrer l'IA, car on ne peut pas bien le diriger.

Donc au final sur un tel cas, ou il y a peu de code disponible en référence avec beaucoup d'attribut disponible sur chaque élément.
cela est bien moins performant que Perplexity qui déjà est mis à rude épreuve et n'arrive pas à me donner un code valide.

Par contre l'interface est un peu déroutante par rapport au IA actuel, mais je là trouve quand même assez efficace, notamment pour définir les options systématiquement

Il y a aussi Meta AI dans messenger.

Je remets le lien duckduckgo vers plusieurs IA :

auquel j'ajoute :
https://www.perplexity.ai/
et
https://www.yiaho.com/discussion-libre/

J'ai testé Cursor :

Une IDE dopée à l'IA, elle est pratiquement capable de fournir un code complexe sur de simples prompts.
Je l'ai testée en Python, ça marche plutôt bien. L'avantage c'est qu'elle peut tester le code qu'elle génère, capter les messages d'erreur et proposer des solutions. Donc, elle joue toute seule jusqu'à arriver à un code qui s'exécute correctement.

On peut aussi la guider avec des prompts bien sûr. Lorsque la solution est trouvée et que le code fonctionne, elle propose aussi des voies d’amélioration ou des extensions. C’est assez impressionnant.

Bonjour,
Je viens de tomber par hasard sur https://stackoverflow.ai/, je ne sais pas ce qu'elle vaut (elle est apparemment basée sur OpenAI), mais elle présente l'avantage de citer les posts stackoverflow relatifs à la question posée juste à côté de sa réponse, un peu comme perplexity.

Bonne journée.

Merci, toujours bon à savoir.

Bonsoir

Si un jour vous souhaitez 'consulter' une IA avec un besoin particulier de confidentialité LUMO, l'IA de Proton est à prendre en considération

Un ouvrage et un penseur à découvrir, pas en lien direct avec l'IA, bien que...
L'ELOGE DU BUG (ou comment savoir si l'IA fonctionne bien si on ne sait pas pour quoi elle est sensée servir?)