🆎➖ Transcription
Speaker 0 | 00:00.172
Bonjour à toutes et tous, un peu de news IA pour commencer cette vidéo. Elon Musk attaque OpenAI, nous verrons que cela n'est pas gagné. Et puis du côté des outils IA, je vous propose de faire un peu de musique, ou du moins de faire faire un peu de musique dans l'intelligence artificielle. Et ici nous verrons ce que nous pourrons nommer les prémices de l'arrangement. avec l'IA. Alors, rien n'échappera à l'IA. C'est au tour de la 3D également de passer par sa magie. Là encore, il y a de quoi être surpris avec un outil simple, rapide et très efficace. J'évoquerai aussi quelques mises à jour à ne pas rater sur Pinocchio et d'autres outils locaux. Il y aura une bonne surprise pour la fin. Alors en fait, entre le moment où j'ai écrit cette vidéo et le moment où je l'ai tournée, un outil génial est arrivé et je vais vous en parler également, juste après l'actualité de l'intelligence artificielle, alors restez connectés. Donc oui, Riffifi dans le monde de l'IA avec un Elon Musk qui porte plainte contre OpenAI, réplique quasi immédiate de ce dernier, en effet OpenAI, contre le procès d'Elon Musk en publiant des emails démontrant son accord avec les plans de financement et la stratégie de l'entreprise, contre disant ainsi... Ces accusations. OpenAI insiste sur son engagement pour développer une intelligence artificielle générale bénéfique pour l'humanité tout en restant indépendant de Microsoft contrairement à l'Université de Paris. aux affirmations de Musk. Les emails révèlent que Musk a encouragé une augmentation significative du financement, soulignant la nécessité de milliards pour réussir. OpenAI projette donc fort de ses emails de faire annuler les accusations de Musk en justice le plus vite possible. News numéro 2 à présent avec Stability AI qui s'est associé à Tripo AI pour lancer Tripo SR qui est un modèle novateur capable de générer des modèles 3D de haute qualité presque instantanément. à partir d'une simple image. Il surpasse d'autres modèles ouverts comme OpenLRM en termes de vitesse et de qualité. Cette performance est accessible à tous indépendamment de la configuration matérielle. Car oui, ce qui est vraiment bluffant, vous pourrez le constater vous-même si vous me suivez jusqu'au bout, TripOSR, grâce à un système à i doté de millions de paramètres, analyse les images 2D pour créer des représentations 3D. Pour arriver à ça, il a été formé sur un ensemble de données de près d'un million de paramètres. millions d'objets 3D qui combinent des rendus synthétiques et des captures du monde réel. Son point fort est de rester très efficace même sans GPU haut de gamme. Cette avancée promet de transformer les processus de création dans divers domaines en offrant aux créateurs une nouvelle manière de concrétiser leurs idées en 3D. Démo dans quelques minutes. Et en troisième news, nous avons Cloud 3. Anthropique annonce que son chatbot Cloud 3 surpasse ChatGPT et Gemini de Google dans plusieurs domaines. benchmark clé atteignant des performances quasi humaines dans certaines tâches. Cloud3, qui inclut trois versions, AIQ, Sonnet et Opus, offre un accès gratuit à AIQ et Sonnet, tandis qu'Opus, le plus avancé, est proposé via un abonnement mensuel. Opus supporte texte et images et peut être intégré dans des applications via son API. Alors Anthropic précise que Cloud3 excelle en raisonnement de niveau universitaire et dans le traitement de données complexes. Je n'ai pas encore testé... pas eu le temps mais j'ai lu plusieurs retours qui soulignaient à minima que les tests c'est une chose et que la production en est une autre donc à voir. Et si vous vous avez testé j'aimerais bien savoir ce que vous en pensez et dites le nous dans les commentaires merci d'avance. Oui produire des contenus pour Youtube c'est vraiment un gros travail alors pour m'aider à produire plus de vidéos et soutenir mon travail ici merci de cliquer ci-dessous sur le pouce vers le haut, de vous abonner si ce n'est pas encore fait et d'activer la cloche qui vous préviendra des prochaines vidéos. Prochaine publication. Et si vous pouvez partager cette vidéo sur vos réseaux, ce serait vraiment génial. Je vous remercie. Une dernière news, Mistral a dévoilé Mistral Large, son nouveau modèle LLM avancé qui est désormais accessible via la plateforme Azure de Microsoft. Alors bye bye la souveraineté IA française. Selon la startup, ce nouveau modèle excelle dans le raisonnement et le multilinguisme avec une fenêtre de contexte étendue et des fonctionnalités d'appel de fonction pour... s'intégrer au système existant. Donc, autre modèle, Mistral Small, optimisé pour la latence et le coût, complète cette nouvelle offre. Les deux modèles bénéficient d'innovations comme le mode JSON Output qui va permettre une intégration facile dans les flux de travail. Alors, avec ces nouveaux modèles, Mistral ambitionne de révolutionner l'usage de l'IA et de la capacité de l'IA à se développer. hautement performante et personnalisable. J'ai hâte de tester, mais nulle trace d'une libération de ces nouveaux modèles en open source. Si vous avez des infos sur le sujet, je suis... également preneur. Allez un peu d'action à présent avec des mises à jour de l'IA qui génère en trois dimensions du son et j'oubliais un petit cadeau que je vous garde pour la fin. Alors si comme moi vous utilisez djann.ai pour certains travaux IA donc avec les multiples modèles que l'on peut charger dessus et bien sachez que la prochaine fois que vous le lancerez si ce n'est pas déjà fait bien vous aurez une mise à jour de proposé c'est assez intéressant puisque ça met à jour le serveur API qui va vous vous permettent donc d'attaquer ces modèles directement en local via des scripts que vous pourrez faire. Donc ça, c'était pour Janai. Maintenant, on passe à Olamin. Alors, comme vous le savez, OpenWebUI, dont j'ai parlé dans une des dernières vidéos, fonctionne de pair avec Olamin, qui est un exécutable qui permet de gérer les modèles sur votre ordinateur. Et donc, lui aussi doit se mettre à jour. Généralement, vous le retrouvez ici en bas. Alors, pardon, je vais changer ça. Voilà. il est chargé constamment ici même au démarrage et donc lui va vous proposer une mise à jour, faites-le parce que voilà ce sont des performances en plus et sans doute des possibilités, des bugs résolus, donc voilà je l'ai fait. Puisque je parle d'OpenWebUI, je voulais vous faire voir quand même les résultats qu'on peut obtenir avec le modèle Mixtral donc dans sa dernière version, là en un seul jet, alors bon j'ai un prompt qui demande d'abord un plan comme d'habitude et à partir de ce plan je lui demande donc la rédaction de l'article final, eh bien en une seule traite, c'est un article de pas moins de 1200 mots qui est produit et que l'on n'a plus, qu'a publié ensuite sur un site web vraiment... C'est de bonne qualité, voire même parfois de très bonne qualité. J'avoue que j'utilise de plus en plus ce modèle au sein de OpenWebUI. J'aimerais savoir si vous aussi, vous avez adopté ce type d'outil pour générer vos contenus. Alors voici le premier outil qui déboule sur nos bécans, qui va me permettre de passer de cette image là que vous voyez actuellement à l'écran, à celle-ci. Voilà. Donc c'est un NubScaler. qui permet en quelque sorte de restaurer une image qui serait trop compressée, trop petite, qui aurait perdu ses détails ou qui est tout simplement floue. Eh bien oui, on peut obtenir ce genre de résultat directement sur nos bécanes. Désormais, je vous présente Supir. Je vous mettrai le lien en description. Là, on est sur la page de Xpixel, le groupe qui nous donne ce modèle Supir à utiliser dans un cadre non commercial. et voici un premier exemple de ce que c'est capable de faire donc là au départ on voyait on a une image fortement compressé et flou et voici ce que supire est en mesure de faire voyez que c'est vraiment impressionnant et ça ne s'arrête pas là pour du paysage voilà ce que cela donne donc au départ on a ça À l'arrivée, nous avons ça. Et bien entendu, sur du portrait, cela fonctionne aussi. Donc, pour nos images IA, cela fonctionne parfaitement. Voilà, que ce soit des animaux... des images de jeux vidéo, comme vous pouvez le voir, le résultat est excellent, et même en restauration comme ça d'images cinéma, on voit toutes les utilités que cet outil peut avoir. Donc là, il marche très bien sur des images trop compressées, ou qui manqueraient de définition. Et bien, là on le voit encore, vous voyez, sur des vieilles images qui... qui manquerait de définition, voilà ce que l'on peut obtenir. On va voir tout de suite ce qu'il en est sur cette machine. Pour utiliser Stupir, c'est simple. Si vous avez Pinocchio et une carte Nvidia, vous pourrez l'utiliser et bénéficier de ses prouesses. Effectivement, il faut absolument une carte Nvidia pour le moment, mais dans une prochaine version, il est possible que cela change. En tout cas, c'est ce que dit le développeur de Pinocchio. Voilà, mais... Pour l'instant, il n'a pas trouvé le moyen. Je vous fais voir donc tout simplement comment cela fonctionne. Donc là j'ai chargé une image, j'ai déjà fait le calcul pour qu'on ne perde pas de temps. Ici j'ai chargé une image, éventuellement vous pouvez donner un prompt en anglais ici, donc qui décrive l'image et sinon vous pouvez faire analyser l'image auparavant par un descripteur si vous le souhaitez. Moi je le fais dans DPL, et ça aidera l'IA à coller mieux à la restauration. Ensuite, un gros attention. Ici, vous avez la possibilité de choisir le niveau du Pscale, si vous le laissez à 1, et bien ça va le grossir déjà de deux fois, donc là on voit le résultat ici, mais je vais vous faire voir le résultat final quand même, vous avez des réglages assez classiques que l'on retrouve ici, et vous avez ici la possibilité de choisir entre les deux. La qualité, la fidélité. Moi, pour avoir fait pas mal de tests ici, je n'ai pas vu de grosses différences. C'est très subtil, donc peut-être que dans certains cas c'est plus visible. Moi, je n'ai pas vu de grosses différences à chaque fois. Donc, je tiens juste à vous dire que si vous augmentez l'upscale ici, eh bien, ça augmente plus que nettement le temps de calcul. Là, pour restaurer cette image-là, on met à peu près 1 minute, 1 minute 30. Mais ça peut aller à 10 minutes. voir un peu plus une fois j'ai attendu 25 minutes le résultat donc évidemment attention à vos réglages parce que parce que ça peut être très long et c'est un peu les prémices de ça alors regardez le résultat donc là avant après avec un upscale bien vous voyez si je puis dire il n'y a pas photo on obtient vraiment un gain et comme vous l'avez vu sur certaines photos avec du flou etc et bien c'est assez magique et donc ça c'est supire sur Pinocchio pour tout le monde sur sa machine si on a une carte Nvidia et une machine pas trop ancienne bien sûr. Oui Stability AI s'est associé avec Tripo AI pour nous faire un modèle qui permet à partir d'une seule image de nous générer donc des objets 3D et voici par exemple les résultats donc on lui donne cette image là et Tripo SR nous sort en sortie un petit modèle 3D et j'ai déjà pu voir sur twitter que des Les gens qui ont les lunettes de chez Apple, donc en réalité virtuelle, se servent de ça pour générer des contenus qu'ils introduisent ensuite dans leur univers virtuel en un instant. Et vous allez voir, c'est vraiment très très rapide parce qu'effectivement, la force de ce système, c'est que ça travaille très vite, même sur des... Petite machine, donc si vous avez une machine puissante, ça ira d'autant plus vite. Il faut vraiment quelques secondes, vous allez le voir, pour obtenir des résultats. Alors bien sûr, on va comparer à l'existant. Donc là, on a l'autre modèle qui avait le vent un peu en flou, mais on voit que le résultat, c'est quand même de l'à peu près. Alors que Tripos SR, ici, dans sa version Ours, nous donne des objets qui sont fermés, qui fonctionnent. En tout cas, ce n'est pas de la très haute résolution 3D, mais déjà, pour certains besoins, Ça peut aller. Et ce qu'il faut savoir, c'est que ce n'est que le début, bien entendu. Donc, tout cela va s'améliorer. Et oui, la 3D va aussi passer à la moulinette de l'IA. Passons à la pratique à présent. Donc là, j'ai installé Tripo SR via Pinocchio, bien sûr. Ça, c'est tellement pratique, Pinocchio. Et vous avez ici déjà des objets d'exemple. Alors, je vous fais voir. Par exemple, je vais charger ici. une image 2D de cette chaise, donc on n'a pas d'information sur l'arrière, bien entendu, et le modèle, donc quand on va lancer ici la génération, on va tout d'abord extraire... la chaise du fond et nous donner ce résultat. Et regardez, désormais, nous avons un modèle 3D. Là, on peut le manier à la souris très pratiquement. Et bien sûr, on peut le télécharger. Alors justement, là, il y a quelque chose d'intéressant. On a deux formats. Le développeur de Pinocchio a rajouté le format GLB ici en sortie. n'était pas là initialement et ça c'est assez génial même si vous trouvez que le rendu ici est moins bon sachez que pour l'exportation et la réutilisation dans un autre logiciel et bien ce format là est vraiment de meilleure qualité à tout point de vue donc je vais d'ailleurs vous faire voir un résultat d'exporter exploité ailleurs par exemple je vais aller ici voilà sur ce petit viewer online et je vais faire glisser déplacer un des modèles déjà obtenus voilà et et là je l'ai en noir et blanc mais vous voyez que la définition de l'objet est vraiment pas mal je sais pas pourquoi je l'ai en noir et blanc d'ailleurs tiens je vais changer ici de viewer voilà celui-là est mieux je crois alors je prends le même je le glisse déplacer et voilà notre petit hamburger vous pouvez voir que le rendu est pas mal et puis là vous avez quelques réglages voilà sur l'exposition voilà vous voyez vous pouvez changer le type d'objectif de la caméra bref voilà on peut faire à peu près ce que l'on veut et ça ça peut s'imprimer bien sûr en 3d ou ça peut s'installer dans un univers virtuel alors qu'est ce qu'il en est si par exemple cette fois ci alors on a ce mignon petit robot là allez on se le génère vous voyez que c'est vraiment très rapide Donc d'abord l'image est détourée quand c'est nécessaire et en retour nous obtenons ici, voilà, l'objet en 3D et ça, ça marche pour tout ce que vous avez ici. A présent, ce que je vais faire, c'est que je vais importer une image que j'ai faite moi dans Midjourney ou je ne sais plus, peut-être pas Midjourney ça, c'est peut-être plutôt idéogramme, je ne sais plus. Eh bien, regardons ce que ça nous donne. Vous voyez, l'image est détourée automatiquement et nous obtenons ici, en retour. Voilà, une... un objet 3d et donc voilà c'est super j'en ai encore une autre ici à tester si vous voulez bien voilà ça c'est une image je sais pas tout ça le sort voilà mais c'est détouré et voyons voir ah c'est pas c'est pas parfait j'ai les pattes du cheval qui partent dans tous les sens en tout cas voilà ça c'est tripot et serre et je pense que ça vaut le coup et même si vous avez une toute petite main avec Pinocchio, vous pourrez utiliser cet outil, c'est très très sympa. Alors dernier outil IA sur Pinocchio avant ma petite surprise dans un instant, il s'agit de Zita ici, et c'est un outil qui permet en quelque sorte d'arranger de la musique grâce à un prompt. Alors ce n'est pas avec ça qu'on va faire le prochain tube, mais par contre c'est assez rigolo, et ça nous donne encore une belle perspective de ce que l'IA va nous permettre de réaliser. et dans peu de temps même si là voilà c'est un peu brut ça va s'améliorer on le sait ça progresse sans arrêt et est donc l'arrangement Paria c'est une étape prochaine pour la musique donc voilà on connaît Shino avec qui on a fait pas mal de choses qui est passé dans une nouvelle version que je vous invite à essayer j'en parlerai peut-être plus tard alors une fois que Zita est installé et lancé donc grâce à Pinocchio bien voici l'interface que nous obtenons ça reste simple ici en fait on amène un audio un extrait audio donc ça peut être plus ou moins long j'ai fait des tests avec des musiques assez longues pour évidemment plus de temps mais ça reste raisonnable et puis on peut servir aussi de boucles etc qu'on va pouvoir travailler et le principe ici c'est donc de charger de l'audio de ce côté là de donner un prompt de ce que l'on souhaite obtenir et puis ici on a le choix du modèle je vais rester sur ldm2 music parce que c'est assez efficace voyons on en a plusieurs à disposition on a le large ici et le audio est dm tout qui est plutôt pour du bruitage on va dire et puis ensuite on nous lance tout simplement on a la possibilité voilà de régler ici des donc d un source prompte et puis des traditionnels réglages que nous connaissons avec les outils alors ce que je vais faire ici parce que j'ai pas trop de choses sous la main on va utiliser un exemple ici donc un extrait ici de beethoven donc je vous Je vous fais écouter l'original ici. Voilà, j'espère que ce n'est pas trop fort parce que je n'entends pas en même temps que vous. Et puis le résultat ici, interprété par bien. Alors on va se charger un autre exemple, toujours avec Beethoven ici. Quoique, on va plutôt se faire ce modal jazz ici. Voilà l'original. Et vous voyez qu'ici on a un prompt qui à la fois demande et décrit ce que l'on veut obtenir et ce qu'il en veut. Donc nous avons bien le grand jeu, la base, etc. C'est plutôt rigolo. C'est le début. Et on a hâte de voir ce que nous donnera la suite de ce genre d'outils, parce que c'est assez fantastique quand même d'en arriver là. Et maintenant, je vous propose ma petite surprise. Allez, ma surprise, la voici, c'est un GPT Custom que j'ai fait dernièrement et que je partage avec vous, qui est très pratique. On m'a souvent demandé ce type d'outils, donc c'est un peu optimisé, bien sûr. Et là, on peut, par exemple, tout à fait lui donner, par exemple, un PDF. voilà je fais le transfert en glissé déplacé comme ceci voilà le chargement est fait tout simplement il n'y a pas besoin de lui dire quoi que ce soit on envoie et ce pdf donc va être synthétisé par synthétiseur donc voilà il lit le contenu et vous obtiendrez donc là on a voilà quelques pages dans ce pdf et nous obtenons un résumé complet de ce contenu. Vous voyez que c'est assez efficace, parce que là, on doit avoir 3 ou 4 pages faciles, et là, on a quelques lignes de synthèse, et on peut rapidement savoir ce qu'il y a dedans. Voilà, je peux vous le faire en version copier-coller ici, donc vous voyez, c'est tout ce contenu-là, et on peut lui envoyer tout pareil. Voilà, donc vous voyez que c'est quand même assez conséquent. Et nous devrions obtenir à peu près le même résultat. Donc effectivement... Vous pouvez aussi lui demander de le faire moins court éventuellement, ou plus court si ce n'est pas assez synthétisé. Donc j'espère que ça vous sera utile. Donc synthétiseur, je vous mets le lien en description. Faites-moi vos retours, ça m'intéresse toujours beaucoup. Voilà, la vidéo s'achève. J'espère que ça vous a plu, que ce soit les news ou les outils que je vous ai présentés. Je vous attends ci-dessous dans les commentaires pour recueillir vos avis, vos questions. Voilà, je suis toujours heureux d'y répondre. et d'échanger avec vous. Et sinon, je vous mets ici une vidéo parfaite pour continuer à vous amuser ou à créer avec Pinocchio et d'autres outils IA. Abonnez-vous, likez, partagez cette vidéo, ça me rend énormément service. Et je vous dis à bientôt. Gardez-vous bien. Au revoir.