L'erreur IA la plus coûteuse que vous ayez commise l'année dernière

Si vous demandiez à une salle remplie de fondateurs, d'investisseurs et d'acteurs des médias spécialisés dans l'IA quelle a été leur plus grande erreur au cours de l'année passée, vous vous attendriez probablement à des réponses concernant le choix d'un mauvais modèle, un lancement trop précoce ou une mauvaise orientation produit.

Mais lors d'un dîner « Jeffersonien » que nous avons organisé hier soir au centre-ville de Palo Alto, la réponse qui revenait sans cesse était bien plus pragmatique.

La plupart des équipes ne maîtrisent toujours pas leurs dépenses liées à l'inférence.

Un nombre surprenant de personnes autour de la table ont admis ne comprendre pleinement le coût d'un projet qu'une fois celui-ci en ligne, en phase de mise à l'échelle et consommant beaucoup plus de puissance de calcul que prévu. Dans l'IA générative, en particulier dans les médias et la vidéo, les coûts peuvent augmenter discrètement en arrière-plan jusqu'à devenir impossibles à ignorer.

Ce qui relevait autrefois d'un problème d'ingénierie devient rapidement un problème commercial.

Cette discussion est née d'un dîner Jeffersonien sur invitation organisé par Atlas Cloud et ByteDance au Saint Michael’s Alley.

Le format était volontairement simple.

Pas de présentations.

Pas de supports commerciaux.

Pas de tables rondes.

Juste une longue table et une discussion partagée entre fondateurs, investisseurs, développeurs et professionnels des médias essayant de comprendre vers où se dirige l'IA.

Le brise-glace

Pour ouvrir la soirée, tout le monde a répondu à la même question :

« Quel mot utiliseriez-vous pour décrire l'industrie de l'IA aujourd'hui ? »

Cela s'est avéré être la manière idéale de commencer la soirée.

Les participants n'avaient pas besoin d'opinions polies ou d'arguments préparés. Ils ont simplement choisi un mot et expliqué pourquoi. Presque immédiatement, le ton de la table a changé. La discussion est devenue honnête, pratique et bien plus ancrée dans la réalité que les conversations habituelles des conférences.

À un moment donné, on pouvait ressentir le fossé entre l'enthousiasme et la prudence. Certains participants ont parlé de la rapidité de l'innovation. D'autres pensaient silencieusement à la facture d'infrastructure qui l'accompagne.

Le coût réel de l'IA

Une autre question a suscité l'une des discussions les plus intenses de la soirée :

« Quelle est l'erreur liée à l'IA la plus coûteuse que vous ayez commise l'année dernière ? »

Les réponses ont été franches.

Les équipes ont toujours du mal à prévoir les coûts de l'IA avant que les produits n'atteignent la phase de production. Beaucoup ont admis qu'ils subissaient encore les dépenses au lieu de les anticiper. Le défi n'est plus seulement de construire des produits d'IA. C'est de savoir s'ils peuvent fonctionner de manière durable à grande échelle.

À mesure que les produits de médias génératifs deviennent plus gourmands en calcul, le suivi des dépenses d'inférence devient tout aussi important que la qualité du modèle ou la vitesse de sortie.

Des démos à la production

Plusieurs conversations se sont concentrées sur la rapidité avec laquelle des modèles comme Seedance 2.0 comblent le fossé entre le contenu généré par IA et les flux de production traditionnels.

Mais l'accent n'était pas mis sur les démonstrations tape-à-l'œil.

La vraie discussion portait sur ce qui se passe après le stade du prototype.

Comment ces systèmes se comportent-ils sous des charges de travail réelles ?

Qu'arrive-t-il à la latence et aux coûts à mesure que l'utilisation augmente ?

Comment les entreprises équilibrent-elles la qualité de sortie et la rentabilité une fois les clients arrivés ?

Pour beaucoup de personnes autour de la table, la question n'est plus de savoir si les médias générés par IA fonctionnent. C'est évident. Le défi actuel est de les opérationnaliser de manière fiable, évolutive et financièrement durable.

Ce qui nous attend

À la fin de la soirée, une chose semblait évidente.

Certaines des meilleures discussions sur l'IA n'ont pas lieu sur les scènes de conférence ou sur les réseaux sociaux. Elles se déroulent dans des salles plus intimes où les développeurs peuvent parler ouvertement de ce qui fonctionne réellement, de ce qui échoue et de ce que personne n'a encore totalement résolu.

C'est l'objectif de ces dîners.

Nous prévoyons de continuer à organiser ces dîners chaque mois afin de réunir des opérateurs, des investisseurs et des développeurs réfléchis dans les domaines de l'IA générative, des médias et de l'infrastructure.

L'objectif est simple : créer un espace où les gens peuvent parler franchement de ce qui se passe réellement dans l'IA sans la pression des tables rondes, des pitchs ou des discours de façade.

Suivez Atlas Cloud sur LinkedIn pour être informé du prochain événement.

RETOUR À LA LISTE