Atlas Cloud, leader des infrastructures d'IA haute performance et des services cloud de qualité entreprise, a fait forte impression sur la scène technologique mondiale lors de l'interview approfondie de son PDG Jerry Tang au New York Stock Exchange (NYSE) dans le cadre de la série « AI Factories – Centres de données du futur ». Tang a expliqué comment l'infrastructure d'IA, notamment le calcul GPU hyperscale et les plateformes neocloud, remodèle la transformation numérique — en particulier pour les secteurs exigeant sécurité, conformité et évolutivité, tels que les services financiers.
Une vision de l'intelligence opérationnelle au-delà de l'inférence
La mission d'Atlas Cloud n'est pas simplement d'accélérer l'inférence des modèles, mais de rendre l'intelligence opérationnelle, sécurisée et gouvernée à l'échelle de l'entreprise. L'entreprise positionne sa plateforme comme un runtime d'entreprise pour l'IA agentique, combinant l'inférence agnostique vis-à-vis des modèles, l'orchestration, la gouvernance et les agents autonomes au sein d'une architecture unifiée. Cette vision permet aux organisations d'exécuter des charges de travail d'IA complexes de manière sécurisée et efficace, avec un contrôle et une conformité en temps réel.
« Nous ne voulions pas seulement rendre l'inférence plus rapide — nous voulions rendre l'intelligence véritablement opérationnelle. » — Jerry Tang
Cette approche vise un avenir où l'IA ne se contente pas de soutenir les systèmes d'entreprise, mais devient un contributeur central à la prise de décision, à l'automatisation et aux flux de travail de l'entreprise — en particulier dans les secteurs réglementés où la confidentialité des données et le contrôle opérationnel sont primordiaux.
Infrastructure de pointe et innovation
La plateforme d'Atlas Cloud offre des capacités complètes permettant aux organisations de créer, déployer et mettre à l'échelle des solutions d'IA avancées :
- Infrastructure cloud GPU haute performance avec un accès sécurisé et évolutif à des clusters capables de supporter des charges de travail d'IA exigeantes.
- Services de modèles d'IA d'entreprise qui unifient l'accès aux principaux modèles d'IA avec une personnalisation simple et un déploiement sécurisé.
- Agents d'IA financière pour l'analyse autonome, l'aide à la décision et l'automatisation des flux de travail adaptés aux services financiers.
- Fonctionnalités de gouvernance sécurisée et de conformité conçues pour répondre aux besoins des secteurs hautement réglementés où la protection des données est non négociable.
Cette approche full-stack différencie Atlas Cloud de nombreux fournisseurs de cloud traditionnels, le positionnant comme un partenaire d'infrastructure de confiance pour les entreprises recherchant à la fois performance et conformité.
Atlas Inference : Transformer l'économie de l'IA
En 2025, Atlas Cloud a lancé Atlas Inference, une plateforme d'inférence d'IA de nouvelle génération développée en collaboration avec SGLang. Cette plateforme réduit considérablement les ressources GPU et serveur nécessaires pour exécuter des modèles de langage étendus (LLM), offrant un débit plus élevé et un coût opérationnel inférieur à de nombreuses solutions concurrentes.
Lors de tests de performance, les configurations d'Atlas Inference ont démontré un débit jusqu'à 2,1 fois supérieur par rapport aux configurations plus importantes d'autres grands fournisseurs de cloud, tout en utilisant moins de serveurs et en maintenant une faible latence — une avancée majeure pour les organisations qui ont besoin d'un déploiement d'IA évolutif et rentable.
« La capacité de notre plateforme à traiter des dizaines de milliers de tokens par seconde signifie que les entreprises peuvent rendre les services d'IA à haut volume rentables au lieu de simplement atteindre le seuil de rentabilité. » — Jerry Tang
Partenariats stratégiques et croissance durable
Atlas Cloud continue de se développer grâce à des partenariats industriels stratégiques qui renforcent son engagement en faveur d'une infrastructure d'IA durable et évolutive :
- Une collaboration majeure avec NewYork GreenCloud pour déployer des clusters GPU alimentés par des énergies renouvelables, dans le cadre d'une initiative plus large de 6 milliards de dollars pour un calcul d'IA durable, soulignant l'engagement à long terme d'Atlas envers une technologie respectueuse de l'environnement.
- Un partenariat avec Soluna Holdings pour soutenir les charges de travail avancées de traitement vidéo par IA sur du matériel économe en énergie, démontrant l'engagement d'Atlas Cloud envers des solutions de centres de données renouvelables et évolutives.
- L'expansion continue de ses services neocloud avec le recrutement de leaders tels que Suzanne Rabicoff en tant que Chief of Field, accélérant les stratégies de mise sur le marché pour l'adoption par les entreprises de l'infrastructure d'IA de nouvelle génération.
Ces collaborations s'alignent sur la conviction d'Atlas Cloud que l'innovation en IA doit être couplée à la durabilité et à l'excellence opérationnelle, permettant aux clients d'augmenter leur puissance de calcul sans compromettre leurs objectifs environnementaux ou réglementaires.
Responsabiliser les services financiers et l'économie de la confiance
Tout au long de l'interview au NYSE, Jerry Tang a souligné les défis uniques auxquels sont confrontées les institutions financières — en particulier les préoccupations liées à la confidentialité des données, à la conformité réglementaire et aux limites des offres de cloud public traditionnelles. L'architecture d'Atlas Cloud est conçue spécifiquement pour relever ces défis, offrant un environnement de calcul de confiance où les données financières sensibles peuvent être traitées et analysées en toute sécurité.
En permettant aux organisations financières d'exécuter des charges de travail d'IA complexes avec une gouvernance et une conformité totales, Atlas Cloud soutient la transformation des flux de travail à forte intensité de main-d'œuvre, libérant la productivité tout en gardant les risques sous contrôle strict.
Perspectives d'avenir : Une IA au service de l'entreprise
Alors que la demande en IA continue de s'accélérer, Atlas Cloud reste déterminé à faire progresser les plateformes qui rendent l'IA pratique, efficace et prête pour l'entreprise. La vision de Jerry Tang — partagée au NYSE — renforce la conviction de l'entreprise que l'avenir de l'intelligence ne réside pas seulement dans des modèles puissants, mais dans des systèmes qui intègrent le calcul, la gouvernance et des capacités au niveau applicatif pour un impact commercial réel.
Plateforme Atlas Cloud : Le premier runtime d'inférence multimodal unifié au monde
Au-delà de l'infrastructure et de la vision, Atlas Cloud redéfinit la manière dont les développeurs et les entreprises créent, déploient et mettent à l'échelle des applications d'IA grâce à sa plateforme — le premier runtime d'inférence multimodal complet et unifié au monde.
Conçue dès le départ pour les bâtisseurs d'IA moderne, la plateforme Atlas Cloud offre une seule API pour toutes les modalités, éliminant la fragmentation et la complexité liées à la gestion de multiples fournisseurs, SDK et environnements de déploiement.
Avec Atlas Cloud, les développeurs peuvent travailler de manière transparente sur :
- L'IA conversationnelle et l'inférence de modèles de langage étendus
- Le raisonnement avancé et les flux de travail agentiques
- La compréhension et la génération d'images
- Le traitement audio et l'intelligence vocale
- L'analyse vidéo et la perception multimodale
Le tout au sein d'une seule couche API cohérente.
Une API. Toutes les modalités. Prêt pour l'entreprise.
La philosophie de la plateforme Atlas Cloud est simple :
explorer, tester et mettre à l'échelle l'intelligence multimodale sans changer de plateforme.
Au lieu d'assembler des services distincts pour le texte, la vision, l'audio et la vidéo, Atlas Cloud fournit un tissu d'inférence unifié qui permet aux équipes de :
- Prototyper rapidement des applications multimodales
- Tester et comparer les modèles à travers les modalités
- Mettre à l'échelle les charges de travail de production avec des performances et une gouvernance cohérentes
- Maintenir une sécurité, une observabilité et une conformité de qualité entreprise
Cela réduit considérablement les frictions de développement tout en accélérant la mise sur le marché des produits alimentés par l'IA.
Conçu pour les développeurs, approuvé par les entreprises
Atlas Cloud comble le fossé entre l'expérience développeur et les exigences des entreprises :
- Conception axée sur le développeur avec des API claires, des performances prévisibles et une flexibilité agnostique vis-à-vis des modèles
- Gouvernance de qualité entreprise, y compris le contrôle d'accès, l'auditabilité et le déploiement conforme
- Inférence haute performance optimisée pour l'efficacité des coûts à l'échelle
- Transition transparente de l'expérimentation à la production, sans réarchitecture des systèmes
Qu'il s'agisse de créer des assistants IA de nouvelle génération, des agents multimodaux ou des pipelines d'automatisation intelligente, les développeurs peuvent se concentrer sur les capacités et les résultats — pas sur la complexité de l'infrastructure.
De l'inférence multimodale à l'intelligence agentique
La plateforme Atlas Cloud est plus qu'une passerelle d'inférence. Elle sert de fondation runtime pour l'IA agentique, permettant des systèmes intelligents qui raisonnent, perçoivent et agissent à travers les modalités en temps réel.
En unifiant l'inférence multimodale avec l'orchestration et la gouvernance, Atlas Cloud permet aux organisations de transformer l'IA de fonctionnalités isolées en une intelligence opérationnelle directement intégrée dans les flux de travail de l'entreprise.
L'avenir du développement d'IA, simplifié
Alors que les applications d'IA deviennent de plus en plus multimodales et autonomes, la plateforme d'Atlas Cloud offre une voie claire :
- Une plateforme
- Une API
- Une intelligence multimodale complète
- Conçu pour l'évolutivité, la sécurité et le déploiement en conditions réelles
Atlas Cloud ne se contente pas d'alimenter des modèles — il alimente la manière dont l'IA est construite, livrée et approuvée à l'échelle de l'entreprise.





