Catégories : Architecture, IA, Data, Cloud Computing, Culture Tech
Résumé
Ce talk présente le retour d'expériences portant sur la conception et la réalisation technique de deux plateformes baremetal multi-tenant on-premise (Datalake et IA) au sein de Monaco-Telecom, filiale du groupe NJJ.
Contexte et Défis
La mission imposait des contraintes techniques et temporelles :
- Déploiement de 24 machines on-premise (8 GPU NVIDIA H200, 600TB NVMe, 11TB RAM, 1920 cœurs physiques, interconnexion 100GbE)
- Contrainte budgétaire : pas de produits propriétaires soumis à un coût de License.
- Objectif de reconstruction complète des plateformes en moins de 24 heures
- Développement conjoint des deux plateformes avec exigences de résilience multi-zone, en 6 mois !
- Relation client fournisseur : découplage entre les intégrateurs de la plateforme et les solutions techniques qui vont la consommer
Approche Technique
Nous détaillerons l'écosystème technologique choisi pour garantir souveraineté, performance et maintenabilité :
- Orchestration Kubernetes avec gestion multi-tenant via CapsuleProject et fédération d'identités Keycloak
- Stockage distribué haute performance avec Rook Ceph
- Systèmes d'exploitation immutables (CoreOS) pour la sécurité et la reproductibilité
- Intégration GPU NVIDIA via l'opérateur GPU-Operator
Architecture en Couches et Crash & Burn
L'approche adoptée suit un modèle bottom-up par incréments successifs. Chaque nouvelle couche importante (infra, orchestration ou application) est validée par une reconstruction périodique complète des plateformes. Cette capacité de “crash & burn” garantit que la reproductibilité est maintenue à chaque étape, transformant chaque ajout en opportunité de validation plutôt qu'en risque d'instabilité.
Modèle Reproductible au sein du Groupe NJJ
L'expérience acquise constitue un modèle transférable aux autres sociétés de la holding NJJ. La communication continue et les boucles de feedback constituent le noyau de confiance permettant ce déploiement à plus grande échelle.
On exposera les cas d'usage pour le projet Datalake (optimisation des antennes radios) et de l'IA (speech to text, local LLM etc.). On manipule des données qui doivent rester sur le sol monégasque, d'où l'initiative des projets.
L'Humain Face à la Complexité
Au-delà des aspects techniques, ce projet soulève des questions fondamentales sur la place de l'ingénieur dans un monde de plus en plus dicté par l'IA :
- Communauté vs Solitude : Comment transformer la perception de solitude du contributeur individuel en force collective au sein de la communauté des ingénieurs cloud
- Contre-pied de l'IA : Face au discours “il y a qu'à, il faut qu'on…“, nous démontrons que seul l'humain peut gérer ses frustrations et naviguer dans les dangers des couches d'abstraction
- Peur de l'inconnu : La maintenance et les risques cachés derrière les abstractions nécessitent une vigilance humaine que l'automatisation ne peut remplacer
- Relever la Mission Impossible :
- Qu'est-ce qui permet de transformer l'impossible en réalité ? L'expérience accumulée, la diversité des compétences, la curiosité intellectuelle, le courage et la capacité à gérer sa propre peur face à des contraintes extrêmes.
Valeur pour les Participants
Ce retour d'expérience offre aux architectes et ingénieurs :
- Une vue approfondie sur les choix d'architecture pour des plateformes souveraines en environnement PME
- Les compromis entre performance, coût et maintenabilité
- Les bonnes pratiques de résilience et de reprise après sinistre
- Une réflexion sur le rôle de l'ingénieur dans l'ère de l'IA
Ce talk démontrera qu'il est possible de construire des plateformes cloud d'entreprise robustes et performantes sans dépendre de solutions propriétaires, en s'appuyant exclusivement sur des technologies Open-Source, tout en rappelant que derrière chaque ligne de code se trouve un humain dont l'expertise, la résilience et la capacité à gérer l'incertitude restent irremplaçables.
Mots-clés : Cloud Souverain, Kubernetes, Baremetal, Multi-Tenant, IA, Datalake, Open-Source, Rook Ceph, NVIDIA GPU, PME, Culture Tech, Ingénierie Humaine
Back-end & Cloud computing
Tech talk (50 min)
Intermediate
English