Home >> Blog >> KubeCon Paris 2024 – Intelligence Artificielle avec Kubernetes et l’Avenir Cloud Native

KubeCon Paris 2024 – Intelligence Artificielle avec Kubernetes et l’Avenir Cloud Native

07 avril 2024

Une kubecon sous le thème de l’AI en fêtant les 10 ans de Kubernetes !

Quel événement cette année ! Le plus grand de toute l’histoire de la Cloud Native Computing Foundation (CNCF) ! avec plus de 12 000 personnes !
Même en 3 jours de conférence, il était difficile de faire le tour, énormément de conférences, sponsors, discussions, soirées sponsors, …
Déjà plus de 10 ans de Kubernetes !
A cette occasion la CNCF propose que vous soumettiez votre logo du 10ème anniversaire de Kubernetes!: https://www.linuxfoundation.org/kubernetes-10-year-logo-contest

Sans surprise, le thème majeur de la Kubecon était l’Intelligence Artificielle en mode Cloude Native avec Kubernetes, mais pas que !
Voici un résumé, non exhaustif, des conférences qui m’ont intéressé en regroupant par thématiques:

Intelligence Artificielle: « Kubernetes doit devenir le standard de l’IA »
Supply Chain: une plateforme unique !
WASM: La tendance WebAssembly
Sustainability: l’innovation responsable
Infrastructure-as-Code: L’Invisible Omniprésent !
Observabilité et OpenTelemetry
Platform Engineering: le retour d’expérience
Kubernetes: évidemment !
Securité: reste un sujet majeur

Intelligence Artificielle: « Kubernetes doit devenir le standard de l’IA »

La première keynote de Priyanka Sharma (Executive Director, Cloud Native Computing Foundation) s’est ouverte sur l’Intelligence Artificielle.
Le cloud Native n’échappera pas à cette tendance AI mais à clairement besoin de standards et d’outils.
Clairement, tout ça est en route et prendra une part importante dans cette accélération de l’IA avec le partage de modèles, de processus et de savoir-faire:

« Kubernetes doit devenir le standard de l’IA », Priyanka Sharma.

Training & Inference

L’entraînement est la première phase d’un modèle d’IA. Le « training » peut impliquer un processus d’essais et d’erreurs, ou un processus consistant à montrer au modèle des exemples d’input et d’output.
La phase d’inférence représente l’exécution d’un modèle une fois qu’il a déjà été entraîné. Ainsi, l’inférence intervient après les étapes d’apprentissage. On peut également parler de phase de déploiement sur le terrain du modèle d’IA. Et donc, à cette étape, le modèle d’intelligence artificielle est déjà pré-calculé et a déjà été modélisé à l’aide de jeux de données (data sets). Ainsi, à ce moment, les systèmes d’intelligence artificielle peuvent tirer des conclusions ou des prédictions à partir des données ou connaissances qu’ils ont apprises.

Kubernetes et la CNCF se positionnent maintenant sur l’ensemble et utilisent la plateforme d’orchestration aussi bien pour gérer le cycle de vie du Machine Learning (AI/ML/LLM Ops) que pour faire tourner les modèles et les applications.
Un nouveau groupe de travail de la CNCF, la Cloud Native AI a publié un livre blanc sur les aperçus des techniques récentes d’IA/ML.

Introduction à l’initiative Cloud Native Artificial Intelligence (CNAI):
Broken Chain

Cette tendance amène des évolutions de Kubernetes en particulier sur :

Le support des GPU : En particulier avec les drivers Nvidia
Nouvelles techniques de partage de GPU pour maximiser son utilisation
Dynamic Resource Allocation (DRA) : Nouvelle façon de demander des ressources disponibles dans k8s 1.26+
Apparition de nouveaux outils/opérateurs Kubernetes : exemple avec KAITO : Kubernetes AI tools operator qui simplifie l’expérience d’exécution de modèles OSS AI sur vos clusters AKS
Optimisation en utilisant des LLMs locaux : Ollama

Self-Hosted LLMs on Kubernetes: A Practical Guide – Hema Veeradhi & Aakanksha Duggal, Red Hat

Les modèles de langage de grande taille (LLMs) gagnent rapidement en popularité et l’idée de déployer et de gérer son propre LLM peut être très intéressant, surtout en matière de sécurité, confidentialité, et customisation. Ce talk nous guide à travers le processus vers une compréhension claire et pratique de l’auto-hébergement des LLMs sur Kubernetes.

Auto-hébergement : Avantages et Considérations

Pour ou contre l’auto-hébergement ? Cela dépend de cas d’usage spécifiques. Les modèles hébergés peuvent être nécessaires pour des raisons de confidentialité, de fiabilité ou de conformité.
Avantages de l’auto-hébergement :
- Sécurité, confidentialité et conformité accrues.
- Personnalisation avancée.
- Évite le verrouillage par un fournisseur.
- Réduction des coûts computationnels.
- Facile pour les débutants ou ceux qui commencent tout juste dans le domaine.

Implémentation:

l’exemple s’est basé sur Whisper pour le modèle de reconnaissance vocale
Containerisation du modèle : Utilisation de Docker ou Podman.
Service du modèle et interface : Mise en œuvre de FastAPI sur Kubernetes.
Utilisation de HuggingFace pour sélectionner un model compressé (.ggml)
La UI a été faite via Streamlit
voir le détail de la démo: https://github.com/redhat-et/whisper-self-hosted-llm

Hosted LLM

Voici la liste des LLMs Opensource
et un papier sur « tracking openness of instruction-tuned LLMs

SONATIVE™️ DevOps

SONATIVE™️ Cloud

SONATIVE™️ Agile

SONATIVE™️ App

SONATIVE™️ DevOps

SONATIVE™️ Cloud

SONATIVE™️ Agile

SONATIVE™️ App

Nos dernières actualités

KubeCon Paris 2024 – Intelligence Artificielle avec Kubernetes et l’Avenir Cloud Native

Une kubecon sous le thème de l’AI en fêtant les 10 ans de Kubernetes !

Intelligence Artificielle: « Kubernetes doit devenir le standard de l’IA »

Training & Inference

Self-Hosted LLMs on Kubernetes: A Practical Guide – Hema Veeradhi & Aakanksha Duggal, Red Hat

Future of Intelligent Cluster Ops: LLM-Azing Kubernetes Controllers – Rajas Kakodkar, VMware & Amine Hilaly, AWS

Supply Chain: une plateforme unique !

SLSA: Supply-chain Levels for Software Artifacts

Supply Chain: La maturité de construction et de déploiement des containers

Building Container Images the Modern Way – Adrian Mouat, Chainguard

Misconfigurations in Helm Charts: How Far Are We from Automated Detection and Mitigation? – Francesco Minna, Vrije Universiteit Amsterdam & Agathe Blaise, Thales SIX

GitOps Continuous Delivery at Scale with Flux – Stefan Prodan

WASM : La tendance WebAssembly

Leveling up Wasm Support in Kubernetes – Matt Butcher, Fermyon

Sustainability: l’innovation responsable

Building IT Green: A Journey of Platforms, Data, and Developer Empowerment at Deutsche Bahn

Cloud Native Sustainability Efforts in the Community – TAG Environmental Sustainability – Antonio Di Turi, Data Reply Gmbh & Kristina Devochko, Independent

Observabilité et OpenTelemetry

OpenTelemetry: Project Updates, Next Steps, and AMA – Severin Neumann, Cisco; Austin Parker, Honeycomb; Trask Stalnaker, Microsoft; Daniel Gomez Blanco, Skyscanner; Alolita Sharma, Apple

Observability TAG: A Review and the Rise of Gen-AI Observability – Alolita Sharma & Matt Young, Apple; Vijay Samuel, eBay; Bartłomiej Płotka, Google

Infrastructure-as-Code: L’Invisible Omniprésent !

Crossplane Intro and Deep Dive – the Cloud Native Control Plane Framework – Jared Watts & Philippe Scorsolini, Upbound

The IaC Evolution – on Open Source & Everything Else – Sharone Zitzman, RTFM Please; Mandi Walls, PagerDuty; Roni Frantchi, env0; Solomon Hykes, Dagger.io; Eran Bibi, Firefly

Platform Engineering: le retour d’expérience

The State of Backstage in 2024 – Ben Lambert & Patrik Oldsberg, Spotify

Boosting Developer Platform Teams with Product Thinking – Samantha Coffman, Spotify

Kubernetes: évidemment !

10 Years of Kubernetes Patterns Evolution – Bilgin Ibryam, Diagrid & Roland Huss, Red Hat

Planning for Maturity: SIG Release’s Revamp for a More Stable Kubernetes – Adolfo García Veytia, Stacklok; Kat Cosgrove, Dell Technologies; Carlos Panato, Chainguard; Joseph Sandoval, Adobe

Network Policy: The Future of Network Policy with AdminNetworkPolicy – Surya Seetharaman & Andrew Stoycos, Red Hat; Hunter Gregory, Microsoft

Comparing Sidecar-Less Service Mesh from Cilium and Istio – Christian Posta, Solo.io

We Tested and Compared 6 Database Operators. The Results are In! – Jérôme Petazzoni, Tiny Shell Script LLC & Alexandre Buisine, Enix

Cloud Native Storage: The CNCF Storage TAG Projects, Technology & Landscape – Raffaele Spazzoli, Red Hat; Alex Chircop, Akamai

Sécurité: reste un sujet majeur !

Choose Your Own Adventure: The Struggle for Security – Whitney Lee, VMware & Viktor Farcic, Upbound

Conclusion

Laisser un commentaire Annuler la réponse