Comment gérer les instances EC2 sans écrire de scripts
Si vous gérez des instances EC2, vous avez probablement un dossier rempli de scripts. PowerShell pour les serveurs Windows, Python pour les appels API AWS, Bash pour les machines Linux. Chacun soigneusement conçu, documenté (peut-être), et de plus en plus difficile à maintenir.
Voici le problème : les scripts cassent. AWS met à jour une API, une bibliothèque Python devient obsolète, ou un nouveau membre de l’équipe ne comprend pas la syntaxe PowerShell. Soudain, vous passez plus de temps à maintenir votre automatisation qu’à gérer réellement votre infrastructure.
Et si vous pouviez simplement… demander ce dont vous avez besoin ? En français. Sans syntaxe à mémoriser, sans scripts à maintenir, sans connaissances tribales à préserver.
C’est ce qu’offre la gestion d’infrastructure assistée par IA. Laissez-moi vous montrer comment ça fonctionne.
Le problème de la maintenance des scripts
D’abord, soyons honnêtes sur ce à quoi ressemble l’automatisation traditionnelle.
Exemple : Vérifier l’état de santé des instances
La méthode PowerShell :
# Vérifier la santé EC2 dans toutes les régions
$regions = Get-EC2Region | Select-Object -ExpandProperty RegionName
foreach ($region in $regions) {
Set-DefaultAWSRegion -Region $region
$instances = Get-EC2Instance
foreach ($reservation in $instances) {
foreach ($instance in $reservation.Instances) {
$status = Get-EC2InstanceStatus -InstanceId $instance.InstanceId
if ($status.Status.Status -ne "ok") {
Write-Host "UNHEALTHY: $($instance.InstanceId) in $region"
Write-Host " System Status: $($status.SystemStatus.Status)"
Write-Host " Instance Status: $($status.InstanceStatus.Status)"
}
}
}
}
Problèmes avec cette approche :
- Plus de 20 lignes de code pour une simple vérification
- Besoin de mémoriser la syntaxe PowerShell
- Gestion manuelle des régions AWS
- Gestion des erreurs non montrée (ajoutez 10 lignes de plus)
- Les nouveaux membres de l’équipe ont besoin de formation
- Casse quand AWS change l’API
La méthode assistée par IA
Vous : "Montrez-moi les instances EC2 en mauvaise santé dans toutes les régions"
IA : J'ai trouvé 2 instances en mauvaise santé :
┌──────────────────────┬───────────┬─────────────────┬──────────────┐
│ Instance ID │ Région │ Nom │ Problème │
├──────────────────────┼───────────┼─────────────────┼──────────────┤
│ i-abc123 │ us-east-1 │ web-server-03 │ Status check │
│ i-def456 │ eu-west-1 │ api-server-12 │ System check │
└──────────────────────┴───────────┴─────────────────┴──────────────┘
Voulez-vous que j'investigue ce qui cause ces problèmes ?
Avantages :
- Langage naturel - pas de syntaxe à mémoriser
- Fonctionne immédiatement - pas de script à écrire
- Gère toutes les régions automatiquement
- Résultats formatés pour les humains
- Peut approfondir avec des questions de suivi
Vous voyez la différence ? Voyons comment cela fonctionne réellement.
Comment fonctionne la gestion EC2 assistée par IA
La technologie derrière ceci est Amazon Bedrock avec Claude - le modèle IA d’Anthropic qui comprend à la fois le langage naturel et l’infrastructure technique.
Ce qui se passe en coulisses
Quand vous demandez : “Montrez-moi les instances EC2 en mauvaise santé”
Claude comprend votre intention
- Vous voulez des informations sur la santé des instances
- À travers votre infrastructure
- Concentré sur les problèmes
Génère le bon code
- Choisit PowerShell/Python/Bash selon le contexte
- Inclut la gestion d’erreurs appropriée
- Gère les identifiants AWS et les régions
S’exécute en toute sécurité
- Les opérations en lecture seule s’exécutent automatiquement
- Les modifications nécessitent votre approbation
- Toutes les actions sont enregistrées
Présente les résultats clairement
- Tableaux formatés, pas de JSON brut
- Met en évidence ce qui compte
- Suggère les prochaines étapes
Exemple concret : Dépannage d’une instance lente
Voici à quoi ressemble une vraie session de dépannage :
Vous : "Pourquoi i-abc123 est-elle si lente ?"
IA : Vérification de l'instance i-abc123 (web-server-03)...
Problème trouvé :
🔴 CPU : 95% d'utilisation (dernière heure)
🟢 Mémoire : 42% utilisée (normal)
🟢 Réseau : Trafic normal
🔴 Disque I/O : Opérations de lecture très élevées
Processus consommant le plus de CPU :
1. mysqld - 78% CPU
2. apache2 - 12% CPU
Cause racine : Requêtes MySQL sans index appropriés.
Requêtes lentes récentes trouvées dans mysql-slow.log
Recommandations :
A) Ajouter des index pour corriger les requêtes lentes (je peux vous montrer lesquels)
B) Augmenter la taille de l'instance de t3.medium → t3.large
C) Déplacer la base de données vers RDS pour de meilleures performances
Que souhaitez-vous faire ?
Vous : Montrez-moi les requêtes lentes
IA : Top 3 des requêtes lentes de la dernière heure :
1. SELECT * FROM orders WHERE user_id = X
Temps moyen : 8,2 secondes | Exécutée : 1 247 fois
Problème : Pas d'index sur la colonne user_id
2. SELECT * FROM products JOIN categories...
Temps moyen : 3,1 secondes | Exécutée : 892 fois
Problème : Scan complet de la table products
3. SELECT COUNT(*) FROM logs WHERE date > ...
Temps moyen : 2,4 secondes | Exécutée : 445 fois
Problème : Pas d'index sur la colonne date
Je peux générer les instructions ALTER TABLE pour ajouter ces index.
Voulez-vous que je vous montre les commandes ?
C’est la gestion d’infrastructure conversationnelle. Pas de scripts nécessaires, pas de clics dans la console AWS, juste décrire ce dont vous avez besoin.
Cas d’usage pratiques
Laissez-moi vous montrer quelques scénarios réels où cela bat le scripting traditionnel.
1. Vérifications rapides de santé
Approche traditionnelle : Exécuter votre script de vérification, analyser la sortie, corréler les problèmes Approche IA : “Tous mes serveurs de production sont-ils en bonne santé ?”
L’IA vérifie :
- État de l’instance
- Vérifications système
- Santé de l’application (si surveillance configurée)
- Erreurs récentes dans les logs
- Connectivité réseau
Et vous dit ce qui ne va vraiment pas, pas juste des métriques brutes.
2. Investigation des coûts
Approche traditionnelle : Écrire des requêtes AWS Cost Explorer, exporter les données, analyser dans des feuilles de calcul Approche IA : “Quelles instances EC2 coûtent le plus ce mois-ci ?”
Obtenez des réponses instantanées comme :
- Top 10 des instances par coût
- Suggestions de redimensionnement
- Instances fonctionnant 24/7 qui pourraient être planifiées
- IP élastiques inutilisées qui vous coûtent encore
3. Audits de sécurité
Approche traditionnelle : Multiples commandes AWS CLI, analyser le JSON, comparer avec les docs de conformité Approche IA : “Montrez-moi les groupes de sécurité autorisant SSH depuis 0.0.0.0/0”
Claude comprend les bonnes pratiques de sécurité et peut :
- Trouver les groupes de sécurité trop permissifs
- Identifier les volumes EBS non chiffrés
- Repérer les instances sans correctifs récents
- Vérifier les violations de conformité
4. Réponse aux incidents
Approche traditionnelle : Se réveiller à 2h du matin, se connecter au VPN, exécuter des scripts de diagnostic, lire les logs, dépanner Approche IA : Recevoir une alerte dans Teams, demander “Qu’est-ce qui ne va pas avec les serveurs de production ?”
L’IA peut :
- Diagnostiquer les problèmes à partir des symptômes
- Vérifier les logs automatiquement
- Suggérer des étapes de remédiation
- Exécuter des correctifs avec votre approbation
- Documenter ce qui s’est passé
Tout cela depuis votre téléphone dans Microsoft Teams.
Support multi-langage : L’arme secrète
Voici quelque chose qui rend la gestion assistée par IA incroyablement puissante : elle parle toutes les langues.
Besoin de gérer des serveurs Windows ? Claude génère du PowerShell. Besoin d’automatisation API AWS ? Claude écrit du Python. Besoin de commandes serveur Linux ? Claude produit du Bash.
Exemple de scénario :
Vous : "Vérifiez l'espace disque sur tous les serveurs Windows et nettoyez les logs si certains dépassent 80%"
IA : Je dois :
1. Interroger EC2 pour les instances Windows (AWS SDK - Python)
2. Envoyer des commandes PowerShell via SSM Run Command
3. Vérifier l'espace disque (PowerShell)
4. Compresser les anciens logs si nécessaire (PowerShell)
En cours...
Résultats :
✓ web-server-01 : 62% utilisé (sain)
✓ web-server-02 : 58% utilisé (sain)
⚠ web-server-03 : 87% utilisé - Compressé 15 Go de logs → maintenant 68%
✓ api-server-01 : 71% utilisé (sain)
Tous les serveurs sont maintenant sains.
Claude a généré et exécuté :
- Code Python pour interroger AWS
- SSM Run Command pour exécuter sur les instances
- Commandes PowerShell pour vérifier l’espace disque
- Scripts PowerShell pour compresser les logs
Vous n’avez rien eu à écrire.
Ceci est important car :
- Vous n’avez pas besoin de maîtriser chaque langage
- Les nouveaux membres de l’équipe n’ont pas besoin de formation extensive
- Le “bon outil” est utilisé automatiquement
- Vos scripts ne deviennent pas de la dette technique
En savoir plus sur l’automatisation multi-langage dans notre guide sur l’intégration API REST PowerShell.
Sécurité d’abord : Workflows d’approbation
Une préoccupation valide : “Et si l’IA fait quelque chose de destructeur ?”
Les outils d’infrastructure assistés par IA comme Ohlala SmartOps incluent des mécanismes de sécurité intégrés avec des workflows d’approbation :
- Opérations en lecture seule (requêtes, vérifications de santé) → s’exécutent automatiquement
- Modifications (démarrer/arrêter, changements de config) → nécessitent approbation
- Actions destructrices (terminer, supprimer) → nécessitent confirmation explicite
Cela signifie que vous pouvez poser des questions et investiguer les problèmes en toute sécurité sans vous soucier des modifications accidentelles. L’IA explique ce qu’elle va faire avant d’apporter des modifications, et vous approuvez chaque étape.
Pour un guide approfondi sur la sécurité IA et les workflows d’approbation, consultez notre guide dédié sur ce sujet (à venir).
Démarrer
Vous voulez essayer la gestion EC2 assistée par IA ? Voici comment commencer :
1. Commencez par les opérations en lecture seule
Commencez par utiliser l’IA pour :
- Vérifications de santé
- Analyse des coûts
- Audits de sécurité
- Investigation des logs
Construisez la confiance avec des opérations sûres avant de passer aux modifications.
2. Intégrez avec Microsoft Teams
Exécuter les opérations dans Teams offre :
- Visibilité : Tout le monde voit ce qui se passe
- Collaboration : Les membres de l’équipe peuvent contribuer au dépannage
- Documentation : L’historique du chat = journal des opérations
- Accessibilité : Fonctionne sur desktop et mobile
Découvrez pourquoi Teams est idéal pour le DevOps dans notre FAQ.
3. Configurez les workflows d’approbation
Définissez ce qui nécessite approbation :
- Ingénieurs juniors : Approuver tout sauf les requêtes
- Ingénieurs seniors : Approuver les changements en production
- Astreinte : Permissions de contournement d’urgence
4. Surveillez et apprenez
Suivez :
- Quelles opérations sont exécutées
- Temps gagné vs écriture de scripts
- Incidents résolus plus rapidement
- Taux d’adoption par l’équipe
Le test de réalité
Est-ce vraiment mieux que les scripts ?
Pour certains scénarios - absolument. Pour d’autres - les scripts ont encore du sens.
La gestion assistée par IA excelle à :
- Investigations ponctuelles
- Dépannage complexe
- Questions qu’on ne peut pas pré-scripter
- Intégration des nouveaux membres de l’équipe
- Réponse rapide aux incidents
Les scripts traditionnels gagnent encore pour :
- Tâches planifiées hautement répétitives
- Exigences de contrôle ultra-précis
- Environnements isolés
- Situations nécessitant des performances à la milliseconde
La meilleure approche ? Utilisez les deux. Laissez l’IA gérer l’inattendu, gardez les scripts pour l’automatisation prévisible.
Consultez nos guides sur la gestion d’erreurs PowerShell et les bonnes pratiques de journalisation pour construire de meilleurs scripts quand vous en avez besoin.
Prochaines étapes
Prêt à essayer la gestion EC2 assistée par IA ?
Option 1 : Commencez avec Ohlala SmartOps
- Gestion EC2 assistée par IA dans Microsoft Teams
- 199 $/mois tarif fixe
- Pas de frais par instance
- Commencez sur AWS Marketplace
Option 2 : Construisez le vôtre
- Utilisez Amazon Bedrock + Claude directement
- Plus de configuration requise
- Personnalisation complète
- Lire la documentation AWS Bedrock
Des questions ?
L’ère du maintien de centaines de scripts d’infrastructure se termine. La gestion d’infrastructure en langage naturel est là, et elle fonctionne mieux que vous ne l’imaginez.
Articles connexes :
- Gestion EC2 Windows avec PowerShell - Comparaison approche traditionnelle
- Intégration API REST PowerShell - Construction d’automatisation scriptable
- Gestion d’erreurs en PowerShell - Quand vous avez besoin de scripts
- Utilisation des LLMs pour le codage - Développement assisté par IA