AI Red TeamService de Pentest IA

Documentation AI Red Team

Guide complet du service de test de penetration pour vos chatbots, assistants IA et systemes LLM.

Vue d'ensemble

AI Red Team est un service de test de penetration specialise pour les systemes d'intelligence artificielle. Notre equipe teste vos chatbots, assistants IA et agents autonomes contre 8'000+ prompts d'attaque connus et decouverts par notre R&D.

... patterns de detection proprietaires
23 categories d'attaque couvertes
Tests sur 3 couches de vulnerabilite
Rapport detaille avec livraison securisee (OTP)

Niveaux de Service

Trois forfaits adaptes a la taille et complexite de vos systemes IA.

Standard

Intrusion reussie vers 1 actif protege

CHF 2'990

par engagement

Jusqu'a 50 cibles5 jours
  • Jusqu'a 50 cibles testees
  • Critere de succes: 1 actif protege atteint
  • Tests d'injection de prompts
  • Tentatives de jailbreak
  • Rapport PDF synthetique
  • Appel debriefing 1h
Populaire

Advanced

Atteinte de 3 actifs definis

CHF 3'590

par engagement

Jusqu'a 200 cibles10 jours
  • Jusqu'a 200 cibles testees
  • Critere de succes: 3 actifs proteges atteints
  • Attaques multi-vecteur
  • Contournement RBAC
  • Tests multilingues (50+ langues)
  • Rapport detaille + roadmap
  • Session de formation equipe

Enterprise

Multi-LLM, 8000+ prompts testes

CHF 9'900

par engagement

Cibles illimitees20 jours
  • Cibles illimitees
  • Test Multi-LLM (toutes vos apps IA)
  • 8000+ prompts d'attaque connus testes
  • Red Team complet (... patterns)
  • Tests chaine d'approvisionnement LLM
  • Simulation APT
  • Presentation board-ready
  • Debrief sur site

Methodologie de Test

Nous analysons les 3 couches de vulnerabilite de vos systemes IA.

Couche LLM

Resistance aux jailbreaks et contournements d'alignement

  • Jailbreaks (DAN, Developer Mode, STAN)
  • Contournement d'instructions systeme
  • Extraction de system prompt
  • Manipulation de contexte
  • Confusion de role

Couche Application

Vulnerabilites du wrapper applicatif

  • Injection de prompts indirects
  • Exfiltration de donnees RAG
  • Manipulation de session
  • Escalade de privileges
  • Bypass de filtres

Couche Integration

Abus des outils et APIs connectes

  • Abus de function calling
  • RAG poisoning
  • Injection SQL via LLM
  • Execution de code non autorise
  • SSRF via plugins

23 Categories d'Attaque

Nos tests couvrent l'ensemble des vecteurs d'attaque connus, alignes sur OWASP LLM Top 10.

DIRECT_OVERRIDE

Contournement direct des instructions

ROLE_MANIPULATION

Manipulation du role de l'IA

EXTRACTION

Extraction d'informations protegees

FORMAT_TOKENS

Abus de tokens speciaux

FAKE_AUTHORITY

Usurpation d'autorite

DAN_JAILBREAK

Jailbreaks de type DAN

ROLEPLAY_ATTACK

Attaques par jeu de role

HYPOTHETICAL

Scenarios hypothetiques malveillants

EMOTIONAL

Manipulation emotionnelle

GRADUAL_BOUNDARY

Erosion progressive des limites

CONTEXT_EXPLOIT

Exploitation du contexte

ENCODING

Contournement par encodage

TECHNICAL

Attaques techniques avancees

MODEL_INFO

Extraction d'info modele

HARMFUL_BEHAVIOR

Induction de comportement nuisible

SENSITIVE_QUERY

Requetes sensibles

DATA_EXFILTRATION

Exfiltration de donnees

Types de Systemes Testables

Nous testons tout systeme integrant un LLM.

Chatbots

Support client, vente, FAQ

Assistants internes

RH, IT, juridique

Agents autonomes

AutoGPT, CrewAI, LangGraph

Copilots

Code, documents, productivite

Systemes RAG

Bases de connaissances

GPTs Custom

ChatGPT Teams, plugins

Workflows IA

n8n, Make, Zapier + IA

APIs LLM

Integrations directes

Livrables

Ce que vous recevez a la fin de l'engagement.

Rapport Detaille

  • Score de vulnerabilite global (0-100)
  • Breakdown par categorie (23 categories)
  • Liste des vulnerabilites trouvees avec criticite
  • Preuves d'exploitation (PoC) pour chaque faille
  • Recommandations priorisees par impact
  • Regles Prompt Guard suggerees

Resume Executif

  • Synthese pour COMEX/CISO (2 pages)
  • Risques business identifies
  • Comparaison avec benchmarks sectoriels
  • Plan de remediation en 30/60/90 jours

Livraison Securisee

Le rapport PDF est livre via un lien a usage unique avec code OTP envoye par SMS. Expiration apres 72h ou premier telechargement.

Processus d'Engagement

Un processus structure en 4 etapes.

1

SOW & Acompte

Jour 0

Signature du Statement of Work definissant le perimetre et les regles d'engagement. Versement de l'acompte de 60%.

SOW signeFacture acompte
2

Reconnaissance

Jours 1-2

Analyse des chatbots cibles, identification des providers LLM, cartographie des fonctionnalites et points d'entree.

Inventaire IAPlan de test
3

Execution des Tests

Jours 3-X

Lancement des ... patterns de detection, tests manuels avances, attaques multi-vecteur selon le niveau choisi.

Logs de testsVulnerabilites
4

Rapport & Paiement Final

Jour final

Compilation du rapport, presentation des resultats, debriefing. Solde de 40% a la livraison.

Rapport PDFFacture solde

Questions Frequentes

Pret a securiser vos IA?

Demandez un devis personnalise ou contactez notre equipe pour discuter de vos besoins.

Ou contactez-nous: redteam@adlibo.com