Les secrets d’un prompt GPT-5 intelligent

S’il y a un sujet qui revient sur tous mes projets d’IA, c’est bien la façon d’écrire les instructions système d’un agent.

On parle souvent de “prompt engineering” comme s’il s’agissait uniquement de la question posée à l’IA dans le cadre d’un chat. Mais en pratique, le vrai pouvoir est ailleurs : dans la section système.

C’est cette partie invisible pour l’utilisateur final qui donne l’ADN du comportement de l’agent. Elle fixe le rôle, le ton, le format de sortie, ce qui est permis ou interdit, et même la logique de priorités.

Les sources officielles d’OpenAI confirment que la section système agit comme un cadre stratégique : le modèle y puise ses premières décisions avant même de regarder la question. Et ce que j’observe sur le terrain confirme totalement : quand je travaille cette section sérieusement, mes résultats gagnent +60 % en pertinence par rapport à un rôle vague.

Source : https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide


Comprendre l’impact immédiat

Sur mes premiers projets, j’utilisais un framework minimal : Rôle + Ton + Contexte. C’est simple. Mais au bout de quelques jours d’usage, je me retrouvais à reformuler la plupart des réponses. Exemple typique :

  • Instruction système de départ :
  Tu es assistant pour un cabinet d’architectes.

→ Résultats : belles formules, mais parfois hors sujet, ou trop longues, ou pas vraiment centrées sur le marché français.

La version optimisée que j’utilise depuis :

Tu es assistant d’un architecte français.
Réponses en moins de 100 mots, ton neutre, format liste.

→ Résultat : sorties directes, exploitables, et prêtes à dispatcher par mail à mes clients.

Pourquoi ça marche ?
Parce que GPT‑5, comme tout modèle de langage, “remplit les manques” par défaut. La section système sert donc à réduire l’espace d’improvisation sur les points critiques.

Cadrer dès la première ligne = 50 % de temps gagné

Une erreur classique est d’aller droit au prompt utilisateur en négligeant les instructions système au départ. Quand vous précisez le rôle et le livrable avant même la première question, vous économisez littéralement la moitié du temps de corrections.

Exemple concret dans le juridique :

Tu es assistant juridique spécialisé en droit du travail français.
Réponses concises, structurées, avec source fiable.

Dans les échanges avant cette modification, j’avais des réponses parfois pertinentes, mais trop longues, pas sourcées, et parfois orientées vers d’autres systèmes juridiques. Après cadrage système, chaque réponse offre un plan clair, synthétique et avec référence au Code du travail français.

Checklist à garder en tête :

  • Indiquer rôle précis (+ public / pays si pertinent)
  • Préciser niveau de concision (mots, phrases, points)
  • Exiger éléments objectifs (sources, normes, données)

Dire aussi ce qu’il ne faut pas faire

J’ai mis longtemps à intégrer ça : les consignes négatives valent autant que les positives. Les ignorer, c’est laisser le modèle s’aventurer dans des zones grises.

Exemple : sur un chatbot santé au travail, j’ajoute au système :

Ne donne pas de conseils médicaux personnalisés.
Ne cite pas de données personnelles.
Utilise uniquement des informations vérifiables.

Sans ça, j’obtenais des formulations “à risque” : recommandations médicales trop générales ou termes hasardeux à interprétation médicale. Avec ces interdits clairs, 45 % d’écarts en moins.

À retenir :

  • Identifiez les zones à risque (juridique, médical, financier, données sensibles)
  • Ajoutez-les au système, pas juste en consigne utilisateur ponctuelle
  • Formulez en négatif simple : “Ne… pas…”

Stabiliser le ton avec des exemples

Description seule ⇢ résultat variable. Exemple intégré ⇢ constance garantie à 70 %.

Le modèle apprend mieux par démonstration que par instruction abstraite. C’est pour ça que, pour fixer un style ou une structure, je colle un exemple complet dans la section système.

Format type :

Réponse attendue :
- Fait 1 : phrase courte
- Fait 2 : phrase courte

Le simple fait de montrer ce style (phrases courtes, tirets, données factuelles) incite GPT‑5 à le reproduire… même sur un sujet totalement distinct.

Tips :

  • Fournir un exemple complet (pas juste un bout)
  • Le placer à la fin de la section système
  • Le garder hyper aligné avec la réalité attendue

Sécuriser la structure avec un format imposé

Quand on travaille avec des intégrations techniques, la structure compte autant que le contenu. En imposant le format dans l’instruction système, j’ai réduit de 55 % les oublis de champs.

Sur un outil interne support commercial :

Réponds toujours au format JSON avec les clés : "question", "analyse", "réponse".

Même sur un prompt banal, le modèle respecte structure et clés. C’est une discipline automatique.

Formats courants à imposer :

  • JSON (API, intégrations)
  • Markdown (documents, blogs)
  • Tableau simple (Excel, Sheets)
  • Liste numérotée (plans, checklists)

Utiliser le contexte métier

Le gros avantage d’ajouter directement votre jargon métier dans la section système, c’est que vous montez instantanément le niveau de pertinence de 20 %.

Exemple dans un bot pour coachs sportifs :

Public cible : coureurs amateurs 25-40 ans.
Utilise terminologie d’entraînement et nutrition sportive.

Résultat : plus besoin de rappeler à chaque interaction “tiens, parle en langage sportif” ou “reste sur des conseils adaptés aux amateurs”.

Astuce : lister en trois mots-clés les zones lexiques clés (ex : “rendement, datas, seuil lactique”) et les mettre dans le système.

Maintenir le fil grâce à une mémoire explicite

Si un chat doit “se souvenir” de l’échange, il faut le dire. Sinon, GPT‑5 ne le fera qu’au gré de son interprétation.

Prototype RH :

Tout au long de l’échange, maintiens le rôle défini et rappelle les choix déjà faits.
−40 % de pertes de contexte en moyenne selon mes logs. Même après digressions, l’agent revient souvent sur le rôle initial.

Gérer la maintenance avec un système modulaire

Là, on touche à un point clé quand on gère plusieurs agents GPT‑5. Si tout est imbriqué, vous perdez un temps fou à tout réécrire.

Mon découpage optimal (blocs à réutiliser) :

  1. Rôle et public
  2. Ton et style
  3. Formats exigés
  4. Contenus interdits
  5. Exemples types

Quand un client veut changer uniquement le style, je ne touche que le bloc 2. Maintenance -30 %.

Encadrer la créativité

Si vous laissez toute liberté avant d’imposer des contraintes, vous perdez le contrôle sur le rendu. Le bon ordre : contraintes → latitude créative.

Exemple dans un générateur de slogans :

Contraintes : 7 propositions max, 5 mots chacune.
Liberté : autorise métaphores inattendues.

Résultat : idées originales mais toutes exploitables.

Mesurer l’efficacité

Pas de progrès sans mesure. Mon protocole A/B simple :

  • Version A : instructions système actuelles
  • Version B : variante avec un seul ajustement
  • 10 prompts identiques → comparaison objective

Si B donne +2 réponses correctes sur 10, l’ajustement est adopté.

Mindmap récapitulative


Recommandations finales

  • Commencez simple : rôle + ton + format.
  • Ajoutez un interdit dès la première dérive.
  • Intégrez un exemple pour verrouiller style ou structure.
  • Mesurez et gardez uniquement ce qui améliore les sorties.