La forme normale est surtout adaptée à la représentation des jeux simultanés.
Nous allons maintenant nous intéresser à des jeux séquentiels où les décisions sont prises à des moments différents et chaque joueur peut être amené à jouer plusieurs fois.
Pour représenter ces jeux où le déroulement du temps est important, nous allons utiliser la forme extensive ou l'arbre du jeu.
Exemple 3 : Le pilote et le terroriste
Un terroriste monte sur l'avion Strasbourg-Paris.
Après 10mn de vol, quand le terroriste s'approche du pilot et le menace de faire exploser l'avion s'il ne n'atterritatterit pas à Damas.
Le pilote a le choix entre continuer le vol vers Paris ou d'adopter la direction de Damas :
Après avoir observé le choix du pilote, le terroriste a le choix entre faire exploser la bombe ou abandonner :
L'arbre suivant représente ce jeu :
Le premier noeud de cet arbre représente la décision du premier joueur.
A la suite de chacun de ses choix, la possibilité est donnée au joueur suivant d'effectuer son choix.
Une fois que tous les joueurs ont pris leurs décisions, on arrive à un résultat du jeu auquel les gains correspondants sont associés.
Ainsi l'arbre permet-il de faire apparaître les gains associés aux différents résultats possibles.
Comme chaque joueur peut être amené à prendre de décisions plusieurs fois (donc à des noeuds différents) nous devons préciser le concept de stratégie pour en tenir compte.
Une stratégie du joueur (notée ) est un plan d'action complet qui spécifie une action pour chaque noeud où le joueur doit adopter une décision.
Retour à l'exemple
Le pilote n'a qu'un seul noeud de décision.
Ses stratégies contiennent alors une action unique :
Le terroriste a deux noeuds de décisions : un après le choix de Damas par le pilote et un après Paris .
Ses stratégies doivent donc préciser une action à chacun de ces noeuds :
Un résultat du jeu est la combinaison des stratégies des différents joueurs de manière à nous permettre de faire dérouler totalement le jeu :
Nous pouvons alors associer un noeud terminal et les gains correspondants pour chaque résultat
La définition des stratégies que nous venons d'introduire nous permet de représenter aisément ce jeu sous une forme normale :
Nous pouvons alors examiner les équilibres de ce jeu :
Un nouveau concept d'équilibre va permettre ce résultat.
L'équilibre de Nash est soutenue par la menace du terroriste de faire exploser l'avion si le pilote décide de prendre la direction de Paris. Est-ce raisonnable?
En effet, si le pilote décide effectivement d'aller à Paris le terroriste a les gains suivants :
Devant le fait accompli, le terroriste choisira donc de ne pas exploser la bombe.
Par conséquent, s'il était amené à exécuter effectivement sa menace (suite au choix de Paris), il n'aurait pas intérêt à le faire.
Par conséquent, cet équilibre de Nash est basé sur une menace non-crédible.
Nous ne devons donc pas tenir compte de cet équilibre de Nash.
Le concept d'EPSJ vise justement à éliminer ce type d'équilibre basés sur des actions qui ne seront jamais adoptées si le joueur concerné est effectivement confronté à ce choix.
En fait, chaque fois que le terroriste doit choisir entre faire éclater la bombe et abandonner, il aura intérêt à abandonner pour obtenir un gain plus élevé.
Nous devons donc éliminer tous les équilibres qui contiennent cette action et .
Le seul EPSJ de ce jeu est donc
Pour éliminer cette menace non-crédible, nous avons étudié le choix optimal de terroriste chaque fois qu'il devait prendre une décision (donc à chacun de ses noeuds de décisions).
Nous pouvons généraliser cette démarche en introduisant le concept de sous-jeu.
Un sous-jeu est l'ensemble formé par un noeud de décision du jeu original et tous les noeuds qui en découlent directement. Quand ce sous-jeu est différent du jeu original, on l'appelle une sous-jeu propre.
Le jeu de notre exemple possède clairement trois sous-jeux : le jeu original et deux sous-jeux propres.
Un résultat est un équilibre parfait en sous-jeux (EPSJ) s'il correspond à un équilibre de Nash dans chaque sous-jeu du jeu original.
Par conséquent, un EPSJ doit être un équilibre de Nash du jeu original car ce dernier correspond à un des sous-jeu.
Naturellement, chaque équilibre de Nash du jeu original n'est pas nécessairement un EPSJ comme l'a montré notre exemple. Le seul EPSJ est
Pour chercher les EPSJ d'un jeu on utilise l'induction vers l'amont (backward induction).
Le pilote choisit alors de continuer vers Paris et nous avons l'équilibre