Comment gagner-gagner -
Synthèse des Rapoport-s de force
Re-parlons des cons. Ils le sont particulièrement ceux qui oublient autrui, le voient d'après leurs yeux, évacuent le fait qu'autrui soit différent : vivant. À part. Normal. Et là, sachant que la réponse est oui, est-ce que la théorie des jeux nous aide à y voir clair ?
(Pause.)
Allons-y, messieurs-dames.
La théorie des jeux, entre autres choses, emprunte à l'économie, à la biologie, à la psychologie (cf. théma psycho). La théorie des jeux, entre autres choses, se penche sur Mmh, je fais quoi ? sachant que je joue, comme bien souvent, une partie de poker avec quelqu'un. Cartes cachées. Avec ou sans flop. Alors, rapports de force ? Oui. Et recherche égoïste (court-termiste) - ou alors commune - d'un état stable voire gagnant. Gagnant-perdant, perdant-gagnant, perdant-perdant. Ou mieux : gagnant-gagnant. (Beaucoup mieux.)
Gagnant-gagnant, mécaniquement (au fil des parties, donc de la vie), découle de son petit frère : donnant-donnant (tit for tat). Qui est un programme. Historiquement, une émanation du biologiste et mathématicien d'origine russe Anatol Rapoport. Et dans la vie de tous les jours, un comportement-type, pour les intelligences artificielles, pour les colonies d'animaux, pour les humains, pour ce qu'on veut (vie en général).
Donnant-donnant, nous relate le grand Robert Axelrod, c'est quand un opérateur (un groupe ou bien vous) entame une partie (négociation, travail, discussion d'un contrat). Avec une idée simple à la clé :
1. Je commence en mode ok-ok (cf. Positions de vie). Si je joue en premier, je commence à tendre la main à l'autre (ex. : l'écouter, jouer le jeu, demeurer favorable),
2. Je persiste avec un bon esprit, s'il me re-tend la main le coup d'après, je fais pareil (donnant-donnant), et ainsi de suite,
3. S'il me tend un couteau, je lui en tends un aussi (donnant-donnant bis),
4. Dès qu'il se calme et re-tend la main, j'évacue volontairement son côté agressif et coopère à nouveau (gros challenge).
Look :
Fig . 1 - L'excellent boulot du cybernéticien Philippe Mathieu,
instigateur du projet Prison au Laboratoire d'informatique fondamentale de Lille
Ce qui peut faire dire que mon patron est un con s'il me tend au départ un couteau (1.), s'il me tend des couteaux aléatoires (2.), si je choisis de mieux faire et qu'il me tend à nouveau un couteau (4.).
Court-termiste. Un brin parano. Fierté mal placée ? raisonnements tordus ? rancune ?
Le couteau systématique, ou capricieux, c'est l'outil du con. Le couteau qui discerne (il sépare et trie), c'est l'outil du sage.
Regardons bien.
Si mon patron a du discernement, ce qui est le propre du bon manager, il me tend le couteau si et seulement si j'en tends un. Tous les autres moments, son ok-ok m'enseigne et me fait du bien. Il me renforce. Mieux : il me sécurise.
C'est le soupçon de l'autre qui m'insécurise donc me donne envie de montrer les dents. Au contraire, s'il sait (c'est tout un art) me saisir en flagrant délit de bonnes choses (voir Kenneth Blanchard), le patron me fait du bien. Me surprend. Me donne envie de grimper en compétences. De mieux faire. D'avancer.
C'est humain.
Reprenons donnant-donnant. Axelrod en tire des leçons. Pour lui, s'il est efficace, c'est que donnant-donnant :
1. Met sa foi dans l'autre et dans le jeu (c'est précieux la foi, c'est d'ailleurs du courage car ça annonce des claques possibles - je serre les fesses et me focalise sur les visées de long terme),
2. Observe et laisse l'autre jouer, délivre de la bienveillance donc bâtit sa réputation et sa légitimité (J'en ai le droit) en cas de riposte,
3. Discerne et rend les coups, donc corrige les cuistres et les outrecuidants (parce que les cons, ça ose tout, c'est même à ça qu'on les r'connaît), il les sort progressivement du jeu,
4. Se rend volontairement lisible, simple dit Axelrod, et persuasif. Compréhensible donc facile à suivre, à agréger parmi ses amis. Son mode d'emploi est clair. Sa relation ? Saine, rassurante. Sévère (capable de recadrages immédiats) et conciliante en cas de besoin (intervention du pardon).
Courageux ? Sage ? Exemplaire et capable de dépasser ?
Mmh.
L'a bien la pêche, ce donnant-donnant.
__
[ Anatol Rapoport, biographie | le bouquin d'Axelrod figure dans le carrousel de livres de la colonne de droite de ce blog | théorie des jeux, applications | animals | laboratoire LIFL - Regarder, dans le temps, l'efficacité de donnant-donnant (simulation) | grâce à Didier Müller, en savoir plus sur le comportement de 36 stratégies : Gentille, Méchante, Donnant-donnant, Méfiante, Rancunière, Easy-go, Per-ct, Per-tc, Per-cct, Per-ttc, Majo-mou, Majo-dur, Pas-mieux-mou, Pas-mieux-dur, Pas-5-mieux-mou, Pas-5-mieux-dur, Sondeur, Tft-dur, Tf2t-dur, Tf2t, Graduelle, Graduelle-tueuse, T-puis-per-ct, C-puis-per-cct, Per-ccctct, Per-cccct, Sondeur2, Sondeur3, Sondeur4, Sondeur-dur, Doubleur, Rancunier-mou, Pavlov, Tft-lent, Trois-tits-pour-un-tat et Lunatique - Et apprendre en jouant en ligne ]
Détaillons [...] quelques stratégies qui nous serviront ensuite.
On peut classer les stratégies suivant plusieurs critères, comme leur tendance à coopérer ou leur complexité de 'raisonnement'. Il y a tout d'abord les stratégies simples, comme Gentille qui coopère toujours, ou son opposé, Méchante, qui trahit toujours. La stratégie Donnant-donnant est aussi une des stratégies intéressantes. Cette stratégie, un peu plus complexe, commence par coopérer avec son adversaire, puis elle joue ce qu'a joué son adversaire à la partie précédente.
Nous avons aussi la stratégie Rancunière qui coopère dès le début mais dès que son adversaire trahit, elle trahit toujours.
Bien sûr, il y a aussi la stratégie Lunatique, qui joue au hasard, et donc trahit en moyenne une fois sur deux. Enfin, il existe des stratégies plus complexes comme Sondeur qui, aux 3 premières parties, joue t,c,c (trahir, coopérer, coopérer), puis, si aux parties 2 et 3, l'adversaire a coopéré, elle trahit toujours, sinon elle joue comme Donnant-donnant.
Diverses stratégies sont périodiques, c'est-à-dire qu'elles jouent les mêmes coups périodiquement (Gentille et Méchante sont périodiques 1).
Voici la liste exhaustive des stratégies implémentées :
Gentille : Je coopère toujours, [c]* ;
Méchante : Je trahis jamais,[d]* ;
Donnant-donnant : Je coopère à la 1e partie, puis je joue ce qu'a joué l'autre à la partie précédente ;
Méfiante : Je trahis à la 1e partie, puis je joue ce qu'a joué mon adversaire à la partie précédente ;
Rancunière : Je coopère, mais si que mon adversaire a trahi, je trahis toujours ;
Easy-go : Je trahis à la 1e partie, ensuite si on a trahi tous les deux à la partie précédente ;
Per-ct - Je joue : coopérer, trahir, coopérer, trahir, etc. [c,d]* ;
Per-tc - Je joue : trahir, coopérer, trahir, coopérer, etc., [d,c]* ;
Per-cct - Je joue : coopérer, coopérer, trahir, coopérer, coopérer, trahir, etc., [c,c,d]* ;
Per-ttc - Je joue : trahir, trahir, coopérer, trahir, trahir, coopérer, etc., [d,d,c]* ;
Majo-mou : Je joue ce que l'adversaire a joué en majorité, en cas d'égalité et à la 1e partie, je coopère ;
Majo-dur : Je joue ce que l'adversaire a joué en majorité, en cas d'égalité et à la 1e partie, je trahis ;
Pas-mieux-mou : Je joue en fonction du score de mon adversaire. Si le score de l'adversaire est plus grand que le mien : je trahis. Sinon je coopère. En cas d'égalité, je coopère ;
Pas-mieux-dur : Je joue en fonction du score de mon adversaire. Si le score de l'adversaire est plus grand que le mien : je trahis. Sinon je coopère. En cas d'égalité, je trahis ;
Pas-5-mieux-mou : Je joue en fonction du score de mon adversaire. Si le score de l'adversaire est plus grand que le mien : je trahis. Sinon je coopère. Score calculé sur les 5 derniers coups. En cas d'égalité, je coopère ;
Pas-5-mieux-dur : Je joue en fonction du score de mon adversaire. Si le score de l'adversaire est plus grand que le mien : je trahis. Sinon je coopère. Score calculé sur les 5 derniers coups. En cas d'égalité, je trahis ;
Sondeur : Aux 3 premières parties, je joue trahir, coopérer, coopérer. Si aux parties 2 et 3 l'adversaire a coopéré, je trahis toujours. Sinon, Donnant-donnant ;
Tft-dur : Je coopère sauf si l'adversaire a trahi au moins 1 fois dans les 2 derniers coups ;
Tf2t-dur : Je coopère sauf si l'adversaire a trahi au moins 2 fois de suite dans les 3 derniers coups ;
Tf2t : Je coopère sauf si l'adversaire a trahi 2 fois de suite ;
Graduelle : Je coopère. Dès que vus me trahissez, je trahis de plus en plus (coeff : 2) ;
Graduelle-tueuse : Je trahis toutes les 5 itérations et coopère toutes les 7. Sinon je coopère sauf si les coups 6 et 7 étaient trahis, alors je trahis. C-puis-per-tc ? Je coopère. Dès que l'adversaire trahit, je joue [d,c]* ;
T-puis-per-ct : Je trahis. Et dès que l'adversaire trahit, je joue [c,d]* ;
C-puis-per-cct : Je coopère. Et dès que l'adversaire trahit, je joue [c,c,d]* ;
Per-ccctct - Je joue : coopérer, coopérer, coopérer, trahir,coopérer, trahir, coopérer, coopérer, coopérer, trahir, coopérer, trahir, etc., [c,c,c,d,c,d]* ;
Per-cccct - Je joue : coopérer, coopérer, coopérer, coopérer, trahir, coopérer, coopérer, coopérer, coopérer, trahir, etc., [c,c,c,c,d]* ;
Sondeur2 : Je joue [d,c,c], puis si l'adversaire joue [d,c] en 2 et 3, alors je coopère toujours, sinon je joue Donnant-donnant ;
Sondeur3 : Je joue [d,c], puis si l'adversaire joue [c] en 2, alors je trahis toujours, sinon je joue Donnant-donnant ;
Sondeur4 Je joue [c,c,d,c,d,d,d,c,c,d,c,d,c,c,d,c,d,d,c,d], puis je calcule pendant cette période le nombre de coopérations alors que l'opposant trahit et le nombre de trahisons alors que l'opposant trahit. Si la différence entre les deux est plus grande que 2 : je trahis toujours. Sinon je coopère jusqu'à l'itération 25, puis joue Donnant-donnant ;
Sondeur-dur : Je joue [d,d,c,c], puis si l'adversaire joue [c,c] en 2 et 3, alors je trahis toujours, sinon je joue Donnant-donnant ;
Doubleur : Je coopère sauf si l'adversaire a trahi 2 fois plus qu'il a coopéré ;
Rancunier-mou : Je coopère au début. Je trahis 4 fois lorsque vous me trahissez. Je coopère 2 fois avant de re-trahir ;
Pavlov : La stratégie gagne-reste/perd-change a été introduite par Martin Nowak et Karl Sigmund. Elle coopère puis coopère, si et seulement si les 2 joueurs ont joué la même chose au coup précédent ;
Tft-lent : Je joue [c,c], puis si l'adversaire joue 2 fois de suite la même chose alors je joue le coup de l'adversaire sinon je répète le coup précédent ;
Trois-tit-pour-un-tat : Je coopère; je trahis trois fois de suite lorsque je suis trahi ;
Lunatique : Je trahis 1 fois sur 2 en moyenne. Je joue au hasard.
(c) Nicolas Eber, LARGE, Université Robert Schuman, Strasbourg 3 - [link]
Présentation par son auteur de l'ouvrage "Le dilemme du prisonnier", Editions La Découverte, collection Repères (n° 451), et quelques idées pour son utilisation dans l'enseignement :
[...]
1. Certaines études ont montré que les femmes coopèrent davantage que les hommes.
2. Chez des enfants âgés de 6 à 11 ans, on a observé un taux de coopération (c’est-à-dire un pourcentage de sujets optant pour la coopération) qui augmente avec l’âge, un résultat suggérant, en conformité avec certains principes de la psychologie de l’enfant, un apprentissage progressif des normes sociales de coopération.
3. Les étudiants en économie sont moins coopératifs que les autres !
4. Les étudiants anglo-saxons coopèrent moins que les autres.
5. Les traits de personnalité influencent le comportement face au jeu.
6. Les autistes ne se comportent pas différemment des sujets « normaux », mais ont une perception très différente du jeu.
7. La communication entre les joueurs renforce la coopération.
8. La coopération est plus forte lorsque les sujets se connaissent et partagent un esprit de groupe.
9. L’introduction d’un mécanisme de sanction peut renforcer la coopération, même si elle a parfois des effets pervers en introduisant une suspicion entre les joueurs qui peut inhiber certains comportements coopératifs.
10. La pression sociale (pression par les pairs) est un mécanisme incitatif à la coopération particulièrement puissant.