Nous sommes très sensibles à l’énoncé du problème (Neurosciences 23)
Nous voilà donc tous devenus
statisticiens, des Monsieur Jourdain du calcul de probabilité. Mais sommes-nous
de bons statisticiens ? Ou faisons-nous des erreurs de calculs
quasi-systématiques ?
La réponse à cette deuxième
question est malheureusement oui : nous nous trompons souvent, et ce en
fonction de la formulation du problème. En effet, notre cerveau est fortement
influencé par la perception qu’il a de la situation, de ce qu’il en comprend ou,
si elle lui est présentée par un tiers, de comment cela a été fait.
Stanislas Dehaene reprend ainsi
les travaux de 1981 de Amos Tversky et
Daniel Kahneman, qui ont montré que nous étions influencés par la formulation
d’un problème. Le cas présenté alors était le suivant :
-
Deux
échantillons de personnes aux caractéristiques identiques sont soumis les unes
au problème 1, les autres au problème 2 :
o Problème 1 : Vous imaginez que les États-Unis
se préparent à l’arrivée d’une maladie asiatique dont on pense qu’elle va tuer
600 personnes. Deux programmes alternatifs de lutte sont proposés :
§ Si le programme A est choisi, 200 personnes
seront sauvés,
§ Si c’est le B, il y a 1/3 de chances que les 600
personnes seront sauvés, et 2/3 de chances que personne ne le soit.
o Problème 2 : La situation est la même, mais les
programmes proposés sont différents :
§ Si le programme C est adopté, 400 personnes mourront.
§ Si c’est le programme D, il y a un 1/3 de chances que personne ne meure,
et 2/3 que 600 meurent
-
Dans le
problème 1, les personnes choisissent le programme A à 72%, alors que dans le
problème 2, c’est le D qui est préféré par 78%.
-
Et
pourtant les programmes respectivement A et C, B et D sont identiques.
Manifestement,
notre cerveau statisticien n’a pas fait les calculs de la même façon : le
fait d’affirmer que 400 personnes vont mourir de façon certaine est-il
« vécu » comme une telle menace que le calcul en est faussé ?
Est-ce que la formulation plus complexe des hypothèses B et D rend le calcul
plus difficile, ce qui fait que nous traitons essentiellement l’énoncé des
programmes A et C ?
Autre
hypothèse avancée par Stanislas Dehaene : la difficulté du problème posé
suppose un traitement conscient, et donc la mobilisation de notre espace de
travail global, qui serait mal armé pour faire des calculs bayésiens Ce serait
nos processus inconscients, ces processus ultrarapides et massivement
parallèles qui seraient les plus efficaces pour évaluer correctement des plausibilités.
Finalement
nos processus conscients ne seraient capables de traiter que des problèmes
simples, et de type mono-causal.
A
l’appui de ceci, Stanislas Dehaene reprend une autre expérience, celle menée en
2007 par Krynski, T. R., & Tenenbaum, J. B.. La question posée portait
cette fois sur le cas du cancer :
-
0.3%
des adultes de 60 ans sont atteints d’un cancer colorectal.
-
La
moitié de ces cancers (50%) peuvent être détectés par un test.
-
Il y a
3% de chances que le test s’avère positif chez une personne qui n’a pas le
cancer.
-
Si le
test est positif, quelle est la probabilité que la personne ait effectivement
un cancer?
Les
résultats à ce test sont catastrophiques (essayez donc vous-mêmes de trouver la
réponse) : les réponses des médecins allaient de 1 à 99%, et la moitié
l’estiment à 50% ou 47%. Or la bonne réponse est 4,8%. (1)
Si
maintenant, on introduit une donnée supplémentaire comme la présence d’un kyste,
et que l’on formule le problème ainsi : « Il y a 0,3% des adultes qui
ont un cancer, et 3% qui ont un kyste. Si l’on a un kyste, le test sera
positif, alors que l’on n’a pas le cancer. », alors plus personne ne se
trompe, et tout le monde arrive à un résultat voisin de la réalité. Et pourtant
le problème reste le même.
Il
semble bien que nous ne sachions traiter convenablement que les problèmes où le
modèle causal est apparent…
(à suivre)
(1) Sur
10,000 personnes, 30 ont un cancer colorectal. Sur ces 30, la moitié, soit 15,
auront un test positif. Sur les 9970 autres, 3% soit 299 auront un test
positif. Parmi un échantillon de gens qui ont un test positif, quelle fraction
ont vraiment un cancer ? La réponse est donc 15 / (15+299), soit 4.8%