5 sept. 2012

NOUS N’ARRÊTONS PAS DE FAIRE DES ERREURS DE CALCUL

Nous sommes très sensibles à l’énoncé du problème (Neurosciences 23)
Nous voilà donc tous devenus statisticiens, des Monsieur Jourdain du calcul de probabilité. Mais sommes-nous de bons statisticiens ? Ou faisons-nous des erreurs de calculs quasi-systématiques ?
La réponse à cette deuxième question est malheureusement oui : nous nous trompons souvent, et ce en fonction de la formulation du problème. En effet, notre cerveau est fortement influencé par la perception qu’il a de la situation, de ce qu’il en comprend ou, si elle lui est présentée par un tiers, de comment cela a été fait.
Stanislas Dehaene reprend ainsi les travaux de 1981 de Amos Tversky et Daniel Kahneman, qui ont montré que nous étions influencés par la formulation d’un problème. Le cas présenté alors était le suivant :
-        Deux échantillons de personnes aux caractéristiques identiques sont soumis les unes au problème 1, les autres au problème 2 :
o   Problème 1 : Vous imaginez que les États-Unis se préparent à l’arrivée d’une maladie asiatique dont on pense qu’elle va tuer 600 personnes. Deux programmes alternatifs de lutte sont proposés :
§  Si le programme A est choisi, 200 personnes seront sauvés,
§  Si c’est le B, il y a 1/3 de chances que les 600 personnes seront sauvés, et 2/3 de chances que personne ne le soit.
o   Problème 2 : La situation est la même, mais les programmes proposés sont différents :
§  Si le programme C est adopté,  400 personnes mourront.
§  Si c’est le programme D,  il y a un 1/3 de chances que personne ne meure, et 2/3 que 600 meurent
-        Dans le problème 1, les personnes choisissent le programme A à 72%, alors que dans le problème 2, c’est le D qui est préféré par 78%.
-        Et pourtant les programmes respectivement A et C, B et D sont identiques.
Manifestement, notre cerveau statisticien n’a pas fait les calculs de la même façon : le fait d’affirmer que 400 personnes vont mourir de façon certaine est-il « vécu » comme une telle menace que le calcul en est faussé ? Est-ce que la formulation plus complexe des hypothèses B et D rend le calcul plus difficile, ce qui fait que nous traitons essentiellement l’énoncé des programmes A et C ?
Autre hypothèse avancée par Stanislas Dehaene : la difficulté du problème posé suppose un traitement conscient, et donc la mobilisation de notre espace de travail global, qui serait mal armé pour faire des calculs bayésiens Ce serait nos processus inconscients, ces processus ultrarapides et massivement parallèles qui seraient les plus efficaces pour évaluer correctement des plausibilités.
Finalement nos processus conscients ne seraient capables de traiter que des problèmes simples, et de type mono-causal.
A l’appui de ceci, Stanislas Dehaene reprend une autre expérience, celle menée en 2007 par Krynski, T. R., & Tenenbaum, J. B.. La question posée portait cette fois sur le cas du cancer :
-        0.3% des adultes de 60 ans sont atteints d’un cancer colorectal.
-        La moitié de ces cancers (50%) peuvent être détectés par un test.
-        Il y a 3% de chances que le test s’avère positif chez une personne qui n’a pas le cancer.
-        Si le test est positif, quelle est la probabilité que la personne ait effectivement un cancer?
Les résultats à ce test sont catastrophiques (essayez donc vous-mêmes de trouver la réponse) : les réponses des médecins allaient de 1 à 99%, et la moitié l’estiment à 50% ou 47%. Or la bonne réponse est 4,8%. (1)
Si maintenant, on introduit une donnée supplémentaire comme la présence d’un kyste, et que l’on formule le problème ainsi : « Il y a 0,3% des adultes qui ont un cancer, et 3% qui ont un kyste. Si l’on a un kyste, le test sera positif, alors que l’on n’a pas le cancer. », alors plus personne ne se trompe, et tout le monde arrive à un résultat voisin de la réalité. Et pourtant le problème reste le même.
Il semble bien que nous ne sachions traiter convenablement que les problèmes où le modèle causal est apparent…
(à suivre)
(1) Sur 10,000 personnes, 30 ont un cancer colorectal. Sur ces 30, la moitié, soit 15, auront un test positif. Sur les 9970 autres, 3% soit 299 auront un test positif. Parmi un échantillon de gens qui ont un test positif, quelle fraction ont vraiment un cancer ? La réponse est donc 15 / (15+299), soit 4.8%

Aucun commentaire: