Publication : L'actuariel 35 Janvier 2020

Les biais, ces invités indésirables

Du recrutement des sujets à la constitution de l’échantillon, différents types de biais sont susceptibles d’être introduits dans les études. En les identifiant, il est possible d’interroger leur influence sur les résultats et, parfois, d’en corriger les effets.

Angélique VALLEZ

Connaître son ennemi pour mieux le combattre. Dans les études, le biais est cet ennemi, aussi puissant que sournois, contre lequel il ne faut jamais baisser la garde. Puissant, parce qu’il a fait douter de nombreux experts, sournois parce que même les plus attentifs peuvent ponctuellement manquer de clairvoyance. À l’instar du « phénomène du 7 » qui a sévi quelques années durant. Pour résumer, des études avaient démontré que lorsque les personnes devaient choisir un chiffre entre 0 et 9, elles optaient en majorité pour le 7. Longtemps resté à l’état de mystère mathématique, ce phénomène a finalement été percé à jour par les statisticiens, qui se sont interrogés sur la question de l’échantillon… Toutes les études avaient été réalisées en Europe et en Amérique, où – des sept péchés capitaux aux sept nains – la culture des symboles pouvait influencer les personnes interrogées. Sur un échantillon mondial, l’équilibre des chiffres était rétabli. « Dans ce cas précis, le problème n’était pas mathématique, c’était simplement du bon sens. Mais il est parfois difficile d’y penser », admet Nicolas Gauvrit, mathématicien et chercheur en sciences cognitives, rattaché à l’École pratique des hautes études à Paris et auteur du livre Statistiques. Méfiez-vous ! (2007).

Pour Patrice Bertail, professeur de mathématiques à l’université Paris-Ouest-Nanterre-La Défense et à Télécom ParisTech, il s’agit d’un biais statistique dit de sélection. « Ce biais apparaît lorsque les caractéristiques de la population étudiée sont différentes de celles de la population générale », note-t-il dans son article « Algorithmes : biais, discrimination et équité », écrit avec trois autres professeurs de Télécom ParisTech. Ce biais de sélection est à l’origine d’un décalage potentiel des résultats. Les vertus de la luminothérapie peuvent être prises en exemple. De nombreuses études réalisées sur le sujet ont ainsi démontré un recul des états dépressifs à la suite d’une exposition à des lampes reproduisant les effets de la lumière naturelle. « Ces études sont sans doute de très grande qualité, avec des échantillons conçus avec soin. Mais elles ont toutes été faites en Scandinavie, dans des pays où il fait nuit six mois durant. Dans ce cas, nous imaginons bien volontiers l’effet positif de la lumière, mais le fait de généraliser les résultats obtenus sur cet échantillon à la population mondiale constitue une erreur », explique Nicolas Gauvrit.

Aucun secteur n’est à l’abri

Dans le domaine bancaire, des biais de sélection peuvent également être introduits. En effet, les établissements peuvent décider d’accorder ou non des crédits sur la base d’informations partielles. « Pour déterminer la catégorie de risque de l’emprunteur, les algorithmes calculent un score en se basant sur les personnes qui ont été éligibles à un emprunt dans un établissement particulier. Là où le bât blesse, c’est que l’algorithme ignore les dossiers de toutes les personnes à qui les banques ont refusé un prêt, celles qui n’ont jamais eu besoin d’emprunter, celles qui ont fini de rembourser leurs emprunts, et enfin celles qui ont des emprunts dans d’autres établissements », soulignent Patrice Bertail et ses confrères de Télécom ParisTech. Pour le professeur, ce type de biais est également susceptible d’intervenir dans le domaine de l’actuariat, les assureurs n’ayant pas accès à toutes les données de la population, mais d’abord à celles de leurs clients. « Le risque, c’est que ce biais de sélection s’auto­alimente et se reproduise, étant donné que le modèle étudié se nourrit des nouveaux clients ainsi sélectionnés », précise Patrice Bertail.

Lire la suite…