Interlude ( suite 4) : BAYES et ses défauts VERSION BIS APRES CORRECTIF

  
Soyez surs, chers lecteurs   que cette déroute des sondages  USA , ses prix budgétaire et politique  vont secouer le cocotier  dans le  milieu des sondeurs et des statisticiens ! C’est pourquoi  je vais vous parler aujourd’hui  de probabilités bayésiennes … JE LE FERAI EN TERMES SIMPLES et nous reviendrons ensuite en voir les  conséquences sur le plan d’échantillonnage puis sur   les critères de redressement
_______________________________________________
-« Lorsqu’ un sondeur interroge un électeur  sur son vote futur  pour   des candidats A ou B  , la réponse de ce dernier ne peut être que vraie ou fausse !Il ne peut y avoir d’autre alternative ….D accord ?
-«  Non OLIVIER ! l’électeur  sondé  peut  aussi  répondre  :je ne voterai pas / je ne sais pas encore  pour qui je voterai/  je voterai pour les 2/ je voterai pour A (ou pour B)  sI  telle occurrence se produit d’ici là ………
-«  Alors moi je traduis votre réponse  en :abstention/incertitude/vote nul /vote conditionnel    !  Mais même ce type de réponse  ne  peut être  que  vrai ou faux ….D’accord ? Ce  qu on appelle règles d inférence  bayésienne  ne fait intervenir que ces deux valeurs vrai ou faux

-« Oh ! Je craignais plus de  complication ! Où m’entrainez-vous ?
-« Encore bien plus loin  car    dans la catégorie « incertitude »   , d’autres  paramètres  interviennent  que je traiterai  plus  tard  .Tout d’abord une analyse bayésienne demande au départ une première modélisation  des connaissances de l’échantillonnage électoral « primitif »…Cette information « floue » de départ est ensuite affinée par des observations additionnelles grâce à la loi de Bayes .
-«  Ou les trouve- t-on ces connaissances ? Au téléphone,   le face à face ,internet etc. ?
-«   Oui ! Mais concrètement on interroge  d’abord  pour   se servir  aussi  des   votes précédents   des électeurs  sondés ……
-« Ils peuvent mentir sur leurs déclaration  de leurs  votes  passés également  … Non ?
-« C’est vrai  , c’est pourquoi  le raisonnement bayésien   doit confronter   les déclarations  et les  votes  passés effectifs ….
-«   Tout cela est  vague ,OLIVIER, rentrez dans le détail !
_________________________________________________
-« Prenons votre hypothèse de mensonge   inférant  sur le plan d’échantillonnage primitif.. Un 1er redressement  consiste à essayer de corriger les mensonges des sondés.  Peut être les personnes interrogées n’oseront pas dire qu’elles voteront pour un candidat d’extrême-droite ou d’extrême-gauche….. Ou au contraire qu’elles  sont «  moutonnières » et ont  voté  pour  le parti ou le président qui a eu le pouvoir  jusque-là !… . Ainsi, si un parti politique a obtenu 20% des suffrages à l’élection présidentielle précédente  mais que seules 10% des personnes interrogées admettent avoir voté pour le candidat  à cette élection, on estime que le vote est sous-estimé de moitié. Les intentions de vote pour le parti dans le sondage seront donc  à multiplier  par deux ….  ou au contraire il faudra  commencer  une  pondération s’ il a eu des effets «  d’ emballement » précédemment …..
 -«  Comment çà ?
-« L’effet « bandwagon » désigne  l’effet mobilisateur pour la campagne d’un candidat lorsque celui-ci est allègrement  en tête dans les sondages….mais  à contrario l’effet « underdog »désigne, lui, l’effet inverse à savoir la mobilisation des électeurs en faveur du candidat à la traine dans les sondages et  dont  le « tempérament » s’est brusquement réveillé….

-«  Est-ce  la seule « stratégie » ?Peux-t-on éliminer les sondés qui mentent  et comment faire ?
-«  I ’institut de sondage doit rester dans son budget et  une fois qu’ il a éliminé  les abstentionnistes déclarés  il dispose de méthodes de filtrage…Toutefois, celles-ci amènent des correctifs  malaisés ;   que faire par exemple  de ceux qui, tout en affirmant leur intention de participer au scrutin, signalent que leur choix peut encore changer ? La situation de doute va-t-elle les conduire à l’abstention ?  Comment  l’évaluer ? Le sondeur ne peut rentrer  dans une enquête de police (avec détecteur de mensonges !) ou de nature psychologique   !…Seule   lui reste   la finesse de son  questionnaire   qui lui permet d’apprécier si  ce type d’électeur incertain appartient à des tranches de la population, un peu plus abstentionnistes que la moyenne. ,à des versatiles "permanents" ….etc. Le problème est de savoir  s il faut l éliminer  de la population  et quel en sera les effets   ( on ne peut pas condamner les girouettes  à ne pas exister ,meme sur des quotas!!)
-« Est il possible par ailleurs OLIVIER que les sondages à leur publication  puissent avoir un impact sur les choix et décisions des citoyens. ?
-«  Bien entendu !Mais   c’ est une évaluation difficile ..Je vous en ai cité déjà deux  ….Mais la perversion des partis  ,des groupes de pression  et des média associés est parfois grande ! On parle alors de l’effet « humble-the-winner » (littéralement : « humilier le gagnant ») qui désigne la démobilisation des troupes d’un candidat depuis longtemps  en tête des intentions de vote et de  l’effet « snob-the-looser » (« snober le perdant ») qui désigne, elle,  forcer la démobilisation des troupes du  perdant quasi –certain  dans les sondages.
-« Comment évaluer  tout cela?
____________________________________________________________
Rentrons alors   encore un peu plus dans le petit détail d’un  sondeur  utilisant la  procédure  BAYES  pour déterminer le choix  d’un électeur X  partagé entre   deux partis en présence  A et B  ( on élimine les extrêmes)
 Un sondeur dispose sur le suivi du  fichier de cet électeur   X   déjà  par exemple  de  quatre résultats précedants TOUJOURS déclarés   pour A …..X va-t-il continuer   à voter pour A ? Réponse de X :oui ou non …..
On ne peut traiter les décisions  de  l’électeur  X  comme une pièce de monnaie tombant sur pile ou face   et dont  le résultat est aléatoire ……Si X a voté pour A  quatre fois déjà , il ne l a pas fait par hasard , en tirant à pile ou face  !Mais si la distribution est de 4  fois A  et deux fois B  une analyse complémentaire s impose .....
 En cas de  réponse  4fois  A (oui) de X  ,le sondeur ne peut cependant  donner une fiabilité certaine à  ce 5 ème futur  oui !
Mais rappelons que le sondeur BAYES  est libre dans le choix des sondés   , donc il peut   soit enregistrer  son   oui    soit changer de sondé ….Son choix propre intervient!
Il peut aussi continuer  de re- questionner son sondé X  jusqu’au vote  , pour  confirmer le 5 ème oui …. à mesure que le nombre d'observations devient grand, il existe un  psi-test bayésien qui est utilisé pour déterminer la plausibilité d'une variation  par rapport à des observations)   … Et pour ceux    qui  l’ont utilisé    cela ressemble au test de  χ² des statistiques classiques.Mais chers lecteurs  faites une introspection   ..Dans votre vie personnelle , etes vous sur que , DANS VOS DECISIONS, dans  ce que vous croyez etre du domaine  de  votre volonté rationnelle  , il n intervient pas  quelquefois l influence  subtile d un  malicieux hasard????
 A suivre