• Interlude ( suite 2) :Les enquètes d 'opinion et le naufrage des STATISTIQUES....!

      
    Pour comprendre les méthodes de sondages d’opinion  il  me semble maintenant nécessaire de vous  faire d’abord un petit  cours  de statistiques basiques …..Et peut -être  faut -il avoir été soit même sondé et sondeur une fois dans sa vie : ce qui a été plusieurs fois  mon cas  !!!
    ---------------------------------------------------------------------------------
    Chez nous il existe une loi qui  en précise les modalités . La loi du 19 juillet 1977, telle que modifiée par celle du 25 avril 2016, comprend une définition  stricte du sondage. "Un sondage est une enquête statistique visant à donner une indication quantitative, à une date déterminée, des opinions, souhaits, attitudes ou comportements d’une population par l’interrogation d’un échantillon."
    Mais cette loi «  rentre » dans le sujet  en développant les points nécessaires  de traitement ; j’en extrait les quelques caractéristiques  que je vais traiter :
    -1 : Le nombre de personnes interrogées ( en   stats , on parle de la «  taille de l’échantillon »)
    -2 :La méthode selon laquelle les personnes interrogées ont été choisies, l( en  stats ,pourquoi tel choix et pourquoi  telle composition de l’échantillon)
    -3 :Les conditions dans lesquelles il a été procédé aux interrogations (sondage visuel ou anonyme   internet ,téléphone fixe ou mobile , courrier  , etc. ( Avec ,s’il y a lieu, la nature et la valeur de la gratification perçue par les personnes interrogées)
    -4 :La proportion des personnes n’ayant pas répondu
    -5 :La ou les dates auxquelles il a été procédé aux interrogations
    -6 :Le texte intégral de la ou des questions posées
    - 7 :Les marges d’erreur des résultats publiés ou diffusés, le cas échéant par référence à la méthode aléatoire
    -8 :Et l’un des points majeurs des biais  et des erreurs  : s’il y a lieu, les critères de redressement des résultats bruts du sondage.
    ETC.
    ----------------------------------------------------------------------------------------
    -Et maintenant  penchons-nous sur cette présidentielle US  qui nous a TOUS  tant surpris   …..Et interrogeons ces paramètres !
    1/ Si vous vous référez  aux conditions de la consultation américaine publiée ici hier , vous verrez que l’effectif varie entre 447  et 70194 mais tourne en gros autour de 1000 personnes ;le budget pourra  alors se révéler  très différent !
    2 et  3/j’ai choisi dans cette liste trois types  de firmes  très différentes  et correspondant à des  tailles d’échantillon volontairement très différentes.
     La première est notre célèbre institut de sondage  d’origine française ,  IPSOS, devenue le 3 ème mondialement ,et qui a été sollicité par REUTERS   pour des effectifs d’échantillon de l’ordre de 2000 et depuis la fin des années 1980, c'est le téléphone et internet qui sont  utilisés( en France)….  La consultation de leur  site pour  cette présidentielle m’a fait découvrir qu’ il travaillait selon  la statistique  bayésienne  dont je vous ai déjà expliqué les règles ici  (on part d’une première information  vraie mais  ancienne   dont on affine progressivement l’évolution  :   c’est à dire  que les sondeurs  composent leurs échantillons en se basant sur les électorats X ou Y tels qu'ils apparaissaient lors des précédentes élections…..
    Résultats de recherche d'images pour « analyse de bayes »
    La seconde est celle qui correspond à la population  la plus nombreuse ( 78000)  , c est NBC NEWS le demandeur et Survey monkey l’exécutant  ….Voici ce qu’ ils ont bien voulu indiquer sur leur méthodologie  ( copier – coller partiel en anglais  ,c ar je ne  veux pas  risquer une traduction imparfaite  )
    “ The NBC News|SurveyMonkey Weekly Election Tracking data for the week of October 31 through November 6, 2016 was conducted online among a national sample of 70,194 aged 18 and over who are likely to vote. Respondents for this survey were selected from the nearly three million people who take surveys on the SurveyMonkey platform each day. Data for this week has been weighted for age, race, sex, education, region, and voter registration status using the Census Bureau and Bureau of Labor
    Statistic’s
    “ Current Population Survey to reflect the demographic composition of the United States. An additional smoothing parameter for ideology based on previous Election Tracking interviews is included. The smoothing parameter was derived from aggregated data on ideology by region collected from previous weeks (May 1-June 26) of the Weekly Election Tracking poll. Because the sample is based on those who initially self-selected for participation rather than a probability sample, no estimates of sampling error can be calculated. All surveys may be subject to multiple sources of error etc  “
      La troisième m’a plu par  la clarté de ses explications  et je vous les livre en copier-coller partiel : « November 7 (Bloomberg) -- The Bloomberg Politics Poll, conducted Nov. 4-6 for Bloomberg Politics by Selzer &
    Co. of Des Moines, IA, is based on interviews with 799 U.S. adults ages 18 or older who say they will definitely voteor have already voted in the 2016 general election.
    Interviewers with Quantel Research contacted 982 U.S. adults with randomly selected landline and cell phone
    numbers supplied by Survey Sampling International. Responses from the full probability sample were weighted byage and race to reflect the general population based on recent census data. Interviews were administered in English.
    ---------------------------------------------------------------------
     Mais arrivé à ce point MONSIEUR  TOUTLEMONDE  , mon lecteur habituel  , se réveille pour me passer un sacré savon ! « Franchement  OLIVIER    s il faut devenir  expert en traduction de statistiques en américain pour arriver à vous comprendre  , vous commencez à exagérer ! Dites nous , bon sang  et en langage clair  , pourquoi  tous les instituts de sondage  avec un échantillon de 78000 ou de  1000 se sont si formidablement trompés !???
    -«  Du calme ! Du calme ! il faut en effet une analyse encore plus fine ……
     A suivre

    ,