Dans le rapport de Harris Interactive ( toujours ahead of what’s next) je trouve le chiffre de 478 personnes.
▻http://harris-interactive.fr/opinion_polls/intentions-de-vote-a-la-primaire-de-la-gauche-pour-lep
ou le pdf du rapport
▻http://harris-interactive.fr/wp-content/uploads/sites/6/2017/01/Rapport-Harris-Intentions-de-vote-%C3%A0-la-primaire-du-PS-et-de-
Ceci dit, quitte à chicaner, dans ces documents on trouve la description suivante de l’échantillon :
… un échantillon représentatif de 6 245 Français à propos de ce scrutin, et plus particulièrement un échantillon de 478 personnes déclarant qu’elles iront certainement voter à cette Primaire.
Et dans le tableau introductif du pdf, les lignes correspondant aux 2 nombres cités ci-dessus sont encadrées, laissant donc apparaître un intervalle de confiance de +/- 1,4% (pour 6000 interviews autour d’une estimation de 50%) ou +/- 4,5% (pour 500 interviews autour d’une estimation de 50%)
MAIS, autant pour les 6000, ça marche à peu près, autant pour les 478, ça ne marche plus du tout, puisque ce nombre de répondants est lui-même issu du tirage de l’échantillon principal (en le supposant aléatoire). Du coup, la phrase rituelle
Si le calcul de l’intervalle de confiance concerne les sondages réalisés avec la méthode aléatoire, il est communément admis qu’il est proche pour les sondages réalisés avec la méthode des quotas.
n’a plus aucune justification, car s’appliquant à un calcul où le nombre d’interviews (le dénominateur du calcul du pourcentage d’intention de votes) est « certain ».
Dans le cas où ce dénominateur est lui-même aléatoire, la loi de l’estimateur du pourcentage devient une loi de Cauchy. Dont on rappellera qu’elle a l’intéressante propriété de n’admettre aucun moment, c-à-d ni espérance, ni écart-type, etc.
Embêtant pour calculer l’intervalle de confiance ! :-D