Representativeness in Online Surveys through Stratified Samples

Abstract
Représentativité des enquêtes en ligne à échantillons stratifiés: Alors que les enquêtes à échantillons nationaux en face-à-face sont considérées comme représentatives de l’ensemble de la population, les échantillons en ligne sont considérés comme biaisés, notamment en termes d’âge, de sexe et d’éducation. Pour éviter ce biais, les données peuvent être pondérées de façon à se rapprocher d’un échantillon représentatif. Dans le cas d’enquêtes en ligne, les femmes âgées ayant un faible niveau d’éducation reçoivent un poids très élevé et les jeunes gens ayant une bonne éducation un poids très faible. Plutôt que de pondérer les données, nous tirons un échantillon stratifié à partir de plus de 20.000 participants à un panel en ligne. De ce fait, les femmes âgées de niveau d’éducation relativement faible ont une très forte probabilité d’entrer dans l’échantillon, les jeunes gens avec une bonne éducation, une très faible. Pour obtenir un échantillon stratifié selon le sexe × âge × éducation, sans erreur de prise en compte, l’échantillon est limité à un âge allant jusqu’à 49 ans. Pour comparer ces données et celles d’une enquête face-à-face représentative, nous avons utilisé un ensemble de questions tirées de l’Enquête sociale allemande 2002. Nous comparons les résultats des deux études sur la base de plus de 1.100 cas, dont chacun est équivalent en termes d’âge, sexe et éducation. On montre que des échantillons stratifiés en ligne ne sont pas représentatifs de l’ensemble de la population.