• Le traitement de la confidentialité

    Insee - L’Insee et la statistique publique - Séminaire de Méthodologie Statistique du département des méthodes statistiques
    http://www.insee.fr/fr/insee-statistique-publique/default.asp?page=colloques/sms/sms.htm

    mardi 24 juin 2014 de 14h à 17h, à l’Insee - Malakoff1 - salle 1245.

    Les organismes producteurs de données statistiques ne cessent de diffuser toujours plus d’informations économiques et sociales afin d’enrichir le débat public. Mais cette large diffusion doit respecter l’anonymat des répondants.
    Pour ce faire, il existe des méthodes et des outils spécifiques permettant d’assurer la confidentialité des données diffusées, aussi bien dans les tableaux que dans des fichiers de données individuelles.
    Ce séminaire sera l’occasion d’exposer les techniques et pratiques d’anonymisation des tableaux de données agrégées, de faire une large revue des méthodes de protection des données individuelles et de présenter une application de ce type de traitement sur les données du recensement de la population.

    Interventions :

    • La gestion de la confidentialité dans les tableaux statistiques
    Julien Nicolas - SOeS

    • Un panorama de la protection des fichiers de données individuelles
    Maxime Bergeat - Insee, Département des méthodes statistiques
    • Traitement de la confidentialité dans la réponse au règlement européen sur les recensements de la population et du logement
    Heïdi Koumarianos - Insee, Département de la démographie

    Le séminaire est ouvert à tous, sans inscription préalable.

    Le résumé des interventions http://www.insee.fr/fr/insee-statistique-publique/colloques/sms/seminaire-methodologie-statistique-24-06-2014.pdf

    Les présentations s(er)ont disponibles sur le site après le séminaire.

  • C’est en France que les inégalités de revenu augmentent le moins
    http://www.latribune.fr/actualites/economie/france/20140430trib000827739/c-est-en-france-que-les-inegalites-de-revenu-augmentent-le-moins.html

    Entre le sentiment d’une montée des inégalités en France, et la réalité, il y a commune un hiatus. D’autant plus flagrant si l’on regarde ce qui se passe ailleurs. L’OCDE a publié le 30 avril une nouvelle étude sur la question des inégalités dans les pays riches, avec, notamment, un graphique très parlant sur l’évolution de la part du revenu que s’arroge la minorité la plus aisée, celle du dernier centile (cette fraction représentant 1% de la population, aux revenus les plus élevés).

  • Statistique publique et démocratie : à quoi servent les chiffres ?

    Insee - L’Insee et la statistique publique - Statistiques, territoires et journalisme

    http://www.insee.fr/fr/insee-statistique-publique/default.asp?page=colloques/stat-territoire-journalisme/stat-territoire-journalisme.htm

    Dans le cadre de la démarche « Statistique publique et démocratie : à quoi servent les chiffres ? » Daniel Huart, directeur de l’Insee Nord-Pas-de-Calais, et Pierre Savary, directeur de l’École supérieure de Journalisme, ont le plaisir de vous inviter à une conférence-débat le jeudi 12 décembre 2013 à 14 h 00.

    #statistiques #data
    Cette conférence se déroulera à l’École Supérieure de Journalisme, 50 rue Gauthier de Châtillon, 59000 Lille, en présence de Jean-Pierre Duport, Président du Conseil national de l’information statistique (Cnis).

  • Insee - Séminaires de Méthodologie Statistique
    Méthodologie d’enquête auprès des sans-domicile : les innovations de l’enquête de 2012
    jeudi 5 décembre 2013 de 14h à 17h, ENSAE - Amphi 1
    (entrée libre, sans inscription)

    http://www.insee.fr/fr/insee-statistique-publique/default.asp?page=colloques/sms/sms.htm

    Séminaires de Méthodologie Statistique du département des méthodes statistiques
    Méthodologie d’enquête auprès des sans-domicile : les innovations de l’enquête de 2012

    Menée conjointement par l’Insee et l’Ined auprès d’une population qui ne dispose pas d’un logement, l’enquête Sans-Domicile requiert l’invention et la mise en œuvre de méthodes spécifiques, dans différentes phases de sa réalisation : circonscrire la population d’intérêt, tirer un échantillon, organiser la collecte, exploiter les données recueillies.
    Ce séminaire permettra de présenter les solutions retenues pour l’enquête de 2012, ainsi que leurs limites.

    Le programme et les résumés sont accessibles ici http://www.insee.fr/fr/insee-statistique-publique/default.asp?page=colloques/sms/sms.htm
    Les transparents devraient être mis en ligne au même endroit après le séminaire.

  • Insee - L’Insee et la statistique publique - Statistique publique et démocratie - À quoi servent les chiffres ?
    http://www.insee.fr/fr/insee-statistique-publique/default.asp?page=statistique-publique/stat-publique-democratie.htm

    Le Conseil national de l’information statistique (Cnis) et l’Insee à la rencontre des utilisateurs de la statistique publique

    Par la démarche « Statistique publique et démocratie : à quoi servent les chiffres ? », le Cnis et l’Insee souhaitent mieux faire connaître la pertinence des travaux de la statistique publique, favoriser une meilleure compréhension et une plus large utilisation de ses données dans le débat public et échanger avec les utilisateurs pour mieux cerner leurs attentes.
    Quatre événements organisés par le Cnis et l’Insee

    • À l’occasion des Journées de l’économie (JECO), les 14 et 15 novembre 2013 à Lyon, des experts de l’Insee participeront aux « Cafés économiques de Bercy » http://www.journeeseconomie.org/index.php?arc=p35l pour présenter au public, dans un cadre participatif, l’économie de la région Rhône-Alpes.
    • Un séminaire « Statistiques et médias », organisé avec l’École supérieure de journalisme de Lille, se tiendra le jeudi 12 décembre 2013 pour sensibiliser les médias au traitement des données statistiques, à l’heure du développement du « data journalisme ».
    • Temps fort de cette démarche, une conférence-débat « À quoi servent les chiffres ? », co-organisée avec le Conseil économique, social et environnemental au palais d’Iéna à Paris, aura lieu le jeudi 30 janvier 2014. À cette occasion, l’Insee publiera un ouvrage de la collection Insee Références retraçant « Trente ans de vie économique et sociale ».
    • En partenariat avec l’association « Les Petits Débrouillards » http://www.lespetitsdebrouillards.org , lauréat des investissements d’avenir, l’Insee développe des activités de sensibilisation à la statistique mises en œuvre en direction des jeunes , qui seront présentées lors de la conférence du 30 janvier 2014.

  • Insee - L’Insee et la statistique publique - Rapport d’activité 2012 - Les faits marquants de l’année 2012 - Insee Ambition 2015 : bilan à mi-parcours
    http://www.insee.fr/fr/insee-statistique-publique/default.asp?page=connaitre/rae/partie1_4.htm

    À la fin de la décennie 2000, l’Insee est fortement sollicité, notamment suite aux travaux menés pour le moyen terme du Conseil national de l’information statistique. Les demandes portent principalement sur l’environnement et le développement durable, sur une meilleure connaissance des inégalités, sur la mise à disposition d’informations finement localisées, nécessaires au pilotage des politiques publiques décentralisées. Les demandes émanant de l’Union européenne sont également de plus en plus prégnantes.

    Dans le même temps, une baisse sensible des effectifs apparaît inévitable : les départs à la retraite, nombreux compte tenu de la pyramide des âges des agents, ne sont que partiellement compensés.
    L’Insee a donc dû se réorganiser pour être plus efficace, mais a bénéficié pour cela d’opportunités nouvelles permises notamment par l’exploitation croissante des fichiers administratifs et par l’apport des nouvelles technologies.

    Quatre ambitions majeures pour être au rendez-vous des problématiques futures
    Dans cette optique, l’Insee a élaboré un programme baptisé Insee Ambition 2015. Sous l’accroche générale « l’Insee au rendez-vous des problématiques de demain », il détaille quatre ambitions :
    • Accroître notre impact dans le débat public, c’est-à-dire optimiser nos stratégies de diffusion et de communication et le choix des sujets objets de communication.
    • Mettre l’excellence technique et l’innovation au cœur de nos travaux.
    • Anticiper et nous organiser pour être plus réactifs.
    • Dégager des marges de manœuvre pour mieux remplir nos missions et répondre à de nouvelles demandes.

    http://www.insee.fr/fr/insee-statistique-publique/connaitre/rae/img/logo.jpg

    En lien avec ces orientations porteuses à moyen terme et pour moderniser son image, l’Insee a modifié son identité visuelle. « Mesurer pour comprendre » est la signature de l’Insee qui accompagne désormais le sigle de l’Institut. Elle exprime à la fois la nature des missions de l’Insee, la mesure, et leur finalité, servir et éclairer le débat public. Ce choix découle d’une large consultation auprès des utilisateurs de la statistique et de l’ensemble du personnel.

    • On ne peut que noter la coïncidence de l’arrivée de cette vision (selon le jargon de la com’ états-unienne) le jour même où Alain Desrosières était mis en terre au cimetière Montparnasse.

      Pour mesurer le poids de ces quelques pelletées rajoutées par la maison sur le cercueil de son ancien administrateur, on peut utilement relire ce qu’écrivait en 2005 Alain (avec Sandrine Kott) dans l’introduction au n°58 de la revue Genèses , numéro sur le thème Quantifier.

      Pour analyser cette activité, il est utile de distinguer les verbes quantifier et mesurer, souvent utilisés comme synonymes. L’idée de mesure, inspirée des sciences de la nature, suppose que quelque chose de réel peut être « mesuré », selon une métrologie réaliste. Dans le cas des sciences sociales, l’emploi immodéré du mot mesurer induit en erreur, en laissant dans l’ombre les conventions de la quantification. Ce verbe quantifier, dans sa forme active (faire du nombre), implique qu’il existe une série de conventions préalables, de négociations, de compromis, de traductions, d’inscriptions, de codages et de calculs conduisant à la mise en nombre. La quantification se décompose en deux moments : convenir et mesurer. L’usage du verbe quantifier attire l’attention sur la dimension, socialement et cognitivement créatrice, de cette activité. Celle-ci ne fournit pas seulement un reflet du monde (point de vue méthodologique usuel), mais elle le transforme, en le reconfigurant autrement.

      Tout le numéro est accessible en ligne : http://www.cairn.info/revue-geneses-2005-1.htm

  • #Grigny, commune lésée pour compte des #statistiques - Libération
    http://www.liberation.fr/societe/2013/02/05/grigny-commune-lesee-pour-compte-des-statistiques_879631

    Dans le Libé d’hier un « mini-dossier » sur le recensement, en particulier à Grigny (pas forcément très lu puisqu’il était derrière le paywall temporaire de 24 heures destiné à protéger la version papier — qui n’a pas été disponible en kiosque…)

    De l’article principal (lien ci-dessus) :

    Le maire de Grigny estime perdre chaque année environ 1,5 million d’euros de dotations, à cause de ce qu’il n’hésite pas à nommer « une erreur manifeste de l’#Insee ».
    (…)
    Philippe Rio dit ne pas connaître les raisons exactes du différentiel. Une des hypothèses les plus probables (lire l’interview ci-contre) serait la présence importante à Grigny de personnes sans-papiers, mais surtout d’hébergements illégaux. Notamment dans la gigantesque copropriété de Grigny 2, une ville dans la ville conçue à la fin des années 60. Elle compte 5 000 logements sur les 8 800 recensés à Grigny. Dans cette copropriété dégradée, le nombre d’habitants varie de 12 000 à… 17 000, selon les estimations.

    (…)

    Pour autant, « le mythe des sans-papiers hébergés illégalement » ne suffit pas, d’après le maire, à expliquer une aussi forte proportion d’« invisibles » sur sa commune. Selon lui, la nouvelle méthode de #recensement de l’Insee n’est pas étrangère à ces mauvais comptes. Depuis 2004, cette dernière ne procède plus au recensement exhaustif décennal mais réalise des sondages à partir d’un recensement réalisé chaque année sur 8% de la population.

    L’interview ci-contre est sans doute (pas d’autre interview)

    Interview de Laurent Chalard, géographe (qui) conteste les méthodes de l’Insee et dénonce un tabou sur la population étrangère http://www.liberation.fr/societe/2013/02/05/la-france-ne-connait-pas-son-solde-migratoire_879632

    Aussi curieux que cela puisse paraître, la France ne connaît pas son solde migratoire. Derrière tout cela, il y a le grand tabou des chiffres de l’immigration, un vieux tabou politique français.

    Et, pour finir (?), les repères (sans doute un encadré dans la version papier) : http://www.liberation.fr/societe/2013/02/05/reperes_879633

    26 860

    C’est la population légale de la ville de Grigny. Mais elle serait, selon le maire, plus proche de 30 000. L’administration fiscale l’estime pour sa part à 29 393, et l’assurance maladie à 29 500.

    Beaucoup de choses dans cet/ces article(s), pas que du bon… l’impact final risquant bien de se résumer à erreur manifeste et, pour ceux qui ont tout lu, beurk, sondage (et donc n-ième variante du lies, big lies and statistics…)

    Ce qu’il faut retenir sur le fond finalement, c’est :

    Philippe Rio (le maire de Grigny) a annoncé à Libération qu’il allait engager un recours contre l’Insee.

    ce qui, je crois, doit être une première, le recensement ne donnant traditionnellement pas lieu, en France, matière à contentieux juridique.

    Mes commentaires à suivre en … commentaires…

    • Sur le fond, je ne pense pas que le recours de M. Rio ait de grandes chances de prospérer.

      1. comme le fait remarquer l’Insee (disclaimer : je ne suis pas de la maison…) contacté par la journaliste :

      L’Insee Ile-de-France, très sceptique sur ces critiques, explique que « tout le monde a intérêt à avoir des chiffres justes ». Elle renvoie la balle dans le camp du maire, rappelant que le recensement est réalisé sur le terrain par les services municipaux et sur la base des répertoires d’immeubles établis par les mairies. « Il existe des outils de discussion en cas de désaccord. Entre l’envoi de la population légale en décembre et sa publication au Journal officiel en janvier, le maire a un mois pour faire connaître ses éventuelles remarques. Grigny ne l’a pas fait », souligne un responsable de l’Institut.

      cf. leur page institutionnelle destinée aux collectivités locales : http://www.insee.fr/fr/publics/default.asp?page=collectivites/recensement.htm

      La loi [de 2002, dans sa partie sur la rénovation du recensement] clarifie la répartition des rôles entre l’Insee et les communes et instaure de fait un partenariat plus étroit pour la mise en oeuvre des enquêtes de recensement.
      La collecte des informations est organisée et contrôlée par l’Insee.
      Les enquêtes de recensement sont préparées et réalisées par les communes ou les établissements publics de coopération intercommunale qui reçoivent, à ce titre, une dotation forfaitaire de l’État.

      Conséquence pratique, les agents recenseurs sont recrutés et rémunérés par la commune.

      2. La sous-déclaration aux enquêtes de recensement est un phénomène très général et pas spécifique à Grigny (dont plus de 95% de la population est située en ZUS (Zone Urbaine Sensible) — record de France.
      Ainsi, aux États-Unis pour le recensement de l’an 2000, le projet du Bureau du recensement de redresser les résultats des centres ville en estimant la sous-déclaration par des enquêtes post-censitaires (oui, oui, le projet était bien de redresser l’exhaustif à l’aide de sondages…) a donné lieu à des batailles homériques, pas vraiment justifiées sur des arguments méthodologiques mais plutôt par les conséquences politiques, qui ont terminé devant la Cour suprême. Laquelle, par une décision serrée (5 contre 4), a affirmé le principe du « head count ».
      cf. (en très résumé) le paragraphe sur le sujet dans ledit recensement :
      http://en.wikipedia.org/wiki/Census_2000#Adjustment_controversy
      ou, un article de l’époque (plus circonstancié) :
      http://lubbockonline.com/stories/012699/LG3054.shtml

      3. le coup de patte à la méthodologie par sondage (ça ne peut pas faire de mal) n’est pas pertinent ici (il l’est beaucoup plus dans l’interview de L. Chalard).
      Exhaustif ou par sondage, le recensement est basé sur le répertoire exhaustif des logements. La difficulté, dans les deux méthodes, est le passage des logements (ménages) aux personnes. Et là, la seule source d’information est la personne qui renseigne les documents du recensement qui lui sont remis :
      Feuille de logement : http://www.insee.fr/fr/methodes/sources/pdf/questionnaire_RP_feuille_logement.pdf
      Bulletin individuel (un par personne) : http://www.insee.fr/fr/methodes/sources/pdf/questionnaire_RP_bulletin_individuel.pdf
      L’agent recenseur (employé par la mairie, petit boulot temporaire bien connu) est chargé de récupérer les documents.
      http://territorial.over-blog.fr/article-27550499.html

      Et on sait parfaitement que les personnes qui ne remplissent pas les questionnaires sont très loin d’être toutes des personnes en situation irrégulière.

    • Pour l’interview, comme il est bien gentil Laurent Chalard, il va peut-être nous dire comment on fait pour connaître le solde migratoire ?…

      Ah oui, c’est facile :

      Pour le calculer, il faudrait avoir le nombre d’entrées sur le territoire et celui des sorties.

      Ah flûte, il y a un conditionnel (faudrait). Ben oui, c’est un des cas d’emploi du conditionnel : l’irréel du présent. Si, en plus, on se dit que ce solde migratoire on cherche à le connaître non seulement au niveau du territoire national mais au niveau de chaque entité géographique, on voit bien qu’on a aussi affaire à un irréel du futur

      Ce qui fait que pour estimer le solde migratoire et bien on se contente de déterminer le solde (tout court) d’ajustement pour expliquer la variation de la population entre deux recensement compte tenu de l’accroissement naturel. D’ailleurs pour Grigny, le solde migratoire est négatif depuis pas mal de temps.

      L. Chalard a bien sûr raison quand il parle de l’impact de l’introduction de sondage dans la méthode du recensement. En particulier, elle introduit une incertitude liée à l’échantillonnage — incertitude d’ailleurs estimée puisqu’aléatoire. Contrairement à l’incertitude non aléatoire (et le biais éventuel, cf. commentaire précédent…) qui entache des dénombrements par recensement exhaustif. Là où le problème est le plus aigu (et c’est d’ailleurs l’exemple qu’il prend) c’est dans les calculs d’évolution et les comparaisons d’une année sur l’autre, puisque, rappelons-le, l’enquête est annuelle mais n’interroge qu’un cinquième de l’échantillon chaque année (groupes de rotation) et donc les estimations portent chaque année sur des logements différents.

      Ces dernières années, le solde migratoire est officiellement d’environ + 50 000. Mais on ne voit pas bien à quoi cela correspond. Pas forcément à la réalité en tout cas.

      Que le solde migratoire estimé ne corresponde pas forcément à la réalité est une évidence (cf. début de ce commentaire).

      Le grand tabou des chiffres de l’immigration ?
      Ok, comment on fait pour connaitre les vrais chiffres de l’immigration ? (Au passage, dit comme ça, ça a tout de suite une autre connotation…)

      Si tabou il y a, en revanche, c’est celui de l’indépendance de l’Insee. Le Code de bonnes pratiques de la statistique européenne d’Eurostat http://epp.eurostat.ec.europa.eu/cache/ITY_OFFPUB/KS-32-11-955/FR/KS-32-11-955-FR.PDF mentionne dans son premier principe :

      L’indépendance professionnelle des autorités statistiques à l’égard aussi bien des autres instances et services politiques, réglementaires ou administratifs, que des opérateurs du secteur privé, assure la crédibilité des statistiques européennes.

      (j’adore son frontispice, gravé dans le marbre en capitales romaines…)

      En France, il y a un petit souci c’est que

      L’Institut national de la statistique et des études économiques (Insee) est une direction générale du ministère de l’Économie et des Finances.
      Il s’agit donc d’une administration publique, dont les salariés sont des agents de l’État, qu’ils aient ou non le statut de fonctionnaire. L’Insee est soumis aux règles de la comptabilité publique ; les crédits dont il dispose figurent au budget général de l’État.

      source : http://www.insee.fr/fr/insee-statistique-publique/default.asp

      Mais, comme on est entre gens bien, le Rapport de l’évaluation par les pairs de l’Institut de statistique français sur la mise en oeuvre du Code de bonnes pratiques effectué en 2007 sous l’égide d’Eurostat conclue sur ce premier principe :

      Évaluation d’ensemble : par opposition à la situation généralement observée dans d’autres pays, l’indépendance de l’Institut National Statistique français en matière statistique n’est pas inscrite dans le droit. Néanmoins, notre opinion est que, en pratique, l’indépendance professionnelle est une composante importante de la culture Insee et une valeur forte parmi le personnel. En dépit de son manque d’indépendance inscrite dans le droit, l’Insee est généralement considéré comme un institut statistique de grande qualité.

      source : http://www.insee.fr/fr/insee-statistique-publique/connaitre/rapport_fr.pdf

      C’est donc une affaire de culture et d’opinion générale…

    • Enfin, pour les Repères (et les différents chiffres de population), plusieurs remarques.

      1. C’est quand même assez bizarre de voir que le chiffre retenu pour la population de Grigny est celui de 26 860. D’une part, c’est celui de l’année dernière (population légale 2012, date de référence 1/01/09).
      Mais c’est surtout celui de la population municipale (ex-population sans double compte) et donc justement pas celui qui est utilisé pour calculer les différentes dotations. La base des dotations est la population totale : au chiffre précédent, il faut ajouter la population comptée à part. En général, ça ne fait pas une grande différence, dans le cas de Grigny, on passerait de 26 860 à 27 026 (pop. légale 2012) et pour les chiffres 2013 (date de référence 1/01/10, disponibles depuis fin décembre 2012 et sujets traditionnels d’un marronnier…) on a
      – population municipale : 26 638
      – population totale (légale) : 26 796

      2. la population fiscale 29 393 (que l’on trouve dans la fiche de la commune de Grigny (tableau REV T2, p. 11) http://www.statistiques-locales.insee.fr/FICHES%5CDL%5CDEP%5C91%5CCOM%5CDL_COM91286.pdf ) correspond au nombre de personnes dans les ménages fiscaux est bien connue de l’Insee. En effet, dans les travaux préparatoires des opérations de recensement figure un rapprochement avec le fichier (fiscal) de la taxe d’habitation (puisque la base de comptage sont les logements).

      3. Enfin, pour la population de l’assurance maladie, je ne localise pas la source (ni la date de référence) du chiffre de 29 500. En fouillant directement dans le site de l’Insee je tombe bien sur un fichier Excel qui contient un chiffre, mais n’étant pas passé par les pages d’accès, je ne connais pas le contexte ou les références. Je trouve (sous le chapeau CNAM 2011)
      – allocataires : 15 557
      – population couverte : 27 453
      sachant que toute la population n’est pas couverte par la CNAM.