#anonymisation

  • Parcoursup : 6 500 dossiers confidentiels d’élèves ont été diffusés sur Internet
    https://www.mediapart.fr/journal/france/190520/parcoursup-6-500-dossiers-confidentiels-d-eleves-ont-ete-diffuses-sur-inte

    Plusieurs milliers de lycéens candidats à une classe préparatoire au lycée Janson-de-Sailly, à Paris, ont vu leur dossier pour Parcoursup fuiter, selon nos informations. Toutes leurs données confidentielles ont été visibles par des tiers. Près de 950 000 élèves de terminale, étudiants en réorientation et reprise d’études ont découvert mardi s’ils étaient admis, refusés ou en attente d’une place dans l’enseignement supérieur – c’est la première phase de Parcoursup qui démarre. Parmi eux, plusieurs milliers de (...)

    #BigData #enseignement #hacking

    • Dans son dossier rempli pour la plateforme Parcoursup, un jeune homme mentionne son expérience de scout. Les autres racontent leur passion pour l’athlétisme, les échecs, le rugby depuis plusieurs années. Une jeune fille met en avant le fait qu’elle a participé au Téléthon, quand une autre explique qu’elle aime se dépasser. Une élève indique faire de la couture et du piano.

      Bien entendu, tous sont très motivés à l’idée d’intégrer cette classe préparatoire et séduits par la qualité et la réputation de la formation.

      Ils ajoutent aussi s’ils ont des frères et sœurs, inscrivent sur cette fiche le revenu annuel global de leurs parents et s’ils souhaitent ou non intégrer l’internat du lycée. On y découvre aussi leur date de naissance ou leur numéro de dossier individuel qui sert à se connecter à Parcoursup.

      Les appréciations de leurs professeurs et de leur chef d’établissement d’origine s’affichent également, laissant ainsi apparaître les forces, les faiblesses et les péripéties scolaires de tous ces élèves, lors de leur année de première et des deux premiers trimestres de terminale. Surtout que ceux-ci ne sont pas censés avoir accès aux avis du corps professoral sur leur travail et leurs aptitudes.

      Ces 6 500 élèves ont livré toutes ces informations car ils souhaitent intégrer une classe préparatoire scientifique MPSI (mathématiques, physique et sciences de l’ingénieur) au lycée parisien Janson-de-Sailly. Les places sont chères et ce cursus sélectif fort prisé – il est le deuxième le plus demandé.

      C’est moi ou on leur apprend d’emblée à n’avoir aucune notion de vie privée et de discrimination  ?
      Ça sert à quoi la prétendue #anonymisation des dossiers  ?

      Cette anonymisation des dossiers était l’une des grandes avancées de la seconde mouture de Parcoursup. Certains candidats et établissements craignaient que la sélection des dossiers ne soit biaisée par la mobilisation de critères peu objectifs et parfois discriminants, comme les noms ou les adresses.

      Seulement, des exceptions ont été édictées et ces données ne sont pas anonymisées dans le cas où la formation dispose d’un internat, comme c’est le cas à Janson-de-Sailly, confirme une source au ministère de l’enseignement supérieur. Le lycée a besoin de connaître les revenus des parents et la distance entre le domicile de l’élève et l’établissement scolaire pour pouvoir privilégier les moins fortunés et les plus éloignés géographiquement.

      Mais bien sûr  : Janson-de-Sailly va être blindé de pauvres ploucs de province  !

  • Des analyses de Swisscom soutiennent la lutte contre le coronavirus

    L’#Office_fédéral_de_la_santé_publique (#OFSP) a demandé à Swisscom des analyses pour vérifier si les mesures de protection contre l’infection du #coronavirus sont respectées. Les analyses comprennent des données relatives à la #mobilité et aux #rassemblements de personnes dans l’#espace_public. Les évaluations montrent que la population suisse a fortement réduit ses #déplacements. L’OFSP ne reçoit à aucun moment des #données_géographiques de Swisscom, mais seulement des #statistiques et des #visualisations. Les données qui sous-tendent les analyses et les visualisations sont anonymisées et agrégées. Aucun lien avec des personnes spécifiques ne peut être établi.

    Le 21 mars, le Conseil fédéral a interdit les rassemblements de plus de cinq personnes dans l’espace public (art. 7c, al. 1, Ordonnance 2 COVID-19). Les autorités souhaitent maintenant avoir des preuves pour savoir si ces mesures de protection de la population sont respectées ou non. L’Office fédéral de la santé publique (OFSP) reçoit des analyses sur la mobilité et sur les rassemblements dans l’espace public qui se basent sur la plateforme Mobility Insights de Swisscom. La plateforme et les analyses correspondantes ont déjà été utilisées dans le contexte de la Smart City, comme p. ex. à Montreux ou à Pully.

    Les premières évaluations montrent que les habitants font beaucoup moins de déplacements depuis la première interdiction de rassemblements de plus de cinq personnes. En effet, les déplacements, en termes de kilomètres parcourus, ont diminué d’environ 50% dans toute la Suisse par rapport à un mois antérieur typique. Il faut toutefois souligner que la population du Tessin a réduit ses trajets de la manière la plus prononcée.
    Anonymisation complète et agrégation des données

    Pour localiser les rassemblements de personnes, la plateforme Mobility Insight (en conformité avec l’art. 45b, loi sur les télécommunications) affiche les zones où se trouvent au moins 20 cartes SIM par surface de 100 mètres par 100 mètres. Les analyses se basent sur des données géographiques approximatives sur les 24 heures passées.

    Pour indiquer comment les déplacements de la population ont évolué, la plateforme affiche la mobilité approximative des cartes SIM Swisscom d’une zone (p. ex. d’un canton) au cours d’une période de temps donnée. Les informations qui sont obtenues par des moyens techniques dans le réseau mobile sont anonymisées automatiquement aussitôt après leur création puis regroupées sous forme agrégée en vue des analyses.
    L’OFSP ne reçoit pas de données géographiques, mais seulement des visualisations

    L’OFSP ne reçoit à aucun moment des données géographiques, mais seulement des statistiques et des visualisations que Swisscom peut calculer à partir de ces données. Les analyses/visualisations sont entièrement anonymisées et agrégées, donc uniquement visibles sous forme d’une valeur de groupe. Ainsi, aucun lien ne peut être établi avec des personnes spécifiques ou des profils de déplacement individuels. Les directives de la loi fédérale sur la protection des données et les principes éthiques que suit Swisscom pour le traitement des données sont entièrement respectés. Dès que l’ordonnance 2 COVID-19 ne sera plus applicable, aucune analyse ne sera plus mise à la disposition de l’OFSP.

    Les clients ont le contrôle de leurs données en tout temps

    Les clients peuvent définir eux-mêmes pour quels produits et prestations Smart Data Swisscom est autorisée à utiliser leurs données, sous une forme anonymisée et agrégée, autrement dit très concise (#opt-out). Un opt-out peut être demandé dans le domaine « #Protection_des_données », sous Mon profil, dans l’Espace clients. Les données ne sont donc pas utilisées pour d’autres analyses.

    https://www.swisscom.ch/fr/about/news/2020/03/27-swisscom-coronavirus.html

    #Orange en #France... #Swisscom en #Suisse...

    #données #téléphone #smartphone #surveillance #anonymat #agrégation #anonymisation #données_agrégées

    ping @etraces

  • Vers l’anonymisation complète des flics dans les procédures juridiques - Rebellyon.info
    https://rebellyon.info/Marseille-1er-decembre-2018-lors-de-la-19898

    L’assemblée nationale vient de voter l’extension du dispositif d’anonymisation des policiers, des gendarmes et douaniers. Si le sénat confirme les amendements adoptés, le nom des flics pourrait disparaître de quasiment toutes les procédures juridiques. Inquiétant.

    Marseille, 1er décembre 2018, lors de la manifestation des « gilets jaunes », Zineb Redouane, 80 ans, est blessée au visage par des éléments d’une grenade lacrymogène tirée depuis la rue. Elle décède quelques heures plus tard à l’hôpital. La machine médiatique se met en route pour affirmer que la police n’y est pour rien. Le procureur de Marseille, Xavier Tarabeux, va même jusqu’à affirmer que « le choc facial [avec la grenade lacrymogène] n’est pas la cause du décès ». La presse reprend en cœur le fait que cette femme avait « la santé fragile ».

    Des flics qui ont tiré, on ne sait rien : ni pourquoi ils ont tiré, ni leurs grades, ni bien sûr leurs noms. Et il est bien possible qu’on ne sache jamais rien. D’abord parce qu’il est plus que probable que l’administration policière les couvre comme elle a commencé à le faire. Ensuite parce que le nom des flics sort rarement dans les procédures, qui garantissent souvent leur anonymat. Un anonymat qui pourrait bientôt être total.

    C’est une information qui est plus ou moins passée au travers des radars médiatiques en cette période agitée : l’assemblée nationale vient d’étendre le dispositif d’anonymisation des policiers, des gendarmes et douaniers. Le site de l’éditeur de textes juridiques Dalloz révèle en effet que deux amendements en ce sens ont été votés le 23 novembre 2018 dans le cadre du travail parlementaire sur la Loi de programmation et de réforme de la justice.

    via @rezo #police #anonymisation #violences_policières

  • Linky et les données « carroyées » - Dans les grilles de l’Insee
    http://www.piecesetmaindoeuvre.com/spip.php?page=resume&id_article=864

    Dans Les secrets de Linky , nous avions vu comment Enedis (ex-ERDF), cette entreprise aux pratiques brutales - suivant le médiateur de l’Energie - comptait vendre nos données personnelles pillées par Linky à l’échelle du maillage IRIS de l’Insee. Parmi les nombreuses réactions suscitées par ce texte, il y avait celle de cet employé de l’Insee qui nous glissait : « il y a bien pire que la maille IRIS, il y a le carroyage, vous devriez voir… » On a été voir et on n’en est pas revenus. On a beau être cyniques (?), blasés (?), résignés (?), quant aux multiples moyens techno-administratifs d’espionnage et de gestion du cheptel humain, il nous arrive encore d’être confondus de l’ampleur et de la précision de ce que la machine à gouverner sait de nous. Non que les circuits et le fonctionnement de cette machine (...)

    #Nécrotechnologies
    http://www.piecesetmaindoeuvre.com/IMG/pdf/dans_les_grilles_de_l_insee.pdf

    • Il nous faut à nouveau briser vos illusions et vous parler de #ré-identification. En jargon technocratique, ce néologisme désigne le risque de retrouver l’identité d’une personne d’après ses données personnelles, en dépit des techniques d’anonymisation. Comme avec les
      données carroyées de l’Insee en 2013 (...) En réalité, et c’est un rapport du Sénat qui l’admet, « il suffit de peu de données -et des données anodines en apparence- pour que l’empreinte laissée par celles-ci permette d’identifier une personne parmi d’autres, ce qui permet de la retrouver dans la base en dépit de son #anonymisation et donc d’avoir accès, ensuite, à tous (sic) son dossier. »

      89% des patients ayant connu un séjour à l’hôpital en 2008 sont identifiables si l’on connaît les informations suivantes, relativement aisées à retrouver : l’hôpital d’accueil, le code postal du domicile, le mois et l’année de naissance, le sexe, le mois de sortie et la durée du séjour. Ce chiffre atteint 100% pour les patients hospitalisés deux fois la même année. La robustesse des opérations d’anonymisation auxquelles sont soumis le système national d’information inter-régimes de l’assurance maladie (SNIIRAM) et le programme de médicalisation des systèmes d’information (PMSI), qui rassemblent les données de santé de nos concitoyens, n’y change rien.

      Effectivement j’ai bien noté qu’à l’accueil de l’hopital on ne me demande plus mon nom, il suffit de ma date de naissance pour m’identifier si j’ai rendez-vous le jour même... Donc deux dates suffisent !

  • #VPN et #anonymisation de l’IP
    je suis confronté, comme sans doute plusieurs d’entre vous, à la montée des paywalls, notamment pour la #presse du #Liban que je lis assiduement (L’Orient Le Jour/ The Daily Star). J’aimerais savoir si les autres seenthisiens qui (uti)lisent la presse de ce pays ont des stratégies particulières : sont ils abonnés (moi je le suis au Monde par ex.) ou utilisent-ils des VPN ? Dans ce cas, quels conseils peuvent ils donner ? J’ai constaté que les VPN gratuits ne sont pas très performants, modifient l’apparence des pages, etc.

  • Unique dans le centre commercial - Bits
    http://alireailleurs.tumblr.com/post/109562500637

    L’anonymisation des #big_data est un vaste problème. Même “anonymisées”, elles peuvent permettre de réidentifier des personnes. Toutes les données sont devenues personnelles affirmions-nous déjà en 2009. Et il semble que ce soit chaque jour un peu plus vrai. Yves-Alexandre de Montjoye, du laboratoire de dynamique humaine du Media Lab du MIT (@yvesalexandre), nous en avait déjà fait la démonstration fin 2013. Il vient de récidiver dans un article pour Science utilisant une base de données commerciale de transactions depuis des cartes de crédit de quelques 1,1 million de personnes sur 10 000 magasins sur une période de 3 mois, nous apprend Natasha Singer pour le Bits blog du New York Times. Cette base de données contenait le détail des transactions de chaque client (date des transactions - mais pas l’heure (...)

    #metadonnées #réidentification #anonymisation

  • Non mais, allô quoi !
    http://lundi.am/spip.php?article32

    L’antiterrorisme étant la science plus ou moins heureuse de l’anticipation, nous vous proposons d’explorer les moyens à disposition des terroristes en tous genre (on est toujours le terroriste de quelqu’un...) pour échapper au #contrôle des #communications téléphoniques. (...) comment tenter de résoudre le premier problème : le fait que les #informations échangées (messages, voix, navigation internet) à partir d’un téléphone mobile puissent être facilement interceptées et exploitées.

    #boite_à_outils #data #anonymisation #protection #téléphone

  • L’anonymisation transforme-t-elle les résultats de #recherche ? - ACMQueue
    http://alireailleurs.tumblr.com/post/96612700635

    Le 30 mai 2014, des chercheurs du laboratoire de l’apprentissage numérique du MIT et de Harvard ont publié des données anonymisées sur les étudiants suivants 16 cours de la plateforme de cours en ligne (Moocs) EdX pour permettre à d’autres chercheurs de les utiliser. Celles-ci ont donné lieu à de nombreuses exploitations, notamment par le Chronicle of Higher Education montrant que les cours en ligne attiraient surtout des étudiants de sexe masculin, déjà largement diplômés, de 24 ans de moyenne d’âge, provenant pour 1/3 d’Amérique du Nord, dont la moitié n’a fait que s’inscrire (10% n’a consulté que la moitié des cours et 3% ont visionné toutes les pages). Parmi les élèves les plus assidus, ce sont les plus diplômés et les européens qui ont consulté le plus de cours. Mais le problème du respect du nécessaire (...)

    #science #protection_des_données_personnelles #anonymisation