• Pourquoi j’ai quitté « le job le plus sexy du XXIè siècle » | Le Club de Mediapart
    https://blogs.mediapart.fr/vous-netes-pas-seuls/blog/060421/pourquoi-jai-quitte-le-job-le-plus-sexy-du-xxie-siecle
    #IA #deep_learning #algos #statistiques #data #big_data

    "Le rapport qui suit s’intéresse aux causes mais surtout aux effets de l’automatisation algorithmique et statistique de l’économie mondialisée, posant notamment le problème de maintenir coûte que coûte le dogme du progrès technologique comme horizon indiscutable de nos sociétés. Trois ans dans le monde des data sciences, en tant que consultant #data_scientist au sein du cabinet Sia Partners, m’ont fait découvrir l’intérêt porté au secteur par les grands groupes de l’énergie, de la banque et de l’assurance, mais aussi par l’administration publique et l’écosystème #start-up.
    A travers cette analyse, rédigée après ma démission en mars 2020, j’ai essayé d’exposer ma compréhension de ce qui est actuellement en jeu dans l’économie du numérique. J’y présente un témoignage personnel enrichi de réflexions théoriques documentées, afin de démystifier les fantasmes à la source du #solutionnisme_technologique et de caractériser les effets des récentes innovations sur nos sociétés et, plus largement, sur le vivant. Cette prise de recul à l’aune d’un examen idéologique tente d’exposer les dysfonctionnements d’un système ayant placé le progrès technologique au cœur de sa doctrine et de son rapport au temps. La fin du rapport interroge en particulier notre conception du temps comme point de bascule paradigmatique.
    Il ne s’agit évidemment pas d’une croisade à l’encontre de mon ancien employeur, qui ne revêt à mon sens aucune importance systémique, même si telle peut être l’ambition de ses dirigeants. Les mêmes considérations symptomatiques auraient pu être faites au sein de la concurrence. Il s’agit ici d’informer concrètement celles et ceux qui n’auraient pas toutes les cartes en mains, et d’interpeller la conscience des autres. Les éléments présentés sont, autant que possible, factuellement argumentés. Les assertions et observations critiques sont le fruit d’une réflexion personnelle documentée, et de ce fait, comme tout écrit, empruntes d’une certaine forme de subjectivité. Néanmoins, l’objectif est conservé d’y établir un discours plus
    rationnel que les croyances maintenues à bout de bras par une culture dominante en péril."

    #Rapport

    https://vous-netes-pas-seuls.org/wp-content/uploads/2021/04/Rapport-Romain-Boucher.pdf

    https://vous-netes-pas-seuls.org

  • Quatre métiers clefs pour exploiter les données en entreprise, High tech
    http://www.lesechos.fr/tech-medias/hightech/021917488974-quatre-metiers-clefs-pour-exploiter-les-donnees-en-entreprise-

    Les experts de la « data » sont très prisés des recruteurs
    Pour se lancer dans des projets « #Big_data », c’est à dire exploiter des volumes de données considérables et variés pour mieux analyser les attentes des clients, optimiser son fonctionnement ou encore imaginer de nouvelles formes de business, des nouveaux métiers ont émergé.

    « Data scientist », le roi des statistiques prédictives
    Qualifié dès 2012 par la « Harvard Business Review » de « job le plus sexy du XXIe siècle », le titre de #data_scientist est si recherché que de nombreux étudiants n’hésitent pas à s’en prévaloir sur leur CV, sans que ce soit toujours mérité. Certains recruteurs font donc passer des tests à leurs candidats pour vérifier qu’ils maîtrisent les outils informatiques et statistiques : connaissent-ils JavaScript ? Et le connecteur Python, qui permet de récupérer des données sur Twitter ? Ou encore les fonctions d’activation d’un réseau de neurones ? Il faut aussi que les candidats soient à même de s’adresser aux opérationnels dans l’entreprise, de comprendre leurs problèmes. Ensuite seulement, ils pourront interroger les données pour trouver des solutions nouvelles. « Si l’on construit un modèle parfait qui nous apprend que, quand il pleut, les trottoirs sont mouillés, ça n’a aucun intérêt », résume Samir Amellal, chief data officer chez Publicis.

    Architecte Big Data, le plombier de la donnée
    En amont de tous les métiers de la donnée, l’architecte Big Data met en place les récipients et tuyaux virtuels qui vont permettre à son entreprise de stocker d’énormes volumes de données, mais aussi de les manipuler facilement et avec des temps de traitement les plus courts possible, ou encore de les solliciter pour créer des tableaux de suivi à l’intention des opérationnels. Les technologies dédiées au Big Data (Hadoop, Spark, NoSQL) n’ont pas de secret pour cet informaticien au profil particulièrement technique. Sa fonction reste néanmoins identique à celle d’un architecte de systèmes d’information traditionnels. Elle consiste à mettre en place une structure informatique correctement dimensionnée en fonction des besoins, stable et à un coût raisonnable. Puis à s’assurer que les nouveaux formats de données qui apparaissent s’intègrent bien à l’ensemble.

    « Chief data officer », le chef d’orchestre de la donnée
    A mesure que les « data scientists » font leur arrivée dans les entreprises, le besoin d’une strate d’encadrement se fait jour. Non seulement pour coordonner des équipes qui peuvent atteindre plusieurs dizaines de personnes dans les grands groupes, mais surtout pour ­diffuser la bonne parole dans l’entreprise et ­convaincre les opérationnels de collaborer en bonne intelligence avec ces nouveaux venus. Récemment arrivés et menaçant de tout ­chambouler, les experts de la donnée ne sont, en effet, pas toujours accueillis à bras ouverts. « Le CDO est avant tout un diplomate, souvent un ancien ingénieur mais pas forcément un ancien “data scientist” », fait valoir Jérémy Harroch de Quantmetry. Et pour cause, si les profils de « data ­scientists » juniors sont rares, ceux de « data scientists » seniors capables de prendre la ­direction d’équipes sont quasi inexistants. Là, la surenchère bat son plein, avec de jeunes ­trentenaires rémunérés plus de 100.000 euros brut annuels.

    « Data protection officer », le garant de la légalité
    La loi est dure, mais c’est la loi. Et, en matière de respect des données personnelles ­collectées par les entreprises, elle est sur le point de se corser sérieusement. Un nouveau règlement européen adopté fin avril rend ­obligatoire à partir du 25 mai 2018 la nomination d’un « data protection officer » (DPO) dans les organisations gérant de gros volumes de données personnelles. La ­fonction ressemble à celle des correspondants informatique et libertés (CIL) que les entreprises peuvent depuis plusieurs années intégrer dans leurs équipes pour tenir un registre des données collectées et assurer qu’elles sont correctement constituées, gérées et éventuellement effacées. Sauf que là où son prédécesseur, facultatif, servait essentiellement à obtenir un label de la CNIL, le DPO, obligatoire, « va devoir être rattaché au Comex par exemple et sera désigné sur des critères de compétences avancées à la fois techniques et juridiques », explique l’avocate Garance Mathias. Il lui faudra maîtriser le droit communautaire sur le bout des doigts, car les amendes seront salées : jusqu’à 20 millions d’euros ou 4 % du chiffre d’affaires mondial en cas de manquement grave.

  • Le #big_data n’est pas forcément l’eldorado annoncé
    https://theconversation.com/le-big-data-nest-pas-forcement-leldorado-annonce-52336

    Nos travaux de recherche sur les applications du machine learning dans les domaines de la santé, des sciences de l’ingénieur et des technologies numériques, s’inscrivent plutôt à contre-courant de la doxa actuelle. Pas par principe. Si nous ne remettons pas en cause l’intérêt et l’importance des big data, nous considérons plus pertinent de commencer par travailler le « small », c’est-à-dire les données propres, conceptualisées.
    […]
    La forte demande des entreprises en « #data_scientists » soutient une offre foisonnante de nouvelles formations purement orientées big data. Or, il faut arrêter de mentir aux étudiants. Ce métier n’existe pas. On ne peut pas être simultanément mathématicien, statisticien, programmeur de haut niveau, expert en traitement du signal, en calcul hautes performances, en modélisation des graphes, en capteurs, etc., tout en maîtrisant les ficelles « métier » d’un secteur d’applications.

  • Nos tweets peuvent-ils prédire une attaque cardiaque ? « InternetActu.net
    http://www.internetactu.net/2015/05/06/nos-tweets-peuvent-ils-predire-une-attaque-cardiaque

    Des chercheurs de l’université de Pennsylvanie sous la direction du psychologue Johannes Eichstaedt (directeur du World Well-Being Project) ont analysé 826 millions de tweets provenant de l’ensemble des comtés américains et ont donné à chaque comté un profil émotionnel pour voir si cela se corrélait avec le nombre de décès par maladie cardiaque. Et bien c’était le cas. Les comtés où les tweets contenaient des mots les plus hostiles, agressifs, haineux étaient également ceux où le taux de décès par maladie cardiovasculaire était les plus nombreux. Inversement, là où les tweets avaient tendance à refléter des émotions plus positives, le taux de décès par maladie cardiaque était moins fréquent.

    • Contrairement à ce que fait plus que suggérer le titre et comme le précise bien l’extrait, il ne s’agit en aucun cas d’une « prédiction » au niveau individuel, mais d’un lien entre variables au niveau du comté (3000 comtés aux É.-U., de 80 à 10 M d’habitants, médiane à 25000)…

      Psychological Language on Twitter Predicts County-Level Heart Disease Mortality
      http://pss.sagepub.com/content/early/2015/01/20/0956797614557867.abstract

      Abstract
      Hostility and chronic stress are known risk factors for heart disease, but they are costly to assess on a large scale. We used language expressed on Twitter to characterize community-level psychological correlates of age-adjusted mortality from atherosclerotic heart disease (AHD). Language patterns reflecting negative social relationships, disengagement, and negative emotions—especially anger—emerged as risk factors; positive emotions and psychological engagement emerged as protective factors. Most correlations remained significant after controlling for income and education. A cross-sectional regression model based only on Twitter language predicted AHD mortality significantly better than did a model that combined 10 common demographic, socioeconomic, and health risk factors, including smoking, diabetes, hypertension, and obesity. Capturing community psychological characteristics through social media is feasible, and these characteristics are strong markers of cardiovascular mortality at the community level.

      L’auteur principal est un jeune et brillant doctorant qui se présente ainsi :

      Johannes Eichstaedt
      http://www.jeichstaedt.com

      I am a #data_scientist in psychology. I use Facebook and Twitter to measure the psychological states of large populations, and even small populations. We are characterizing the psychological profiles of communities that support their well-being, or make them sick. 

      I’m a PhD student in psychology at the University of Pennsylvania under Martin Seligman. In 2011 I co-founded the World Well-Being Project, a team that uses clever Natural Language Processing and machine learning to, well, measure the well-being of the world. Eventually.

      #big_data