#Matilda : Le moteur de recherche académique ouvert
–-> #alternative à #Google_scholar
▻https://matilda.science
#recherche #moteur_de_recherche
#Matilda : Le moteur de recherche académique ouvert
–-> #alternative à #Google_scholar
#Moteurs_de_recherche_scientifiques : les alternatives à #Google_Scholar
Google Scholar n’est pas le seul à permettre aux universitaires, aux chercheurs et aux ingénieurs de dénicher la perle rare sur le Net. Explications.
▻http://www.techniques-ingenieur.fr/actualite/web-thematique_89430/moteurs-de-recherche-scientifiques-les-alternatives-a-google-sc
#science #recherche
Most and Least Studied Places on Earth: Google Scholar Results for <Country>
▻http://www.reddit.com/r/MapPorn/comments/28x1hx/most_and_least_studied_places_on_earth_google
It’s also mapped Per Capita and Per Km, with a full article explaining the details of how it was done.
Et pour la part de l’étranger dans les #médias français, plus spécifiquement dans les #journaux_télévisés :
▻http://www.inatheque.fr/publications-evenements/ina-stat/ina-stat-n-33.html
How computer-generated fake papers are flooding academia
▻http://www.theguardian.com/technology/shortcuts/2014/feb/26/how-computer-generated-fake-papers-flooding-academia
Insolite : quand des articles générés par #ordinateur s’invitent chez les éditeurs #universitaires
▻http://www.clubic.com/insolite/actualite-686226-insolite-articles-generes-ordinateur-editeurs-universaires.
Un programme informatique permettant de générer de faux articles universitaires a permis à de nombreux chercheurs de composer des textes complètement incohérents, et pourtant publiés, ces dernières années. Un système développé par un universitaire français a récemment révélé la supercherie.
Un article généré par SciGenConçu en 2005 par 3 étudiants de l’Institut de technologie du Massachusetts (MIT), le logiciel #SciGen permet de générer aléatoirement des résumés d’études scientifiques. Cette usine à #canulars est disponible gratuitement sur #Internet depuis près de 10 ans, et une découverte récente a permis de constater qu’elle était utilisée depuis longtemps par des #scientifiques pour soumettre de faux sujets de recherches à l’occasion de congrès, ou à destination de #maisons_d'édition.
A la base conçu pour critiquer et tester la rigueur du secteur universitaire concernant des sujets d’études parfois totalement incompréhensibles – et pour cause – SciGen a fini par piéger des éditeurs sérieux. Lundi 24 févier, Springer et IEEE, deux maisons d’édition basées aux USA et en Allemagne, ont ainsi annoncé la suppression de 120 articles totalement erronés de leurs archives. Ils avaient tous été conçus via SciGen.
Un Français découvre le pot-aux-roses
La découverte de cette supercherie est due à Cyril Labbé, un chercheur de l’université Joseph-Fourier de Grenoble. Ce dernier a conçu en 2012 un système qui permet d’identifier les articles composés à l’aide de SciGen. Car le système, qui créé des phrases aléatoires à l’aide de chaînes de mots et intègre même des tableaux, des graphiques et des sources, compose des articles qui tiennent du #charabia_scientifique pour les profanes, et n’attire pas nécessairement l’attention si on ne se penche pas concrètement dessus. La méthode de détection de Cyril Labbé, disponible en ligne, permet de rechercher du vocabulaire spécifique utilisé par SciGen. Des dizaines d’articles erronés ont ainsi été décelés.
Springer et IEEE ne sont pas les seules victimes du phénomène : le site Nature explique que des dizaines de documents générés par SciGen sont disponibles en ligne, notamment sur #Google_Scholar.
Reste à savoir comment de tels documents peuvent circuler et même être publiés alors qu’ils n’ont pas de sens réel. Cyril Labbé évoque le fait que de nombreux articles sont associés à des conférences tenues en Chine, et associées à des auteurs chinois. Les éditeurs pris au piège se font quant à eux discrets sur la question.
SCIgen
►http://pdos.csail.mit.edu/scigen
SCIgen is a program that generates random Computer Science research papers, including graphs, figures, and citations. It uses a hand-written context-free grammar to form all elements of the papers. Our aim here is to maximize amusement, rather than coherence.
« Academic Search Engine Spam and Google Scholar’s Resilience Against it » est une très intéressante étude sur la résistance (ou plutôt la non-résistance) de #Google_Scholar au #spam. Un chercheur inéthique peut-il « empoisonner » Google Scholar de façon à faire remonter sa cote ? Oui, et assez facilement, montre cet article, qui illustre par des expériences le fait que Google Scholar n’a même pas les protections anti-spam qu’utilise me moteur de recherches traditionnel de Google.
Si vous êtes vous-même un chercheur inéthique, vous trouverez dans cet article plein d’idées pour améliorer votre indice de citations :-)
►http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0013.305
Sur le même sujet, j’avais publié un très court article montrant que les sources de Scholar sont très variées et pas toujours très académiques ►http://www.bortzmeyer.org/google-scholar-et-sql.html