Une base de donnée ouverte du web pourrait donner naissance au prochain Google - Technology Review
▻http://www.technologyreview.com/news/509931/a-free-database-of-the-entire-web-may-spawn-the-next-google
Common Crawl - ►http://commoncrawl.org - utilise un web crawler pour faire une copie géante du web et le rendre accessible à tous. L’idée rendre accessible des ressources qui permettrait de rivaliser avec Google. Hébergé dans les nuages d’Amazon, la base de donnée permet à un programmeur pour 25 $ d’y accéder. Le système est utilisé notamment par TinEye, un moteur de recherche d’image inversé. En tout cas, Common Crawl s’annonce comme un outil précieux pour les start-ups. Tags : (...)