Seenthis
•
 
Identifiants personnels
  • [mot de passe oublié ?]

  • https://seenthis.net
  • /messages

/943637

  • @fil
    Fil @fil 18/06/2015
    5
    @biggrizzly
    @tartisdm
    @james
    @0gust1
    @b_b
    5
    @lazuly

    #csvkit
    ▻https://csvkit.readthedocs.org

    Convert Excel to CSV:
    in2csv data.xls > data.csv

    Convert JSON to CSV:
    in2csv data.json > data.csv

    Print column names:
    csvcut -n data.csv

    Select a subset of columns:
    csvcut -c column_a,column_c data.csv > new.csv

    Reorder columns:
    csvcut -c column_c,column_a data.csv > new.csv

    Find rows with matching ells:
    csvgrep -c phone_number -r 555-555-\d{4}" data.csv > matching.csv

    Convert to JSON:
    csvjson data.csv > data.json

    Generate summary statistics:
    csvstat data.csv

    Query with SQL:
    csvsql --query "select name from data where age > 30" data.csv > old_folks.csv

    Import into PostgreSQL:
    csvsql --db postgresql:///database --insert data.csv

    Extract data from PostgreSQL::
    sql2csv --db postgresql:///database --query "select * from data" > extract.csv

    pour la plupart de ces trucs j’utilise #q mais @lazuly préfère #csvkit alors…

    Fil @fil
    • @0gust1
      0gust1 @0gust1 CC BY-NC 20/12/2016

      Le lien vers la doc de la dernière version (le site de doc a l’air un peu cassé) :
      ▻http://csvkit.readthedocs.io/en/540

      Lien vers le dépot sur github :
      ▻https://github.com/wireservice/csvkit

      pour q, voir : ►https://seenthis.net/messages/219474

      0gust1 @0gust1 CC BY-NC
    • @fil
      Fil @fil 12/01/2022

      dsq pour lire des fichiers en mode sql ►https://seenthis.net/messages/943637

      Fil @fil
    Écrire un commentaire
  • @fil
    Fil @fil 20/01/2014
    5
    @kent1
    @denisb
    @lazuly
    @booz
    @b_b
    5
    @archiloque

    #q - du #SQL en ligne de commande
    ►https://github.com/harelba/q

    The following command will provide the total size for each date. Notice that the size is in c5.

     q "SELECT c6,SUM(c5) AS size FROM exampledatafile GROUP BY c6"

    #outil #data via @archiloque

    Fil @fil
    • @fil
      Fil @fil 20/01/2014

      plein d’autres #outils ici ►http://seenthis.net/messages/177125

      Fil @fil
    • @fil
      Fil @fil 7/02/2014

      voir aussi #textql, qui semble faire un peu pareil ▻http://seenthis.net/messages/225658

      Fil @fil
    • @fil
      Fil @fil 12/01/2022

      et dsq, qui lit plein de formats
      ►https://seenthis.net/messages/943637

      Fil @fil
    Écrire un commentaire
  • @fil
    Fil @fil 20/09/2013
    9
    @severo
    @james
    @kent1
    @stephane
    @liotier
    @booz
    @0gust1
    @simplicissimus
    @b_b
    9

    7 command-line tools for data science | Jeroen Janssens
    ▻http://jeroenjanssens.com/2013/09/19/seven-command-line-tools-for-data-science.html

    1. #jq - sed for JSON
    ▻https://stedolan.github.io/jq

    2. #json2csv - convert JSON to CSV

    3. #csvkit - suite of utilities for converting to and working with CSV

    4. #scrape - HTML extraction using XPath or CSS selectors

    5. #xml2json - convert XML to #JSON

    6. #sample - when you’re in debug mode

    7. #Rio - making #R part of the pipeline

    (PS : je recommande de renommer sample en #samply, car sample existe déjà)

    #outils #data

    Fil @fil
    • @fil
      Fil @fil 20/09/2013

      et pour installer ces outils, il faut trouver à chaque fois la bonne invocation ; mes notes :

      GOPATH=~/Source/gocode go get github.com/jehiah/json2csv
      sudo pip install csvkit
      sudo pip install lxml
      sudo pip install cssselect
      npm install xml-mapping
      npm install xml2json-command

      Fil @fil
    • @fil
      Fil @fil 20/09/2013

      voir aussi ▻https://github.com/clarkgrubb/data-tools

      Fil @fil
    • @fil
      Fil @fil 20/01/2014

      ajouter #q : ►http://seenthis.net/messages/219474

      Fil @fil
    • @fil
      Fil @fil 15/08/2016
      @archiloque

      @archiloque vient de repérer gron, une alternative à jq pour manipuler du #JSON
      ▻https://github.com/tomnomnom/gron

      Fil @fil
    • @stephane
      Stéphane Bortzmeyer @stephane CC BY-SA 16/08/2016
      @fil @archiloque

      @Fil @Archiloque J’ai testé gron, l’idée de base (formater le JSON d’une manière qui permettte à un grep normal de fonctionner) est bonne, mais il a moins de possibilité que jq.

      Stéphane Bortzmeyer @stephane CC BY-SA
    • @booz
      BoOz @booz 5/01/2017

      #visualisation_de_données

      BoOz @booz
    • @stephane
      Stéphane Bortzmeyer @stephane CC BY-SA 9/08/2017

      Sur jq, mon article d’introduction : ▻http://www.bortzmeyer.org/jq.html #jq #JSON

      Stéphane Bortzmeyer @stephane CC BY-SA
    • @fil
      Fil @fil 12/01/2022

      dsq pour lire des fichiers en mode SQL
      ►https://seenthis.net/messages/943637

      Fil @fil
    Écrire un commentaire