Seenthis
•
 
Identifiants personnels
  • [mot de passe oublié ?]

 

vide

@touti
//
RSS: vide
tous les messages de vide
  • @touti
    vide @touti 13/05/2020
    1
    @ericw
    1

    Extraction de données en CSV depuis un PDF
    Détection des cellules pour repérer le découpage des tables dans les pages
    ▻https://camelot-py.readthedocs.io/en/master/user/advanced.html
    ▻https://camelot-py.readthedocs.io/en/master/user/how-it-works.html

    $ python pdf_to_csv.py

    Contenu de pdf_to_csv.py
    import camelot
    file = "file.pdf"
    tables = camelot.read_pdf(file, table_regions=['81,475,761,86'], pages="1-end")
    tables.export("def.csv", f="csv", compress = True)

    Concaténer les cvs
    $ cat *.csv >merged.csv

    #camelot
    #python
    #pdf_to_csv

    vide @touti
    • @ericw
      EricW @ericw CC BY-SA 14/05/2020

      Oh pas mal ça. Je garde de côté.

      EricW @ericw CC BY-SA
    • @touti
      vide @touti 17/09/2020

      #OCR #OCR_pdf
      et sans #tesseract mais ça me sert à retrouver ce post

      vide @touti
    Écrire un commentaire

thèmes

  • #camelot
  • #pdf_to_csv
  • #python
À propos de Seenthis Propriété intellectuelle Recommandations API