Extraction de données en CSV depuis un PDF Détection des cellules pour repérer le découpage des…

vide 13/05/2020

Extraction de données en CSV depuis un PDF
Détection des cellules pour repérer le découpage des tables dans les pages
▻https://camelot-py.readthedocs.io/en/master/user/advanced.html
▻https://camelot-py.readthedocs.io/en/master/user/how-it-works.html

$ python pdf_to_csv.py

Contenu de pdf_to_csv.py

import camelot

file = "file.pdf"

tables = camelot.read_pdf(file, table_regions=['81,475,761,86'], pages="1-end")

tables.export("def.csv", f="csv", compress = True)

Concaténer les cvs

$ cat *.csv >merged.csv

#camelot
#python
#pdf_to_csv

vide