Extraction de données en CSV depuis un PDF
Détection des cellules pour repérer le découpage des tables dans les pages
▻https://camelot-py.readthedocs.io/en/master/user/advanced.html
▻https://camelot-py.readthedocs.io/en/master/user/how-it-works.html
$ python pdf_to_csv.py
Contenu de pdf_to_csv.py
import camelot
file = "file.pdf"
tables = camelot.read_pdf(file, table_regions=['81,475,761,86'], pages="1-end")
tables.export("def.csv", f="csv", compress = True)
Concaténer les cvs
$ cat *.csv >merged.csv