Author Avatar

Fabrizio S.

0

Share post:

Vediamo in questa guida questo potente parser per leggere i dati da un documento in PDF per il linguaggio PHP.

In teoria fino a poco tempo fa leggere , avere un estratto dei dati in PDF era un impresa improba con molti linguaggi. Da qualche anno a questa parte si sono sviluppate molto librerie che ci vengono incontro.

In assoluto la più potente libreria che abbiamo trovato è PDF Parser ed è distribuita sotto licenza GPLv2 license (Open Source).

PDF Parser con PHP

Per installare questo Software avrete bisogno che il device sia provvisto della versione PHP almeno 5.3.

Installazione PDF Parser con Linux

Se avete sul vostro dispositivo una distribuzione Linux i passi che dovrete seguire per l’installazione sono i seguenti.

Ovviamente dovrete utilizzare Composer come accade ormai in quasi tutte le librerie del linguaggio PHP.

Quindi scrivete il vostro file composer.json in questa maniera

File composer.json per scaricare la libreria

ora eseguite il seguente compando per scaricare la libreria.

scaricamento librerie PDF Parser con PHP

per ogni buon conto diamo anche un aggiornamento

Aggiornamento l libreria con Composer

creiamo quindi il file autoload.php con il comando

creazione file autoload.php di composer

a questo punto testiamo la corretta installazione con il comando

Vi lascio infine due possibili implementazioni

Nella prima leggiamo il contenuto di un documento PDF

Esempio estrazione dati con codice PHP e libreria PDF Parser

Vi faccio notare che document.pdf è nella direttori radice. Ma se invece volete leggere un documento esterno lo ptete fare senza problemi mettendo al posto del document.pdf l’url assoluto che volete raggiungere https://www.path.estensione. Unica limitazione che al momento non hanno creato la libreria per potere leggere i documenti criptati. Ovviamente previa immissione di una psw.

Oppure se invece siete solamente interessati alla lettura dei metadata il codice che dovrete eseguire è il seguente.

Esempio estrazione Metadati

La libreria la potete trovare come sempre su github. Vi ricordo che per utilizzare Composer sotto Windows lo dovrete prima averlo installato e dopo dalla Run di Dos o dal Powershell di Windows 10 ripetere i comandi indicati sopra omettendo la $.

E anche per questa articolo è tutto. Per qualsiasi dubbio o informazioni non esitate a contattarmi. Altrimenti ci sentiamo alla prossima guida.

Come attivare Windows Defender contro i Ransomware
Che cosa è il Piggyback?