PHP comodo strip_tags( ) funzione rimuove i tag HTML che sembrano , , o . Tuttavia, non capisce i tag è la rimozione. Sarà ciecamente rimuovere il tag di apertura e chiusura in stile
, ma lasciare il codice dello stile di confondere l’analisi del testo. Questa rimozione tag semplicistica causa anche le parole su entrambi i lati delle etichette da incollare, creando difficile analizzare il testo.
Per risolvere questi problemi, è necessario elaborare alcuni tag prima di utilizzare strip_tags() . Questo è fatto facilmente con alcune espressioni regolari che:
Rimuovere coppie di tag HTML e contenuti racchiusi per gli stili, gli script, oggetti incorporati, ecc
Aggiungere interruzioni di linea attorno a livello di blocco per evitare che i tag parola unirsi problemi dopo la rimozione del tag.
Una volta fatto questo, chiamare strip_tags() per rimuovere i tag rimanenti.
Di seguito è riportato il codice di esempio per fare questo. Le sue espressioni regolari sono più dettagliati di quanto strettamente necessario, ma aiuta a rendere più chiara la funzione. Maggiori spiegazioni seguire in sezioni dopo il codice.
/ **
* Rimuovere i tag HTML, compreso il testo invisibile, come stile e
* Codice di script e oggetti incorporati. Aggiungere interruzioni di linea attorno
* A livello di blocco per evitare che i tag parola unirsi dopo la rimozione del tag.
* /
strip_html_tags funzione ($ testo)
{
$ Text = preg_replace (
array (
/ / Rimuovi contenuto invisibile
‘@
‘@