[xml] Parser HTML




Hi all,
I should write a html parser for my company.
After studing different solutions, I suggested my boss to use libxml2 HTMLParser.
Obviously my parser should be a general web parser, which extracts information from the web.
You know, probably better than me, that the web is full of spammig web page: color spamming, text spamming, 
....
Could you advice me some anti-spamming algoritm, which I can integrate with HTMLParser? 
Where can I find some information?

Thanks very much for your support

Bye

--Marco

-------------------------------------------------------------------------
NUOVA WEBMAIL DI INTERFREE!

Da oggi Interfree offre a tutti i suoi utenti un nuovissimo servizio 
di WebMail tra i più evoluti e una qualità professionale che si rinnova 
di continuo:

-       Controllo antivirus
-       Filtro antispamming
-       Configurazione di account esterni
-       Accesso gratuito a InterDrive dove salvare e organizzare i tuoi 
        file da qualsiasi computer e in qualsiasi momento ...

Iscriviti gratuitamente all'indirizzo http://www.interfree.it e prova il 
nuovo servizio!

Lo Staff di Interfree 
-------------------------------------------------------------------------




[Date Prev][Date Next]   [Thread Prev][Thread Next]   [Thread Index] [Date Index] [Author Index]