This location is shown only to members
Rune Kaagaard holder et oplæg under titlen "Konvertering af HTML fra u-semantisk til semantisk form baseret på visuelle cues."
Oplægget vil berøre:
1) Rendering af en webside i en headless version af webkit browseren.
2) Afvikling af javascript i webkit som indsamler information om dom elementer.
3) Analyse og transformation af HTML baseret på hvert dom elements position, størrelse, text-format, etc.
4) Generel oprydning af HTML v.h.a. HTML Tidy, HTML Purifier og phpQuery.
5) Praktiske erfaringer fået undervejs (entities, brug af de nye HTML5 tags, osv.).
Webkit delen bruger PyQt og analysen forgår i et drupal modul.
Metoden er Inspireret af denne bog.
Aha - rjs for php. I'm not sure if I think it's cool or scary. Interesting at least.
Join this Meetup to add comments or questions.
Log in to Meetup with your Facebook account.
Did you see this mad stuff? http://funkatron.com/site/comments/zendcon-09-php-javascr...
