Wpisy na blogu oznaczone jako parsery

EpgDownloader

EpgDownloader narodził się czerwcu 2005 roku jako prosty, perlowy skrypt. Parsował wtedy program telewizyjny wirtualnej polski i konwertował go do formatu akceptowanego przez VDR. Przyczyna jego powstania była bardzo prosta. Używałem VDR do oglądania telewizji satelitarnej, która w tamtym czasie nadawała EPG tylko na najbliższe dwie audycje. Nastawienie nagrywania w przyszłości stawało się uciążliwe, a zwykłe przejrzenie programu telewizyjnego niemożliwe. EpgDownloader pozwalał mi cieszyć się programem telewizyjnym w VDR na całe siedem dni naprzód.

Parsowanie stron internetowych z użyciem sfWebBrowser i SimpleXML

sfWebBrowser to klasa emulująca wywołania przeglądarki internetwej. Dzięki niej możemy zaprogramować nawigację po stronie www przy pomocy przyjemnego, obiektowego interfejsu. Odpowiedź może zostać zwrócona jako element SimpleXML, co umożliwia wykonywanie zapytań xpath na parsowanym dokumencie. Niestety strony www rzadko są poprawnymi dokumentami XML. W większości przypadków sfWebBrowser raczej wyrzuci wyjątek, niż zwróci coś interesującego. Jest jednak sposób, aby temu zaradzić.