Radionica: kako skrejpovati B92 (ili bilo koji drugi sajt)

U nedavno objavljenoj analizi skrejpovanja sajta B92, autor Branko Kokanović pokazao je, između ostalog, da se dnevno na sajtu izbaci 288 vesti, da je četvrtak najzauzetiji dan, a da su peakovi objavljivanja ujutru u 11 i poslepodne od 17h i uveče u 22h.
Naredne srede, 24. februara od 19.30, Branko će zajedno sa prisutnima proći kroz ovu analizu i ponuditi uvid u još neke bitne stavke svakog skrejping procesa:
- šta je scraping i kako može pomoći vašem startapu (ali i u svakodnevnom životu),
- osnovi HTTP protokola (kroz wireshark će pokazati šta se dešava kada se ode na neki manji sajt),
- scraping pomoću web alata (Firebug u Firefoxu, na primer),
- scraping na primeru real-life aplikacije
Meetup se održava u Startit Centru, a možete se prijaviti ovde:
Autor: ITD Ekipa
DODAJ KOMENTAR