Těžení dat z webu je, společně s tím jak se množství dat na internetu neustálezvětšuje, stále důležitějším oborem informačních technologií. Hlavním cílem práce je vytvoření nástroje schopného automatické extrakce zajímavých dat z webových stránek a experimentální ověření jeho efektivity. Nástroj byl vytvořen v JavaScriptu a bylo ověřeno, že v případě přítomnosti sémantických anotací na webových stránkách je nástroj schopen spolehlivě extrahovat informace, v ostatních případech je kvalita extrakce nižší. Výstup práce bude možné využít jak sám o sobě, tak při vývoji dalších nástrojů pracujících s webem, jako jsou crawlery či scrapery.The bigger the Internet gets, the more important it is to be able to efficiently extract data from it. The mai...
V diplomskem delu smo splošno opisali spletne strgalnike in pregledali nekatere najbolj razširjene b...
U sklopu rada proučavaju se različite metode i dostupni alati otvorenog koda (eng. Open Source) za i...
Internets šobrīd ir lielākā cilvēka radītā un publiski pieejamā zināšanu krātuve pasaulē. Diemžēl HT...
Táto bakalárska práca sa zaoberá extrakciou dát z webu (web scraping) a následným zobrazovaním týcht...
V této práci jsem se zaměřil na stále rostoucí význam automatického zpracování webových stránek. Náp...
Táto diplomová práca sa zaoberá súčasným stavom technológií používaných na sťahovanie webových strán...
V diplomskem delu smo se ukvarjali z razvojem spletne aplikacije, ki omogoča širši množici uporabnik...
World Wide Web has become an enormously big repository of data. Extracting, integrating and reusing ...
This bachelor thesis deals with the web aplication that is designed for the data extraction from HTM...
The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an...
Tato práce je zaměřena na automatizované zpracování dynamických webových stránek vyžadujících JavaSc...
This thesis deals with data extraction from web pages created in HTML language. It describes methods...
Tato práce se zabývá vývojem nástroje umožňující web scraping. Cílí především na uživatele, kteří ne...
Cílem této bakalářské práce je navrhnout a naimplementovat experimentální prototyp nástroje, který b...
Uporabniki svetovnega spleta se dnevno soočamo z iskanjem informacij. Pri iskanju le teh so nam v ve...
V diplomskem delu smo splošno opisali spletne strgalnike in pregledali nekatere najbolj razširjene b...
U sklopu rada proučavaju se različite metode i dostupni alati otvorenog koda (eng. Open Source) za i...
Internets šobrīd ir lielākā cilvēka radītā un publiski pieejamā zināšanu krātuve pasaulē. Diemžēl HT...
Táto bakalárska práca sa zaoberá extrakciou dát z webu (web scraping) a následným zobrazovaním týcht...
V této práci jsem se zaměřil na stále rostoucí význam automatického zpracování webových stránek. Náp...
Táto diplomová práca sa zaoberá súčasným stavom technológií používaných na sťahovanie webových strán...
V diplomskem delu smo se ukvarjali z razvojem spletne aplikacije, ki omogoča širši množici uporabnik...
World Wide Web has become an enormously big repository of data. Extracting, integrating and reusing ...
This bachelor thesis deals with the web aplication that is designed for the data extraction from HTM...
The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an...
Tato práce je zaměřena na automatizované zpracování dynamických webových stránek vyžadujících JavaSc...
This thesis deals with data extraction from web pages created in HTML language. It describes methods...
Tato práce se zabývá vývojem nástroje umožňující web scraping. Cílí především na uživatele, kteří ne...
Cílem této bakalářské práce je navrhnout a naimplementovat experimentální prototyp nástroje, který b...
Uporabniki svetovnega spleta se dnevno soočamo z iskanjem informacij. Pri iskanju le teh so nam v ve...
V diplomskem delu smo splošno opisali spletne strgalnike in pregledali nekatere najbolj razširjene b...
U sklopu rada proučavaju se različite metode i dostupni alati otvorenog koda (eng. Open Source) za i...
Internets šobrīd ir lielākā cilvēka radītā un publiski pieejamā zināšanu krātuve pasaulē. Diemžēl HT...