Darbā ir apskatītas Tīmekļa rasmošanas (harvesting) problēmas, ar kurām saskārušās rasmošanas organizācijas, kā arī darba autors, veicot rasmošanas eksperimentus. Tiek aprakstīta hipotētiska uzlabota rasmošanas sistēma, kas varētu izvairīties no noskaidrotajām problēmām. Lietojot Hadoop skaitļošanas platformu, ir analizēti rasmotie dati un ir secināts, ka 67% no lejupielādētā satura satur dublējoša teksta lapas. Ir izstrādāts dublējošo saišu klasifikators, kas spēj klasificēt 80% no dublējošā satura saitēm. Heritrix rasmošanas robotam ir izveidots modulis efektīvākai oriģināla Tīmekļa satura lejupielādei, kas balstīts uz klasifikatora filtriem. Uz praktiski veikto eksperimentu bāzes ir konstatēts, ka izstrādātā risinājuma paredzēto dublējoš...
Proje, makale, tez gibi çalışmaların başarıya ulaşmasında rol oynayan etkenlerin başında çalışma önc...
A lot of information can be found and extracted from the semantic web in different forms through web...
There are two problems associated with conventional web crawling techniques: a crawler cannot know i...
Vairums cilvēkiem, ar atrasto un izpētīto informāciju internetā ir pietiekami, tomēr ir tādi cilvēki...
Rasmošana ir veids kā ātri iegūt nepieciešamo informāciju no tīmekļu vietnēm. Darba mērķis ir izstrā...
Bu tez çalışmasında,kişisel bilgi hasatlama işlemleriyapan çalışmalar ile yazılım uygulamaları incel...
Šis darbas skirtas ištirti galimybes automatizuotai rinkodaros duomenų gavybai iš internetinių šalti...
U okviru suradnje u izgradnji i održavanju Hrvatskoga arhiva weba (HAW; http://haw.nsk.hr) tijekom s...
Táto bakalárska práca sa zaoberá extrakciou dát z webu (web scraping) a následným zobrazovaním týcht...
Darbā mērķis ir papildus funkcionalitātes izveidošana dotajai sistēmai, automātiski apstrādājot datu...
World Wide Web has become an enormously big repository of data. Extracting, integrating and reusing ...
Maģistra darbs ir veltīts aktuālai tēmai mūsdienās – informācijas meklēšana Internetā un datu ieguve...
Vairums mūsdienu cilvēku, ja rodas nepieciešamība noskaidrot kādu specifisku informāciju, atbildes m...
Darbe nagrinėjami Lietuvos žemės ūkio subjektų pagrindinės veiklos pokyčiai. Ūkininkų ir gyventojų a...
Internetā kopumā ir pieejams liels informācijas apjoms, taču bieži vien vajadzīgā informācija ir sad...
Proje, makale, tez gibi çalışmaların başarıya ulaşmasında rol oynayan etkenlerin başında çalışma önc...
A lot of information can be found and extracted from the semantic web in different forms through web...
There are two problems associated with conventional web crawling techniques: a crawler cannot know i...
Vairums cilvēkiem, ar atrasto un izpētīto informāciju internetā ir pietiekami, tomēr ir tādi cilvēki...
Rasmošana ir veids kā ātri iegūt nepieciešamo informāciju no tīmekļu vietnēm. Darba mērķis ir izstrā...
Bu tez çalışmasında,kişisel bilgi hasatlama işlemleriyapan çalışmalar ile yazılım uygulamaları incel...
Šis darbas skirtas ištirti galimybes automatizuotai rinkodaros duomenų gavybai iš internetinių šalti...
U okviru suradnje u izgradnji i održavanju Hrvatskoga arhiva weba (HAW; http://haw.nsk.hr) tijekom s...
Táto bakalárska práca sa zaoberá extrakciou dát z webu (web scraping) a následným zobrazovaním týcht...
Darbā mērķis ir papildus funkcionalitātes izveidošana dotajai sistēmai, automātiski apstrādājot datu...
World Wide Web has become an enormously big repository of data. Extracting, integrating and reusing ...
Maģistra darbs ir veltīts aktuālai tēmai mūsdienās – informācijas meklēšana Internetā un datu ieguve...
Vairums mūsdienu cilvēku, ja rodas nepieciešamība noskaidrot kādu specifisku informāciju, atbildes m...
Darbe nagrinėjami Lietuvos žemės ūkio subjektų pagrindinės veiklos pokyčiai. Ūkininkų ir gyventojų a...
Internetā kopumā ir pieejams liels informācijas apjoms, taču bieži vien vajadzīgā informācija ir sad...
Proje, makale, tez gibi çalışmaların başarıya ulaşmasında rol oynayan etkenlerin başında çalışma önc...
A lot of information can be found and extracted from the semantic web in different forms through web...
There are two problems associated with conventional web crawling techniques: a crawler cannot know i...