A cikkben jogi szövegek automatikus többcímkés osztályozását vizsgáljuk. A feladat nagy mennyiségű betanító adatot igényel, azonban ha az osztályozás kivitelezhető a többnyelvű EUROVOC tezaurusz terminusai alapján, akkor elméleti lehetőség nyílik arra, hogy egy meghatározott nyelvű korpuszon betanított osztályozó nyelvfüggetlenül működhessen. A bináris relevancia módszerén alapuló osztályozónkat horvát korpuszon tanítottuk be, és bár teljesítménye horvát szövegeken elfogadható, kis méretű annotált magyar mintánkra alkalmazva gyenge eredményt mutatott. Ennek legvalószínűbb oka a horvát és a magyar korpusz közötti különbség a terminus- és címkeeloszlás szempontjából
Az orosz szociológia a kelet-európai hagyományokba illeszkedik. Ezt az is alátámasztja, hogy nem el...
A társadalmak jólétét, gazdasági erejét jelentős mértékben befolyásolja az a képesség, hogy tudnak-e...
A tanulmány célja, hogy megállapítsuk, hogy az angol nyelv szabadalmakban milyen arányban fordulnak ...
Az automatikus beszédfelismerő rendszerek szószintű hibáját hagyományosan egy illesztési távolságon ...
Az írott szövegből hangzó beszédet előállító rendszerek egyik alapvető komponensének feladata a szöv...
A felsőoktatási tájékoztató1 szerint egyre több egyetem és főiskola oldja meg a diszlexia problémájá...
A Budapesti Corvinus Egyetem, illetve annak jogelődjei ezelőtt 70 évvel kezdte meg működését. A Köz...
Kerekasztal-beszélgetés egy nemrég megjelent könyvről (Simai Mihály: A harmadik évezred nyitánya. A ...
Leopold Mozart nagy hírű hegedűiskolájának megjelenése (1756) óta gazdag és jelentős irodalma van a ...
Izrael napjainkban a high-tech termékek gyártásával a világ élvonalába tartozik. Ez köszönhető annak...
Ungváry Krisztián: A Horthy-rendszer és antiszemitizmusának mérlege. Diszkrimináció és társadalompol...
A Budapesti Corvinus Egyetem, illetve annak jogelődjei ezelőtt 70 évvel kezdte meg működését. A Köz...
Kell-e még egyáltalán magyarul szakkönyvet kiadni, különösen a nemzetközi monetáris politika gyakor...
A latin nyelv elleni, XVIII. század végi vádbeszédekben már kiteljesedett a magyar nyelv ápolását a...
A kortárs építészet rendkívül heterogén, és ennek okai nyilvánvalóan összefüggnek a kor szellemi meg...
Az orosz szociológia a kelet-európai hagyományokba illeszkedik. Ezt az is alátámasztja, hogy nem el...
A társadalmak jólétét, gazdasági erejét jelentős mértékben befolyásolja az a képesség, hogy tudnak-e...
A tanulmány célja, hogy megállapítsuk, hogy az angol nyelv szabadalmakban milyen arányban fordulnak ...
Az automatikus beszédfelismerő rendszerek szószintű hibáját hagyományosan egy illesztési távolságon ...
Az írott szövegből hangzó beszédet előállító rendszerek egyik alapvető komponensének feladata a szöv...
A felsőoktatási tájékoztató1 szerint egyre több egyetem és főiskola oldja meg a diszlexia problémájá...
A Budapesti Corvinus Egyetem, illetve annak jogelődjei ezelőtt 70 évvel kezdte meg működését. A Köz...
Kerekasztal-beszélgetés egy nemrég megjelent könyvről (Simai Mihály: A harmadik évezred nyitánya. A ...
Leopold Mozart nagy hírű hegedűiskolájának megjelenése (1756) óta gazdag és jelentős irodalma van a ...
Izrael napjainkban a high-tech termékek gyártásával a világ élvonalába tartozik. Ez köszönhető annak...
Ungváry Krisztián: A Horthy-rendszer és antiszemitizmusának mérlege. Diszkrimináció és társadalompol...
A Budapesti Corvinus Egyetem, illetve annak jogelődjei ezelőtt 70 évvel kezdte meg működését. A Köz...
Kell-e még egyáltalán magyarul szakkönyvet kiadni, különösen a nemzetközi monetáris politika gyakor...
A latin nyelv elleni, XVIII. század végi vádbeszédekben már kiteljesedett a magyar nyelv ápolását a...
A kortárs építészet rendkívül heterogén, és ennek okai nyilvánvalóan összefüggnek a kor szellemi meg...
Az orosz szociológia a kelet-európai hagyományokba illeszkedik. Ezt az is alátámasztja, hogy nem el...
A társadalmak jólétét, gazdasági erejét jelentős mértékben befolyásolja az a képesség, hogy tudnak-e...
A tanulmány célja, hogy megállapítsuk, hogy az angol nyelv szabadalmakban milyen arányban fordulnak ...