Szemantikus web technológiák alkalmazási lehetőségei az „exploratory” OLAP-ban - PhDData

Access database of worldwide thesis




Szemantikus web technológiák alkalmazási lehetőségei az „exploratory” OLAP-ban

The thesis was published by Molnár, Géza Gábor, in October 2022, Corvinus University of Budapest.

Abstract:

Az utĂłbbi Ă©vtizedben a strukturálatlan adatok (pl. szövegek) mennyisĂ©ge sokkal nagyobb mĂ©rtĂ©kben nĹ‘tt, mint a strukturált adatokĂ©. Ez nem kis mĂ©rtĂ©kben a közössĂ©gi mĂ©diának Ă©s az okos eszközök elterjedĂ©sĂ©nek köszönhetĹ‘. A nagy mennyisĂ©gű adat tárolása egyelĹ‘re nem okoz gondot, mivel a tárolĂł eszközök ára az utĂłbbi idĹ‘ben jelentĹ‘sen csökkent, kapacitásuk viszont közben növekedett. A strukturálatlan adatok feldolgozásával viszont más a helyzet. A nagy adatmennyisĂ©g miatt sokszor remĂ©nytelen, hogy hasonlĂł feladatokat manuálisan vĂ©gezzĂĽnk el. EzĂ©rt manapság kĂĽlönösen fontos, hogy olyan számĂ­tĂłgĂ©pes eljárásokat dolgozzunk ki, amely lehetĹ‘vĂ© teszi a strukturálatlan – többnyire szöveges – adatok feldolgozását Ă©s elemzĂ©sĂ©t.
A strukturálatlan adatok feldolgozása, mint probléma sok részterületet érint, többek között a tudásreprezentáció, a szemantikus technológiák, az adat-, web-, és szövegbányászatot, a mesterséges intelligencia részterületeit ezen belül a tanuló algoritmusok témáját is. A struktúra alkotás fontos eszközei a szemantikus technológiák, ezek közül az ontológiák, amelyek egy adott terület fogalmi leírását adják meg. Segítségükkel egy adott területre jellemző fogalmak és a közöttük lévő kapcsolatok definiálhatók.
Kutatási témám a szemantikus technológiák (elsősorban ontológiák) adattárházakban való felhasználásával kapcsolatos. Olyan megoldásokat vizsgálok, amelyek lehetővé teszik a strukturált és nem strukturált adatok együttes elemzését az adattárház/üzleti intelligencia rendszerekben. Az ilyen rendszereket a szakirodalomban exploratory OLAP rendszereknek is nevezik.
Az exploratory OLAP rendszerek területe meglehetősen új, a legelső modellek a szakirodalomban alig több, mint tíz éve jelentek meg. Fontos megjegyezni, hogy a legtöbb ilyen modell megmaradt koncepcionális szinten. Néhány esetben készült ugyan prototípus, viszont azok általános alkalmazhatósága még nem igazolt.
Kutatásom során a következő kérdések megválaszolását tűztem ki célul: • Hogyan tehető szemantikussá a hagyományos OLAP és az adattárház, vagyis hogyan lehet megtervezni a szemantikus réteg integrációját az adattárházba?
• Hogyan lehet a megtervezett modellt a gyakorlatban megvalósítani egy prototípus segítségével?
• Mi lehet egy hatékony validálási módszer az „exploratory OLAP” modell esetében?
A kutatás elvégzéséhez többféle módszert is alkalmaztam. A módszerek közé tartozik a design science, az adatgyűjtés és adatelemzés, az ontológia fejlesztési és értékelési módszertan, valamint a prototípus készítése során alkalmazott fejlesztési módszertan.
A kutatás fontosabb eredményei a következők:
• A helpdesk/ticketing ontológia elkészítése. Erre nem találtam meglévő releváns példát a szakirodalomban. Az általam készített változat nem fedi le az egész ticketing területet, elsősorban a hibabejelentésekre (incidensek) fókuszál. A ticketing ontológiákból két verziót is készítettem. Az első verzió egy kétszintű taxonómia, amely elősegíti a szemantikus keresést az incidensekben. Az ontológia második (továbbfejlesztett) verziója jobban írja le a ticketing rendszer működését, azon belül is az incidensek kezelését. További jellemzője, hogy ebben az osztály-alosztály kapcsolaton kívül más kapcsolatok, illetve az osztály tulajdonságok is megjelenjenek.
• Exploratory OLAP prototípusok elkészítése. Az exploratory OLAP prototípusok közül nagyon kevés működő változat van a gyakorlatban. A kutatás során általam létrehozott prototípusok felhasználnak meglévő modelleket (Prasad, Abello), de azokat átalakítva, és a szükséges mértékig leegyszerűsítve. A prototípusok értékelésére egy validálási rendszert is kidolgoztam és alkalmaztam.



Read the last PhD tips