Szemantikus web technológiák alkalmazási lehetőségei az „exploratory” OLAP-ban
Az utĂłbbi Ă©vtizedben a strukturálatlan adatok (pl. szövegek) mennyisĂ©ge sokkal nagyobb mĂ©rtĂ©kben nĹ‘tt, mint a strukturált adatokĂ©. Ez nem kis mĂ©rtĂ©kben a közössĂ©gi mĂ©diának Ă©s az okos eszközök elterjedĂ©sĂ©nek köszönhetĹ‘. A nagy mennyisĂ©gű adat tárolása egyelĹ‘re nem okoz gondot, mivel a tárolĂł eszközök ára az utĂłbbi idĹ‘ben jelentĹ‘sen csökkent, kapacitásuk viszont közben növekedett. A strukturálatlan adatok feldolgozásával viszont más a helyzet. A nagy adatmennyisĂ©g miatt sokszor remĂ©nytelen, hogy hasonlĂł feladatokat manuálisan vĂ©gezzĂĽnk el. EzĂ©rt manapság kĂĽlönösen fontos, hogy olyan számĂtĂłgĂ©pes eljárásokat dolgozzunk ki, amely lehetĹ‘vĂ© teszi a strukturálatlan – többnyire szöveges – adatok feldolgozását Ă©s elemzĂ©sĂ©t.
A strukturálatlan adatok feldolgozása, mint problĂ©ma sok rĂ©szterĂĽletet Ă©rint, többek között a tudásreprezentáciĂł, a szemantikus technolĂłgiák, az adat-, web-, Ă©s szövegbányászatot, a mestersĂ©ges intelligencia rĂ©szterĂĽleteit ezen belĂĽl a tanulĂł algoritmusok tĂ©máját is. A struktĂşra alkotás fontos eszközei a szemantikus technolĂłgiák, ezek közĂĽl az ontolĂłgiák, amelyek egy adott terĂĽlet fogalmi leĂrását adják meg. SegĂtsĂ©gĂĽkkel egy adott terĂĽletre jellemzĹ‘ fogalmak Ă©s a közöttĂĽk lĂ©vĹ‘ kapcsolatok definiálhatĂłk.
Kutatási témám a szemantikus technológiák (elsősorban ontológiák) adattárházakban való felhasználásával kapcsolatos. Olyan megoldásokat vizsgálok, amelyek lehetővé teszik a strukturált és nem strukturált adatok együttes elemzését az adattárház/üzleti intelligencia rendszerekben. Az ilyen rendszereket a szakirodalomban exploratory OLAP rendszereknek is nevezik.
Az exploratory OLAP rendszerek terĂĽlete meglehetĹ‘sen Ăşj, a legelsĹ‘ modellek a szakirodalomban alig több, mint tĂz Ă©ve jelentek meg. Fontos megjegyezni, hogy a legtöbb ilyen modell megmaradt koncepcionális szinten. NĂ©hány esetben kĂ©szĂĽlt ugyan prototĂpus, viszont azok általános alkalmazhatĂłsága mĂ©g nem igazolt.
Kutatásom során a következő kérdések megválaszolását tűztem ki célul: • Hogyan tehető szemantikussá a hagyományos OLAP és az adattárház, vagyis hogyan lehet megtervezni a szemantikus réteg integrációját az adattárházba?
• Hogyan lehet a megtervezett modellt a gyakorlatban megvalĂłsĂtani egy prototĂpus segĂtsĂ©gĂ©vel?
• Mi lehet egy hatékony validálási módszer az „exploratory OLAP” modell esetében?
A kutatás elvĂ©gzĂ©sĂ©hez többfĂ©le mĂłdszert is alkalmaztam. A mĂłdszerek közĂ© tartozik a design science, az adatgyűjtĂ©s Ă©s adatelemzĂ©s, az ontolĂłgia fejlesztĂ©si Ă©s Ă©rtĂ©kelĂ©si mĂłdszertan, valamint a prototĂpus kĂ©szĂtĂ©se során alkalmazott fejlesztĂ©si mĂłdszertan.
A kutatás fontosabb eredményei a következők:
• A helpdesk/ticketing ontolĂłgia elkĂ©szĂtĂ©se. Erre nem találtam meglĂ©vĹ‘ releváns pĂ©ldát a szakirodalomban. Az általam kĂ©szĂtett változat nem fedi le az egĂ©sz ticketing terĂĽletet, elsĹ‘sorban a hibabejelentĂ©sekre (incidensek) fĂłkuszál. A ticketing ontolĂłgiákbĂłl kĂ©t verziĂłt is kĂ©szĂtettem. Az elsĹ‘ verziĂł egy kĂ©tszintű taxonĂłmia, amely elĹ‘segĂti a szemantikus keresĂ©st az incidensekben. Az ontolĂłgia második (továbbfejlesztett) verziĂłja jobban Ărja le a ticketing rendszer működĂ©sĂ©t, azon belĂĽl is az incidensek kezelĂ©sĂ©t. További jellemzĹ‘je, hogy ebben az osztály-alosztály kapcsolaton kĂvĂĽl más kapcsolatok, illetve az osztály tulajdonságok is megjelenjenek.
• Exploratory OLAP prototĂpusok elkĂ©szĂtĂ©se. Az exploratory OLAP prototĂpusok közĂĽl nagyon kevĂ©s működĹ‘ változat van a gyakorlatban. A kutatás során általam lĂ©trehozott prototĂpusok felhasználnak meglĂ©vĹ‘ modelleket (Prasad, Abello), de azokat átalakĂtva, Ă©s a szĂĽksĂ©ges mĂ©rtĂ©kig leegyszerűsĂtve. A prototĂpusok Ă©rtĂ©kelĂ©sĂ©re egy validálási rendszert is kidolgoztam Ă©s alkalmaztam.
http://phd.lib.uni-corvinus.hu/1242/
https://doi.org/10.14267/phd.2022062
https://doi.org/10.14267/phd.2022062
http://phd.lib.uni-corvinus.hu/1242/1/Molnar_Geza_dhu.pdf