Semantička integracija heterogenih izvorišta podataka

Vrsta
Kratica
Šifra
Voditelj
Početak
Završetak
ZNA

036-0361983-2012
Prof dr. sc. Mirta Baranović
2.1.2007.
31.12.2013.

Opis projekta

Istraživanje nje provedeno u području interoperabilnosti i semantičke integracije heterogenih izvorišta podataka, koje bi u konačnici rezultiralo izgradnjom programskog okvira za izgradnju aplikacija temeljenih na interoperabilnosti i semantičkoj integraciji heterogenih izvorišta podataka u različitim okruženjima i na različitim arhitekturama heterogenih sustava. Arhitekture i mrežne topologije na kojima bi se primijenjivale takve aplikacije su vrlo različite. Radi o interoperabilnosti i semantičkoj integraciji najrazličitijih heterogenih aplikacija i izvorišta podataka koje su razvijane neovisno jedna o drugoj, a danas trebaju surađivati i razmjenjivati podatke. Pod distribuiranim i mobilnim bazama podataka podrazumijevamo relativno stabilna okruženja s unaprijed poznatim sustavima koji su se dogovorili da će surađivati, dok je peer-to-peer okruženje vrlo dinamično te se sustavi spontano uključuju u suradnju i isto tako spontano isključuju. U skladištima podataka ostvaruje se integracija podataka iz heterogenih izvorišta podataka, bilo da su ta izvorišta podataka vlasništvo same organizacije, bilo da dolaze iz okruženja. Aplikacije semantičke mreže (Semantic Web) koje se danas pomalo pojavljuju, predstavljaju idealne sudionike u integraciji, ali i sudionike koji će poslužiti za ispitivanje razvijenih rješenja.

 

Okruženja u kojima se obavlja istraživanje mogu se činiti raznorodnima i preširokima za ovakav projekt. Međutim sa svim, ili gotovo svim ovim okruženjima susretat će se projektanti i graditelji nekog složenog informacijskih sustava. S obzirom da u okolini podataka ima u izobilju, informacijski sustavi će se sve više  baviti izborom izvorišta podataka, pribavljanjem podataka iz tih izvorišta te integracijom pribavljenih podataka s onima iz drugih izvora i onim sadržanim u vlastitim bazama podataka. Vrijeme planirano za izgradnju informacijskog sustava obično je prekratko za istraživanja koja ponekad možda i neće dovesti do rješenja te se najčešće pribjegava korištenju postojećih koncepata i iznalaze brza rješenja koja tada rezultiraju upitnom kvalitetom samog sustava. Istraživanja koja je potrebno provesti prelaze okvire i mogućnosti razvoja jednog informacijskog sustava, a dobivena rješenja bilo bi moguće iskoristiti i u mnogim drugim primjenama.

 

Zbog svega toga, u okviru ovog projekta istražuje se problematika interoperabilnosti i semantičke integracije u različitim okruženjima, definiraju se specifičnosti svakog od tih sustava, ali i uočavaju sličnosti koje su  temelj za definiciju i izgradnju zajedničke jezgre sustava. Prilikom izgradnje sustava, zajedničkoj jezgri bit će dodani dijelovi potrebni za realizaciju aplikacija u nekom specifičnom okruženju.

 

Istraživanje se obavlja na području aplikacija temeljenih na uslugama (SOA - Service-oriented Aplications), mrežnih usluga (Web Services) kao posrednika u pribavljanju podataka, aktivnog XML-a tj. mogućnostima proširenja XML dokumenta pozivima mrežnih usluga te semantičkog weba (Semantic Web) kao semantički bogatog izvorišta podataka koji se temelji na ontologijama. Radi se na ekstrakciji semantički relevantnih podataka s Weba i drugih izvorišta, njihovom međusobnom integriranju te njihovom integriranjem u skladište podataka. Proučavaju se različite mrežne topologije i metode pohrane i dohvata podataka u suradničkim (peer-to-peer, P2P) okruženjima, pogotovo u području kombiniranja P2P sustava i Web usluga. Predložit će se i implementirati proširenje funkcionalnosti aktivnog XML-a. Ispitati će se potencijal mreža podataka (data grids) kao infrastrukture koja omogućava upravljanje velikim količinama distribuiranih podataka i transparentni pristup podacima u svim čvorovima sustava. Analizirat će se tehnologije za implementaciju OGSA arhitekture (Open Grid Services Architecture) koja omogućuje da aplikacije mreža podataka mogu registrirati usluge, održavati njihovo stanje i komunicirati s drugim aplikacijama. Predložit će se tehnološka rješenja za implementaciju OGSA arhitekture uključujući mogućnost korištenja ontologija.

Ciljevi

Cilj ovog istraživanja je koncipiranje postupaka za bolje iskorištenje postojećih podataka iz različitih izvora, obogaćivanje aplikacija znanjem o strukturi i značenju podataka s kojima upravljaju te omogućavanje takvim aplikacijama da bez posredovanja čovjeka razmjenjuju podatke i integriraju ih u smislene i primjeni primjerene cjeline. Istraživanje će se provoditi na području primjene novih tehnoloških rješenja u području suvremenog upravljanja podacima (Modern Data Management). Cilj je koncipirati i izgraditi programski okvir za izgradnju takvih semantički osviještenih aplikacija koje će olakšati izgradnju različitih suvremenih informacijskih sustava, skladišta podataka, sustava za upravljanje sadržajem, odnosno znanjem. Isto tako, razvojem programskog okvira pokušat će se omogućiti da se na standardizirani i sistematičan način postojeće aplikacije semantički obogate, tako da se iz postojećih znanja o njima i modela na kojima počivaju ekstrahira svo postojeće znanje koje će se uobličiti na način pogodan za njihovu kooperaciju s drugim takvim aplikacijama. Prilikom koncipiranja i izgradnje programskog okvira uzet će se u obzir različite arhitekture postojećih izvorišta podataka i njihova kooperacija u topološki različitim okruženjima. Također će se voditi računa o najrazličitijim područjima primjene aplikacija razvijenih uz pomoć programskog okvira definiranog kroz ovaj projekt te će krajnja svrha izgrađenog programskog okvira biti njegova primjena u različitim domenama i područjima primjene. Ciljevi su razvijati znanja, koncepte, paradigme i pilot rješenja u području semantičke integracije heterogenih izvorišta podataka, izgradnje suvremenih informacijskih sustava temeljenim na uslugama.

Očekivani rezultat

Rezultati istraživanja primjenjivi su u izgradnji aplikacija u kojima je nužna interoperabilnost i integracija podataka iz heterogenih izvora. To su prvenstveno aplikacije temeljene na uslugama usmjerene na različita područja primjene čiji se podaci nalaze u različitim sustavima, gdje su modeli i značenja sličnih podataka različita, odnosno, u kojima su definirane različite ontologije za istu domenu. Razvijene metode za postizanje interoperabilnosti i semantičke integracije podataka također će imati će značajnu primjenu u području izgradnje skladišta podataka i sustava za potporu odlučivanju te naročito sustava za prikupljanje, transformaciju i punjenje podataka u skladište podataka i sustava osiguranja kvalitete podataka u skladištima podataka. Primjenom razvijenih metoda olakšat će se izgradnja sustava za nadopunu skladišta podataka u stvarnom i proširenom stvarnom vremenu. Razmjena podataka i efikasno publiciranje podataka sadržanih u relacijskim i objektno-relacijskim bazama podataka mogu imati značajne primjene u sustavima za upravljanje sadržajima, odnosno sustavima za upravljanje znanjem.