Title: | Sotahistorian kuvaaminen ja rikastaminen linkitettynä datana |
Author: | Heino, Erkki |
Other contributor: |
Helsingin yliopisto, Matemaattis-luonnontieteellinen tiedekunta, Tietojenkäsittelytieteen laitos
University of Helsinki, Faculty of Science, Department of Computer Science Helsingfors universitet, Matematisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap |
Publisher: | Helsingfors universitet |
Date: | 2017 |
Language: | fin |
URI: |
http://urn.fi/URN:NBN:fi-fe2017112251775
http://hdl.handle.net/10138/229154 |
Thesis level: | master's thesis |
Discipline: |
Computer science
Tietojenkäsittelytiede Datavetenskap |
Abstract: | Linkitetty data mahdollistaa erillisten aineistojen yhdistämisen, mistä syntyvä kokonaisuus mahdollistaa aineistojen tietojen paremman ymmärtämisen. Aineistojen välisten linkkien avulla voidaan päätellä uutta tietoa helpommin kuin tarkastelemalla aineistoja erikseen. Tutkielmassa käsitellään sotahistoriallisten aineistojen mallintamista ja julkaisua linkitettynä avoimena datana sekä aineistojen automaattista rikastamista muiden aineistojen avulla. Työn tavoitteena oli selvittää miten tällaisia aineistoja kannattaa mallintaa linkitettynä datana, miten niitä kannattaa yhdistää muihin aineistoihin, mitä lisäarvoa tästä saadaan ja miten aineistot kannattaa visualisoida. Aineistoina käytettiin tietokirjoista digitoituja tapahtumia sekä Sotamuseon SA-kuvapalvelun valokuvien metatietoja. Aineistot mallinnettiin käyttäen CIDOC CRM -standardia ja niitä rikastettiin linkittämällä niiden sisältämiä resursseja automaattisesti henkilö-, joukko-osasto- ja paikkaontologioiden avulla. CIDOC CRM:n määrittämä tapahtumakeskeinen mallinnustapa mahdollistaa aineistojen yhteentoimivuuden paitsi toistensa myös muiden historiallisten aineistojen kanssa. Automaattiseen rikastamiseen liittyi monia haasteita, sillä viittaukset toisiin aineistoihin oli poimittava suurelta osin tekstimuotoisista kuvauksista, jolloin ongelmaksi nousee nimettyjen entiteettien kuten henkilöiden ja paikkojen tunnistaminen ja yksilöinti tekstistä. Työssä käsitellään kyseisiä haasteita, esitellään käytetyt ratkaisut ja arvioidaan näiden toimivuutta. Aineistoja visualisoimaan toteutettiin myös JavaScript-sovellukset. Aineistot ja sovellukset on julkaistu osana Sotasampo-portaalia, joka muodostaa yhteenlinkitetyn kokonaisuuden erilaisista aineistoista liittyen toiseen maailmansotaan Suomessa. Portaali palvelee paitsi Suomen historiasta ja sodissa taistelleiden omaistensa liikkeistä kiinnostuneita kansalaisia, myös historian tutkijoita tarjoamalla aineistot vapaasti kyseltävässä rakenteisessa muodossa. |
Total number of downloads: Loading...
Files | Size | Format | View |
---|---|---|---|
gradu_erkki_heino.pdf | 3.959Mb |
View/ |