Faculty of Science

 

Recent Submissions

 • Shahriyer, Ahmed Hasan (Helsingin yliopisto, 2020)
  The local sources influence the spatial distribution of air pollutants in urban settings, and these can be quite diverse. For better air quality forecasting, constant monitoring of pollutants, and a high volume of measurements are necessary at many locations. Building a dense air quality network by only using the reference instruments is expensive and not feasible. The use of complementary sensor like Vaisala AQT 420 can help achieve the goal of creating a robust air quality network. As part of the Helsinki metropolitan Air Quality Testbed (HAQT) project, AQT 420 was tested for its suitability as a complmentary component in an air quality monitoring network. AQT 420 is capable of measuring NO2, PM2.5, PM10, CO, O3, SO2, relative humidity (RH), temperature, wind speed (WS), wind direction (WD), and air pressure (AP). Proxies for condensation sink (CS), black carbon (BC), particles number concentration (N), and Pegasor AQ urban diffusion current (PAQDCLDSA, which can be parameterized to calculate lung deposited surface area (LDSA) concentrations) were developed for an urban background site in Helsinki, Finland. The intention is to use variables measured by the AQT 420 and predict additional variables by using proxies. Proxy variables will help to maximize the output of AQT 420 sensors, and giving extra data extraction capability from the sensors. PM2.5, NO2, RH and temperature yielded reliable proxies for both CS and PAQDCLDSA with the correlation coefficient r, 0.85 and 0.83, respectively. While, PM2.5, NO2, and NO2, RH were enough to produce satisfactory proxy parameters for BC (r, 0.80), and N (r, 0.76), respectively. Additionally, a campaign data for sulfuric acid (SA) from Helsinki, Finland site was used to produce a proxy for SA. SO2, global radiation, CS and RH gave the best version of that proxy (r, 0.85).
 • Kurki, Mika (Helsingin yliopisto, 2020)
  The purpose of this study is to analyze performance benefits of Collective Variable-driven Hyperdynamics (CVHD) method over standard molecular dynamics (MD) simulation. Theory of CVHD is an implementation of the hyperdynamics method with some beneficial features of metadynamics. The original implementation of CVHD was modified to work as an addon for COLVARS package of the LAMMPS simulation software with current software versions. About 70 simulations were run and analyzed to verify functionality of CVHD and compare results with CVHD to those without CVHD. The simulated system was the adatom self-diffusion on Copper 001 surface. It was found out that CVHD provides a significant performance boost (several order of magnitudes) over standard MD while preserving physical accuracy for simulation of the diffusion, but only in limited temperature range. With high temperatures CVHD doesn’t speed up the simulation at all compared to standard MD. With low temperatures, it is possible to achieve statistically meaningful number of diffusion events in temperatures where the same with standard MD would require unreasonable long simulations. But also, CVHD slows down at low enough temperatures so that it is impractical. It was also found out that the collective variable used in this context is suitable for counting number of adatom diffusion events, which helps analysis of adatom trajectories. It would be interesting to investigate CVHD more by trying different parametrization and by applying it to also other phenomenon than surface diffusion. The code of CVHD provides possibilities for performance optimizations, for example by utilizing parallel computation.
 • Karhu, Teemu (Helsingin yliopisto, 2020)
  Suomea pidetään ensisijaisesti luontomatkailun kohteena. Luonnon vetovoiman merkitys kuitenkin vaihtelee niin tutkimusten kuin kansallisuuksien ja yksilöidenkin välillä. Matkailun vetovoimakohtaista kysyntää on tutkittu muun muassa haastattelututkimuksin, mutta perinteisillä tutkimusmenetelmillä tarkasteltuna vetovoiman kysynnän ja tarjonnan spatiaalista kohtaamista ei ole voitu selvittää. Uudet, suuriin tietomassoihin perustuvat tutkimusmenetelmät mahdollistavat kokonaan uudenlaisen tutkimuksen. Matkaviestinten käytöstä syntyvät lokitiedot muodostavat tietolähteen, johon perustuen matkaviestinlaitteen käyttäjiä voidaan jäljittää sekä ajassa että paikassa. Matkaviestimet toimivat potentiaalisena aineistolähteenä matkailututkimukselle erityisesti matkailijoiden reittien ja preferenssien esiin tuojana. Matkailun kokemukset luovat ihmisille mielihyvää ja tyytyväisyyden tunnetta. Kokemus nähdään matkailussa arvon tuottajana. Arvon yhdessä luonnin teorian mukaan hyödykkeen arvo on asiakkaan siitä saama käyttöarvo. Arvontuottoon vaikuttaa asiakkaan motivaatio, joka matkailussa vertautuu ihmisen henkilökohtaisiin tarpeisiin ja näkyy kiinnostuksena matkakohteeseen. Kohteen valinta omien mielenkiinnon kohteiden perusteella edesauttaa arvonluonnissa. Millä tavalla matkailijoiden todelliset reitit ja vetovoimatekijät kohtaavat? Voiko reittivalinnoista nähdä, että ihmiset matkustavat omien mielenkiinnonkohteidensa mukaisesti? Tutkimuksessa analysoidaan ulkomaisten matkailijoiden käyttämiä matkareittejä Suomessa suhteessa matkailun vetovoimatekijöihin. Vetovoimatekijöiden luokitus perustuu Suomen matkailun aluerakennetutkimukseen. Visit Finlandin matkailijasegmentointi tuo esiin matkailijoiden mielenkiinnon kohteet. Matkailijoiden reitit pohjautuvat DNA Oyj:n matkaviestinaineistoihin. Analyysin perusteella matkailijoiden reitit kohtaavat luonnonvetovoimaisimmat kohteet heikosti, mikä johtuu pääosin matkailun kaupunkikeskeisyydestä. Kohtaavuus reittien ja muiden vetovoimaluokkien välillä on luonnonvetovoimaa parempi. Tulosten perusteella on syytä pohtia, onnistuuko matkailumarkkinointi viestimään ja kohdistamaan viestinsä oikein, ja ymmärretäänkö viesti oikein. Heikko kohtaavuus henkilökohtaisten toiveiden ja todellisuudessa tapahtuneen matkailun välillä indikoi heikkoa arvontuottoa ja sitä kautta matalaa todennäköisyyttä suositella Suomea matkakohteena tai matkustaa uudelleen Suomeen.
 • Müller, Mitro (Helsingin yliopisto, 2020)
  Maailmanlaajuisissa vuosikeskilämpötiloissa on havaittu lämpenevä kehityssuuntaus esiteolliselta ajalta lähtien. Vuosikeskilämpötilojen muutos Norjan Huippuvuorilla on maailmanlaajuista keskiarvoa voimakkaampaa. Huippuvuorten läntisissä osissa jäätikköjen vetäytyminen on jatkunut jo useita vuosikymmeniä, ja viime vuosikymmeninä biologiset prosessit ovat kiihtyneet. Nämä muutokset ovat todennäköisesti vaikuttaneet Huippuvuorten pääosin sammalpeitteisten tundra-alueiden hiilidynamiikkaan. Alueella on toteutettu vain rajallinen määrä paleoekologisia tutkimuksia, eikä varsinkaan korkeiden leveysasteisten sammalpeitteisten tundra-alueiden vastetta ilmastonmuutokseen vielä täysin ymmärretä. Tämän tutkimuksen tavoitteena oli tutkia maaperän orgaanisen aineksen ja hiilen kertymisnopeuksien viimeaikaisia muutoksia sammalpeitteisillä tundra-alueilla Huippuvuorilla. Maaperän kairausprofiilit kerättiin neljältä koealalta Spitsbergen -saaren läntisistä osista. Radiohiili (14C) ja lyijyajoitusmenetelmiä (210Pb) käytettiin yhdessä ikä-syvyys -mallien ja maaperän ominaisuusanalyysien kanssa hiilen kertymishistorian rekonstruoimiseksi vuodesta 1900 jKr vuoteen 2018 jKr asti. Päätelmiä tukivat meteorologiset mittaukset alueelta. Lisäksi Landsat-satelliittiaineistosta johdettiin vuosittaisia normalisoituja kasvillisuusindeksejä vuodesta 1985 jKr vuoteen 2018 jKr, kasvillisuuden muutosten tutkimiseksi viime vuosikymmeninä. Kasvillisuusindeksien kykyä ennustaa maaperän hiilen kertymisen alueellista ja ajallista vaihtelua arvioitiin erikseen. Kehityssuuntaus pääasiallisesti mineraalipitoisista maaperistä orgaanisiksi maaperiksi havaittiin useissa näytteissä, tämä voi merkitä, että alueilla on käynnistynyt soistumisprosessi. Viimeaikaiset hiilen kertymisnopeudet kasvoivat jokaisella koealalla. Alueen meteorologinen aineisto yhdessä kirjallisuuden kanssa viittasi alueen abioottisten ja bioottisten ympäristötekijöiden yhdessä ilmasto- ja sääolosuhteiden kanssa ohjaavan kertymisprosesseja. Kasvillisuusindeksit osoittivat merkittäviä muutoksia kasvillisuuden rakenteessa ja tuottavuudessa. Viimeaikaisten hiilen kertymisnopeuksien ja kasvillisuusindeksien välisen suhteen arviointi, ei tuottanut luotettavia tuloksia. Maaperän ja ilmakehän välisten hiilivoiden alueellinen ja ajallinen heterogeenisyys tuottaa suuria haasteita tämänhetkisille mallintamismenetelmille. Maaperänäytteiden ja kaukokartoitusaineistojen yhteiskäyttöä tulisi edistää, jotta tulevia muutoksia kyettäisiin mallintamaan tarkemmin.
 • Karjalainen, Jaakko-Pekka (Helsingin yliopisto, 2020)
  Tämä tutkielma käsittelee hiilidioksidin käyttöä hiilen lähteenä orgaanisten yhdisteiden valmistuksessa, kun tarkoitus on luoda uusi sidos hiilidioksidin sisältämän hiilen ja toisen yhdisteen sisältämän hiiliatomin välille. Hiilidioksidin käyttö lähtöaineena on perusteltua sen ympäristövaikutusten sekä helpon saatavuuden ja uusiutuvuuden vuoksi. Tutkielman kirjallisuusosuudessa käsitellään ensin hiilidioksidin aktivoinnin perusteita ja hiilidioksidin muokkausta peruskemikaaleiksi. Tarkemmin perehdytään nikkeli- ja kuparikatalysoituihin alkeenien ja alkyynien karboksylaatioreaktioihin, joissa käytetään hiilidioksidia karboksylaatioreagenssina. Tutkielmassa painotetaan katalyyttisten reaktioiden mekanismeja sekä erilaisten ligandien vaikutusta esiteltäviin mekanismeihin ja katalyyttien aktiivisuuksiin. Erilaisten apuaineiden kuten pelkistimien vaikutusta reaktioiden suotuisuudelle käsitellään myös. Kirjallisuusosuuden lopussa perehdytään makrosyklisiin kuparikomplekseihin, joiden avulla on onnistuttu luomaan uusi hiili-hiili-sidos kahden hiilidioksidimolekyylin välille, mikä toimi lähtökohtana tutkielman kokeelliselle osuudelle. Tutkielman kokeellisessa osuudessa tutkittiin kirjallisuusosuuden lopussa esitettyä kuparikompleksia ja siinä käytettyjen ligandien muokkausta. Muokattujen ligandien vaikutusta kompleksin reaktiivisuuteen hiilidioksidin kanssa tutkittiin. Tarkoituksena oli kasvattaa kompleksin kuparikeskusten välimatkaa, jotta reaktiossa mahdollisesti muodostuva oksalaatti ei olisi yhtä tiukasti kiinni kuparissa. Reaktioita analysoitiin UV-vis-spektrometrisesti sekä onnistuneen kiteytyksen kohdalla röntgendiffraktiolla. Tutkimuksessa todennettiin jo julkaistun kompleksin reagointi ilman sisältämän hiilidioksidin kanssa, mutta uusien reagoineiden tai reagoimattomien kompleksien rakennetta ei onnistuttu varmistamaan.
 • Eloranta, Henni (Helsingin yliopisto, 2020)
  Ympäristöolosuhteet vaikuttavat lajien esiintymiseen ja olosuhteissa tapahtuvat muutokset muuttavat lajien levinneisyyskuvioita. Viimeisimmän jääkauden maksimin (LGM, ~ 21 ka) aikaan ilmasto on ollut nykyistä kylmempi ja kuivempi ja jäätiköt ovat levittäytyneet Euroopassa laajoille alueille, millä on ollut merkittävä vaikutus kasvi- ja eläinpopulaatioiden esiintymiseen sekä biodiversiteettiin aina nykyaikaa myöten. Perinteisen käsityksen mukaan Välimeren niemimaat ovat toimineet eri lajien refugia-alueina, mutta useat paleoekologiset ja fylogeografiset todisteet ovat haastaneet tämän käsityksen, sillä niiden mukaan myös pohjoisemmilla alueilla on voinut olla olosuhteiltaan suotuisia elinalueita niin temperaattisille kuin boreaalisillekin lajeille. Tässä työssä tarkoituksena on tutkia maanisäkkäiden ilmastollisesti potentiaalisia levinneisyysalueita ja potentiaalisen lajirunsauden jakautumista Euroopassa LGM:n aikaan lajilevinneisyysmallinnusta (SDM) hyödyntäen. Tutkimuksen lajiaineistona oli Societas Europaea Mammalogican keräämä havaintoaineisto Euroopan nisäkkäistä 50 x 50 km resoluutiolla, joka esikäsittelyn jälkeen sisälsi 107 lajin esiintymistiedot Euroopassa pituuspiiristä 32° I länteen. Mallinnukset tehtiin koontimenetelmiä hyödyntäen ja selittävinä muuttujina käytettiin ilmastomuuttujia. Projisointi ajassa taaksepäin tehtiin erikseen kolmella erilaisella LGM-ilmastosimulaatiolla, jotta lajeille ilmastollisesti suotuisten alueiden maantieteellisen esiintymisen arvioiminen oli mahdollista. Eri lajiryhmien potentiaalista levinneisyyttä ja lajirunsautta kuvaavat kartat koostettiin lajiryhmään kuuluneiden yksittäisten lajien LGM-projektioista. Mallinnusmenestyksessä oli vaihtelua eri lajien välillä, mutta jokaiselle lajille pystyttiin tekemään koontimallit ja siten myös LGM:n aikaiset levinneisyysennusteet. Eri lajien ilmastollisesti potentiaaliset levinneisyysalueet erosivat toisistaan selvästi sekä kooltaan että sijainniltaan ja olivat yhteydessä lajin nykyiseen levinneisyyteen. Kokonaisuudessaan LGM:n aikainen potentiaalinen lajirunsaus oli keskimääräistä suurempaa Välimeren niemimailla, Länsi-Euroopan eteläosissa, Mustanmeren ympäristössä sekä Karpaattien alueella. Eteläisten lajien levinneisyyden painopiste oli Alppien eteläpuolisilla alueilla ja pohjoisten lajien Alppien pohjois- ja itäpuolella. Pohjoisten lajien potentiaaliset levinneisyysalueet olivat myös keskimäärin isompia kuin eteläisten. Nisäkkäille mallinnettiin ilmastollisesti potentiaalisia levinneisyysalueita laajalti ympäri jääkautista Eurooppaa. Tulokset tukevat ajatusta temperaattisten lajien useammista suotuisista refugia-alueista, joista osa on sijainnut etelän niemimailla ja osa perinteisten eteläisten refugioiden pohjoispuolella. Pohjoiset lajit ovat puolestaan voineet löytää suotuisia elinolosuhteita laajalti keskisestä ja itäisestä Euroopasta eivätkä näin ollen ole välttämättä olleet rajoittuneita ainoastaan tiettyihin refugioihin. Tulosten valossa näyttää siltä, että nisäkkäiden jääkautiset levinneisyyskuviot ovat voineet olla hyvinkin vaihtelevia lajien ominaispiirteistä riippuen eikä LGM:n aikainen ilmasto ole välttämättä rajoittanut merkittävästi kaikkien lajien levinneisyyttä.
 • Kontinen, Joona (Helsingin yliopisto, 2020)
  Tutkielman kirjallisuusosuudessa on käyty läpi erilaisia kaupallisia biopolymeerejä, niiden synteesiä, käyttöä ja biohajoamista. Tutkielman pääpaino on erilaisten materiaalien biohajoamisessa ja näiden materiaalien kaupallisessa käytössä. Biohajoamisen evaluointiin tarkoitettuja standardeja, tutkimusmenetelmiä ja hyväksyntäkriteerejä on esitelty laajasti. Tutkimusosuudessa on valmistettu PLA:n ja PBAT:n seoksesta puukomposiitti ja materiaalin termomekaaniset ominaisuudet on karakterisoitu. Tavoitteena oli luoda biohajoava materiaali, jonka ominaisuudet ovat sellaisia, että sen kaupallinen hyödyntäminen kertakäyttömuovin korvikkeena on järkevää. Materiaalin mekaaniset ominaisuudet karakterisoitiin lopputuotteen kestävyyden, ja sulaominaisuudet kaupallisen tuotannon mahdollistamisen takia. Termomekaanisia analyysejä tehtiin materiaalin säilyvyyden ja lämpöominaisuuksien karakterisoimiseksi. Työssä on tutkittu myös puhtaan PLA/puukomposiitin biohajoamista meriympäristössä. Tutkimuksen tuloksena saatiin luotua riittävällä nopeudella biohajoava puukomposiitti, jonka mekaaniset ominaisuudet ovat riittäviä korvaamaan erilaisia kertakäyttöisiä muovituotteita ja joka on prosesoitavissa nykyisillä ekstruusiolaitteistoilla.
 • Jalli, Heini (Helsingin yliopisto, 2020)
  Aallokon mittaamiseen Itämerellä on vakiintunut käytettäväksi aaltopoiju, joka on ankkuroitava pintapoiju. Kyseinen havaintotapa aiheuttaa mittauskauden lyhenemistä jäätalven vuoksi. Jotta mittauskautta pystyttäisiin pidentämään, tarvitaan mittaussysteemi, jota ei tarvitse nostaa ylös vedestä ennen jäätalvea. Pintavirtauksia mitataan yleisesti pohjaan asennettavilla akustisilla Doppler virtaus profiilimittalaitteilla (ADCP), joissa ei ole reaaliaikaista tiedonsiirtoa. Viimeisten vuosien aikana lähes reaaliaikaista aineistoa lähettävään aaltopoijuun on lisätty pintavirtauksen havainnoinnin mahdollistavat anturit. Tässä tutkielmassa arvioidaan ADCP:n havaintojen luotettavuutta aallokon mittaamisessa verrattuna aaltopoijuun ja vertaillaan aaltopoijun ja ADCP:n virtaushavaintoja toisiinsa. Tässä tutkielmassa käytetty havaintoaineisto on saatu kahden eri vuoden, kesien 2017 ja 2018, aikana toteutetuista mittalaitevertailuista. Mittausjaksot tehtiin Suomenlahdella Hankoniemen itäpuolella. Havaintoaineistolle on tehty laadunvarmistusta ennen kuin niitä on vertailtu. Laaduntarkastuksen kriteerit on saatu mittalaitteiden valmistajien ilmoittamista raja-arvoista, suosituksista ja kirjallisuudessa olevista Suomenlahden aallokko-olosuhteiden raja-arvoista. Havaintoaineistoa on analysoitu ja verrattu toisiinsa aikasarjojen, hajontakuvaajien ja tilastollisten arvojen kautta. ADCP:n ja aaltopoijun merkitsevän aallonkorkeuden vastaavuus on hyvä, mutta ADCP ei pysty havaitsemaan alle 0,5 metrin aallokkoa luotettavasti. Syvemmälle asennettu ADCP aliarvioi suhteellisen systemaattisesti merkitsevää aallonkorkeutta verrattuna aaltopoijun havaintoihin. Aliarviointia on teoriassa mahdollista korjata ja näin parantaa mittauksien vastaavuutta, mutta käytännössä se ei ole järkevää koska se vaatisi uusien vertailujen tekemistä muuan muassa jokaiselle mittalaitteelle ja -paikalle. Huipun periodin ja aallokon suunnan vastaavuus ei ollut tilastollisesti merkittävää ja ADCP:n mittauksia näistä suureista voisi käyttää, tarvittaisiin tarkempaa spektrien analysointia. Aaltopoijun ja ADCP:n pintavirtaushavaintoja vertaillessa on vastaavuutta arvojen välillä, mutta aallokon kasvaessa erot mittauksissa kasvavat. Havaittuja eroja ei voi selittää pelkästään vertailtavien laitteiden mittaussyvyyden erolla, joka oli keskimäärin 1 metri.
 • Ilonen, Annukka (Helsingin yliopisto, )
  In the 21st century, there is an intensified social-political mindset, where people are no longer separated from nature. As a result concepts and theories of ecological research become part of regional policy and spatial planning. At the same time, ecological knowledge, technology orientation and the economic potential created by them form an equilibrium between them. It may, depending on the context, turn to the barrier or benefit of the economy. Talking about the ecologicalization of politics which affecting all spatial planning levels in Finland. It has caused to conflicts in land use planning, when you try to take into account the importance of the nature of knowledge and to protect the directive species, such as flying squirrels. The aim of the study is to find out about the written material and the interviews with the peasants: what the flying squirrel conservation is all about and how it related to the ecologicalization of politics and what are the reasons for the species's conservation zoning conflicts and how can they be solved? As a case study, I will look at the Tramway project in Tampere, from the point of view of the flying squirrel’s conflict and ecologicalization of politics. At the same time, the aim is to develop the concept of ecologicalization of politics and to produce new information about the prevailing greenish social change. Flying squirrel (Pteromys volans) is protect by a politically determined decision in the European Union area and it’s the small-scale night-life mammal which occurs grown up in mixed forests. In the EU, species occur in Finland and small quantities in Estonia and possibly in Latvia. Given that the EU is responding to the problem of state protection, the common species in Finland is the directive specie which requires special protection. The Habitats Directive has been implemented in Finland's National Nature Conservation Act at the end of the 1990s and the directive prohibits the eradication and deterioration of breeding and resting places of the species. In addition, the guiding regulation of the protection of the flying squirrel is included in the Land Use and Building Act, Land Act and Forest Law. Despite the protection of the flying squirrel population is estimated declined from the period after the Second World War in Finland, but the species is classified as held for an eye only. The calculation of population classification has been criticized. The entry into force of the Land Use and Building Act in 2000 was an important legal reform for the protection of the flying squirrel. A key change in the law had made land use planning objectives addition of "conservation of biodiversity and other natural values". In addition, the sections on increasing interaction and impact assessment of zoning have made the planning process more transparent and added the importance of nature enthusiasts. Influencing people often involves complaining about patterns, which is unfortunate. It offers residents the opportunity to influence the surrounding environment and protect nature, such as flying squirrels. Grown up in mixed forests of the flying squirrel favored often set in the cities, because the mixed forests have reduced and fragmented due to forestry in outside the cities. Urban forests directed to a plurality of user requirements, because it can be flying squirrel homeforests, residents recreational use, commercial forest and zoning residences area. Flying squirrel in the comfort of urban forests is challenging because growing cities expand and condense. The protection of the flying squirrel has caused conflict’s situations in many cities. An example of this is Pirkanmaa long flying squirrel conflict history and its recent case in Tampere’s tram project. The tramway is a matter of valuing of the political decision-making, where the construction the tram means ignoring another environmental value, nature conservation. The flexible nature of ecologicalization of politics is manifested in a tramway project, when ecological knowledge of the flying squirrel turns against economic goals and co-operation between actors. For people who benefit from economic growth and for the city's growth, the flying squirrel is a financial slowdown which complicates regional cooperation in Tampere urban area. Although the protection of flying squirrel is not just a matter of protecting the city's local level, but also regional co-operation, as the dynamic species moves away from the municipal boundaries.
 • Jahnsson, Niklas (Helsingfors universitet, 2015)
  Bayesian networks are graphical models used to represent the joint probability distribution for all variables in a data set. A Bayesian network can be constructed by an expert, but learning the network from the data is another option. This thesis is centered around exact score-based Bayesian network structure learning. The idea is to optimize a scoring function measuring the fit of the network to the data, and the solution represents an optimal network structure. The thesis adds to the earlier literature by extending an external memory frontier breadth-first branch and bound algorithm by Malone et al. [MYHB11], which searches the space of candidate networks using dynamic programming in a layered fashion. To detect duplicates during the candidate solution generation, the algorithm uses efficiently both semiconductor and magnetic disk memory. In-memory duplicate detection is performed using a hash table, while a delayed duplicate detection strategy is employed when resorting to the disk. Delayed duplicate detection is designed to work well against long disk latencies, because hash tables are currently still infeasible on disk. Delayed duplicate detection allows the algorithm to scale beyond search spaces of candidate solutions fitting only in the comparatively expensive and limited semiconductor memory at disposal. The sorting-based delayed duplicate detection strategy employed by the original algorithm has been found to be inferior to a hashing-based delayed duplicate strategy in other application domains [Kor08]. This thesis presents an approach to use hashing-based delayed duplicate detection in Bayesian network structure learning and compares it to the sorting-based method. The problem faced in the hashing of candidate solutions to disk is dividing the candidate solutions in a certain stage of the search in an efficient and scalable manner to files on the disk. The division presented in this thesis distributes the candidate solutions into files unevenly, but takes into account the maximum number of candidate solutions that can be held in the semiconductor memory. The method works in theory as long as operating system has free space and inodes to allocate for new files. Although the hashing-based method should in principle be faster than the sorting-based, the benchmarks presented in this thesis for the two methods show mixed results. However, the analysis presented also highlights the fact that by improving the efficiency of, for example, the distribution of hashed candidate solutions to different files, the hashing-based method could be further improved.
 • Toivonen, Juhani (Helsingfors universitet, 2015)
  Computation offloading can be used to leverage the resources of nearby computers to ease the computational burden of mobile devices. Cloudlets are an approach, where the client's tasks are executed inside a virtual machine (VM) on a nearby computing element, while the client orchestrates the deployment of the VM and the remote execution in it. Mobile devices tend to move, and while moving between networks, their address is prone to change. Should a user bring their device close to a better performing Cloudlet host, migration of the original Cloudlet VM might also be desired, but their address is then prone to change as well. Communication with Cloudlets relies on the TCP/IP networking stack, which resolves address changes by terminating connections, and this seriously impairs the usefulness of Cloudlets in presence of mobility events. We surveyed a number of mobility management protocols, and decided to focus on Host Identity Protocol (HIP). We ported an implementation, HIP for Linux (HIPL), to the Android operating system, and assessed its performance by benchmarking throughput and delay for connection recovery during network migration scenarios. We found that as long as the HIPL hipfw-module, and especially the Local Scope Identifier (LSI) support was not used, the implementation performed adequately in terms of throughput. On the average, the connection recovery delays were tolerable, with an average recovery time of about 8 seconds when roaming between networks. We also found that with highly optimized VM synthesis methods, the recovery time of 8 seconds alone does not make live migration favourable over synthesizing a new VM. We found HIP to be an adequate protocol to support both client mobility and server migration with Cloudlets. Our survey suggests that HIP avoids some of the limitations found in competing protocols. We also found that the HIPL implementation could benefit from architectural changes, for improving the performance of the LSI support.
 • Eklund, Krister (Helsingfors universitet, 2015)
  Ilmaisia tyypin I virtualisointijärjestelmiä on tarjolla useita. Tässä työssä vertaillaan Hyper-V Server-, Proxmox VE-, vSphere Hypervisor- ja XenServer-järjestelmiä keskenään laitteistovaatimusten, asennuksen, hallittavuuden, ominaisuuksien, resurssien seurannan, suorituskyvyn, varmuuskopioinnin ja päivittämisen suhteen. Järjestelmät asennettiin vuorotellen testikokoonpanolle, jolla arviointi tehtiin. Eroja löytyi kaikilta osa-alueilta. Tulokset koottiin taulukkoon, josta keskinäinen vertailu on yksinkertaista.
 • Sotala, Kaj (Helsingfors universitet, 2015)
  This thesis describes the development of 'Bayes Academy', an educational game which aims to teach an understanding of Bayesian networks. A Bayesian network is a directed acyclic graph describing a joint probability distribution function over n random variables, where each node in the graph represents a random variable. To find a way to turn this subject into an interesting game, this work draws on the theoretical background of meaningful play. Among other requirements, actions in the game need to affect the game experience not only on the immediate moment, but also during later points in the game. This is accomplished by structuring the game as a series of minigames where observing the value of a variable consumes 'energy points', a resource whose use the player needs to optimize as the pool of points is shared across individual minigames. The goal of the game is to maximize the amount of 'experience points' earned by minimizing the uncertainty in the networks that are presented to the player, which in turn requires a basic understanding of Bayesian networks. The game was empirically tested on online volunteers who were asked to fill a survey measuring their understanding of Bayesian networks both before and after playing the game. Players demonstrated an increased understanding of Bayesian networks after playing the game, in a manner that suggested a successful transfer of learning from the game to a more general context. The learning benefits were gained despite the players generally not finding the game particularly fun. ACM Computing Classification System (CCS): - Applied computing - Computer games - Applied computing - Interactive learning environments - Mathematics of computing - Bayesian networks
 • Sudulaganti, Raviteja (Helsingfors universitet, 2015)
  RFID technology emerged as the promising technology for its ease of use and implementation in the ubiquitous computing world. RFID is deployed widely in various applications that use automatic identification and processing for information retrieval. The primary components of an RFID system are the RFID tag (active and passive), the reader and the back-end server (database). Cost is the main factor that drove RFID tags to its immense utilization in which passive tags dominate in today's widely deployed RFID practice. Passive tags are low cost RFID tags conjoined to several consumer products (like clothes, smart cards and devices, courier, container, etc) for the purpose of unique identification. Readers on the other hand act as a source to track and record the passive RFID tag's activities (like modifications, updates and authentication). Due to the rapid growth of RFID practice in the past few years, measures for consumer privacy and security has been researched. The uncertainties that arise with the passive RFID tags are handling of user's private information (like name, ID, house address, credit card number, health statement, etc) which are posed to considerable threat from the adversary. Passive tags are inexpensive and contain less overhead and are considered good performers and consequently lack in providing security and privacy. Lightweight cryptography is an area of cryptography developed for low cost resourced environment. Mutual authentication is defined as the process of verifying an authorized tag and a reader (reader and server respectively) by an agreed algorithm to mutually prove their legitimacy with each other. Adversary is a third party who tries to hear the ongoing communication between the tag and the reader (reader and server respectively) anonymously. In this thesis, symmetric lightweight ciphers like Present and Grain are introduced as mutual authentication protocols to rescue the privacy aspects and properties of the RFID tags. These ciphers are simple, faster and suitable to implement within the passive RFID network and reasonably lay a foundation for the preservation of privacy and security of the RFID system. Lightweight ciphers use hash functions, pseudo random generators, SP networks and linear feedback shift registers to randomize data while mutual authentication scheme uses lightweight ciphers to manage authorize the legitimacy of every device in the RFID network.
 • Ye, Yina (Helsingfors universitet, 2015)
  Gesture recognition is a fundamental technology for understanding human behavior and providing natural human-computer interaction, of which the need has been boosted by the popularity of ubiquitous systems and applications. Currently, there are mainly two classes of gesture recognition approaches: parametric methods and the template matching methods. Although both approaches provide accurate recognition performance, the former is usually highly constrained in time and resources, while the latter is limited within a small range of gesture types that are simple and distinct from each other. The objective of the thesis is to present a novel stroke-based gesture recognition solution, Gestimator, that recognizes dynamic hand gestures with high accuracy, run-time efficiency, and ease for customization, considering a wide range of complexity, ambiguity, and difficulty for user to perform the gesture. A stroke-wise elastic gesture matching framework alongside an adaptive sequence segmentation technique were developed for improving recognition accuracy. We conducted extensive evaluations using three datasets that included pen-based command gestures, character gestures, and mid-air gestures collected from a user authentication experiment. Results from extensive benchmark evaluations prove that Gestimator achieves higher overall accuracy, compared with three state-of-the-art gesture recognizers, dealing with both touch-screen based gestures (98:9%) and spatial gestures (96:61%). Results also show that Gestimator outperforms baseline methods on recognizing ambiguous gestures.
 • Tuominen, Pasi (Helsingfors universitet, 2015)
  Tietovarannoissa esiintyy monesti useita tietueita, jotka kuvaavat samaa objektia. Tässä tutkielmassa on vertailtu näiden tietueiden löytämiseen käytettäviä menetelmiä. Kokeet on suoritettu aineistolla, jossa on 6,4 miljoonaa bibliografista tietuetta. Menetelmien vertailussa käytettiin aineistossa olevien teosten nimekkeitä. Eri menetelmien kahta keskeistä piirrettä on mitattu: löydettyjen duplikaattien lukumäärää ja niiden suhdetta muodostettujen kandidaattien lukumäärään. Kahden menetelmän yhdistelmä osoittautui parhaaksi aineiston deduplikointiin. Järjestetyllä naapurustolla löytyi eniten varsinaisia duplikaatteja, mutta myös eniten irrelevantteja kandidaatteja. Suffiksitauluryhmittelyn avulla löytyi lisäksi joukko duplikaatteja joita muilla menetelmillä ei löytynyt. Yhdessä nämä kaksi menetelmää löysivät lähes kaikki duplikaatit mitä kaikki tutkielmassa verratut menetelmät löysivät. Levenshtein-etäisyyteen perustuvat virhesietoiset menetelmät osoittautuivat tehottomiksi nimekkeiden deduplikoinnissa.
 • Rasku, Lari Olavi (Helsingfors universitet, 2015)
  This thesis considers the problem of preprocessing polygons with holes for efficient two-point Euclidean shortest path queries. Special attention is given to the 1999 paper 'Two-Point Euclidean Shortest Path Queries in the Plane', which sketched a number of solutions to the problem and whose results remain the best in the field. This thesis reviews four of the algorithms presented in the paper and fleshes them out when possible.
 • Lei, Jinmin (Helsingfors universitet, 2016)
  Despite of the efficiency brought by the high-throughput technology in detecting protein-protein interactions, different wet-lab methods still pose different pitfalls. As a complementary strategy, dry-lab methods are less expensive and have an advantage of data fusion that overcomes the biases of individual data sources. This thesis explores the indicative features and the effect of a graph model in the protein-protein interaction prediction task as well as the capability of the multiple kernel learning algorithms in improving the prediction performance.Different kernels are applied in accordance with different features. We integrate 14 global and 10 graph features respectively in the SVM framework via different kernel methods, and then compare the prediction performances of different features. When applying the graph features, we represent individual proteins as labeled graphs and then apply three different graph kernels to explore which one can best capture the relationships between proteins. For merging heterogeneous data, we apply different multiple kernel learning algorithms and explore their capabilities in improving the prediction accuracy. We formulate the prediction of protein-protein interactions as a binary classification problem and in the SVM framework, we need to reconstruct the kernel which measures the similarity between protein pairs from the kernel which measures the similarity between proteins. For this goal, we employ three different pairwise kernels in the SVM framework and explore their effects in capturing the relationships between protein pairs. We perform experiments on 896 Saccharomyces Cerevisiae (baker's yeast) proteins and report the prediction performances of the three pairwise kernels on 10 graph and 14 global features, as well as the prediction results of different multiple kernel learning algorithms. Our experimental results reveal that the overall prediction performance achieved by the 10 graph features applied to the proposed graph model is better than that achieved by the 14 protein global features, and that among all multiple kernel learning methods, the align wins over the others in the protein-protein interaction prediction task. Our methods detect the interacting proteins at a high level. Based on this work, low-level models can be devised to detect the exact interacting spots between proteins.
 • Lu, Yao (Helsingfors universitet, 2016)
  This thesis is an investigation of unsupervised learning for image classification. The state-of-the-art image classification method is Convolutional Neural Network (CNN), which is a purely supervised learning method. We argue that despite of the triumph of supervised learning, unsupervised learning is still important and compatible with supervised learning. For example, in the situation where some classes have no training data at all, so called zero-shot learning task, unsupervised learning can leverage supervised learning to classify the images of unseen classes. We proposed a new zero-shot learning method based on CNN and several unsupervised learning algorithms. Our method achieves the state-of-the-art results on the largest public available labelled image dataset, ImageNet fall2011.
 • Althermeler, Nicole (Helsingfors universitet, 2016)
  Metagenomics promises to shed light on the functioning of microbial communities and their surrounding ecosystem. In metagenomic studies the genomic sequences of a collection of microorganisms are directly extracted from a specific environment. Up to 99% of microbes cannot be cultivated in the lab; thus, traditional analysis techniques have very limited applicability in this challenging setting. By directly extracting the sequences from the environment, metagenomic studies circumvents this dilemma. Thus, metagenomics has become a powerful tool in the analysis of the diversity and metabolic capability of environmental microbes. However, metagenomic studies have challenges of their own. In this thesis we investigate several aspects of metagenomic data set analysis, focusing on means of (1) verifying adequacy of taxonomic unit and enzyme representation and annotation in the sample, (2) highlighting similarities between samples by principal component analysis, (3) visualizing metabolic pathways with manually drawn metabolic maps from the Kyoto Encyclopedia of Genes and Genomes, and (4) estimating taxonomic distributions of pathways with a novel strategy. A case study of deep bedrock groundwater metagenomic samples will illustrate these methods. Water samples from boreholes, up to 2500 meter deep, of two different sites of Finland display the applicability and limitations of aforementioned methods. In addition publicly available metagenomic and genomic samples serve as baseline references. Our analysis resulted in a taxonomic and metabolic characterization of the samples. We were able to adequately retrieve and annotate the metabolic content based on the deep bedrock samples. The visualization provided a tool for further investigation. The microbial community distribution could be characterized on higher levels of abstraction. Previously suspected similarities to fungi or archaea were not verified. First promising results were observed with the novel strategy in estimating taxonomic distributions of pathways. Further results can be found at: http://www.cs.helsinki.fi/group/urenzyme/deepfun/

View more