Crowdsensed Mobile Data Analytics

Näytä tavanomaiset kuvailutiedot

dc.contributor Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, tietojenkäsittelytieteen laitos fi
dc.contributor Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, institutionen för datavetenskap sv
dc.contributor University of Helsinki, Faculty of Science, Department of Computer Science en
dc.contributor.author Peltonen, Ella fi
dc.date.accessioned 2018-01-29T06:09:50Z
dc.date.available 2018-02-16 fi
dc.date.available 2018-01-29T06:09:50Z
dc.date.issued 2018-02-26 fi
dc.identifier.uri URN:ISBN:978-951-51-4052-4 fi
dc.identifier.uri http://hdl.handle.net/10138/231682
dc.description.abstract Mobile devices, especially smartphones, are nowadays an essential part of everyday life. They are used worldwide and across all the demographic groups - they can be utilized for multiple functionalities, including but not limited to communications, game playing, social interactions, maps and navigation, leisure, work, and education. With a large on-device sensor base, mobile devices provide a rich source of data. Understanding how these devices are used help us also to increase the knowledge of people's everyday habits, needs, and rituals. Data collection and analysis can thus be utilized in different recommendation and feedback systems that further increase usage experience of the smart devices. Crowdsensed computing describes a paradigm where multiple autonomous devices are used together to collect large-scale data. In the case of smartphones, this kind of data can include running and installed applications, different system settings, such as network connection and screen brightness, and various subsystem variables, such as CPU and memory usage. In addition to the autonomous data collection, user questionnaires can be used to provide a wider view to the user community. To understand smartphone usage as a whole, different procedures are needed for cleaning missing and misleading values and preprocessing information from various sets of variables. Analyzing large-scale data sets - rising in size to terabytes - requires understanding of different Big Data management tools, distributed computing environments, and efficient algorithms to perform suitable data analysis and machine learning tasks. Together, these procedures and methodologies aim to provide actionable feedback, such as recommendations and visualizations, for the benefit of smartphone users, researchers, and application development. This thesis provides an approach to a large-scale crowdsensed mobile analytics. First, this thesis describes procedures for cleaning and preprocessing mobile data collected from real-life conditions, such as current system settings and running applications. It shows how interdependencies between different data items are important to consider when analyzing the smartphone system state as a whole. Second, this thesis provides suitable distributed machine learning and statistical analysis methods for analyzing large-scale mobile data. The algorithms, such as the decision tree-based classification and recommendation system, and information analysis methods presented in this thesis, are implemented in the distributed cloud-computing environment Apache Spark. Third, this thesis provides approaches to generate actionable feedback, such as energy consumption and application recommendations, which can be utilized in the mobile devices themselves or when understanding large crowds of smartphone users. The application areas especially covered in this thesis are smartphone energy consumption analysis in the case of system settings and subsystem variables, trend-based application recommendation system, and analysis of demographic, geographic, and cultural factors in smartphone usage. en
dc.description.abstract Erilaiset älylaitteet, erityisesti älypuhelimet, ovat muodostuneet oleelliseksi osaksi arkipäivän elektroniikan käyttöä. Älypuhelinten käyttö ei rajoitu perinteisiin kommunikaatiotoimintoihin, vaan niillä on voitu korvata monia muita laitteita ja palveluita, kuten pelit, kartat, sosiaalinen media, ja monet Internetin kautta saavutettavat palvelut. Koska laitteita on saatavilla monissa eri hintaluokissa, ne ovat pääsääntöisesti lähes kaikkien saatavilla, myös maailmanlaajuisesti. Aina mukana kannettavan älypuhelimen käyttö tuottaa runsaasti henkilökohtaista tietoa, mikä tarjoaa mahdollisuuden analysoida käyttäjien päivittäistä elämää. Henkilökohtaisia suosituksia hyödyntäen käyttäjille voidaan tarjota tietoa, joka auttaa parantamaan käyttäjäkokemusta ja laajentamaan älylaitteen käyttömahdollisuuksia. Joukkoistava havainnointi tarkoittaa tiedonkeräysmenetelmää, jossa useat erilliset laitteet osallistuvat automaattisesti suuremman datajoukon kartuttamiseen. Puhelinlaitteista tällaista kerättävää dataa ovat muun muassa tieto suorituksessa olevista ja asennetuista sovelluksista, erilaiset järjestelmäasetukset, kuten verkkoyhteystiedot ja näytön kirkkaus, sekä lukuisat muut järjestelmätason parametrit, kuten suorittimen ja muistin käyttö. Automaattista datan keräystä voidaan täydentää käyttäjille lähetettävillä kyselyillä. Älypuhelimista kerättävän datan analysoinnissa on monia vaiheita, jotka tekevät koko prosessista haasteellisen. Automaattisesti kerättyyn dataan päätyy helposti virheitä ja puutteita, joiden käsittely on hallittava. Datan määrä kasvaa helposti teratavuluokkaan, jolloin analysointiin tarvitaan suurten datajoukkojen käsittelyyn sopivia hajautettuja laskenta-alustoja ja algoritmeja. Hyödyllisten suositusten generoimiseksi puhelinlaitteisiin liittyvän analyysin halutaan usein olevan reaaliaikaista, mikä asettaa lisää haasteita analyysin suorituskyvylle. Tässä väitöskirjassa esitetään menetelmiä joukkoistetusti havainnoidun älypuhelindatan käsittelemiseksi tehokkaasti ja hyödyllistä informaatiota tuottaen. Väitöskirjan alussa kuvaillaan älypuhelindatan keräämistä prosessina, datan esikäsittelyä ja siistimistä hyödylliseen ja käsiteltävään muotoon. Väitöskirja esittää, että puhelinlaitteen tila tulisi ottaa huomioon kokonaisuutena, jossa useat eri tekijät, kuten samanaikaisesti suoritettavat sovellukset ja toisiinsa liittyvät järjestelmäasetukset vaikuttavat toisiinsa. Tämän jälkeen väitöskirjassa esitetään joitakin sopivia tilastollisen analyysin ja koneoppimisen menetelmiä, joita väitöskirjan tutkimuksessa on käytetty älypuhelindatan analysointiin. Kaikki näistä menetelmistä ovat suoritettavissa hajautetussa laskentaympäristössä ja toteutettu Apache Spark -järjestelmää käyttäen. Lopuksi väitöskirja näyttää, kuinka analyysiä sovelletaan käytännössä käyttäjille suunnatun palautteen ja suositusten generointiin. Päähuomion saavat puhelinlaitteiden energiankulutuksen analysointi, puhelinsovellusten trendien havainnointi, ja erilaisten kulttuuristen ja sosioekonomisten taustatekijöiden huomiointi mobiilikäyttöä tutkittaessa. fi
dc.format.mimetype application/pdf fi
dc.language.iso en fi
dc.publisher Helsingin yliopisto fi
dc.publisher Helsingfors universitet sv
dc.publisher University of Helsinki en
dc.relation.isformatof URN:ISBN:978-951-51-4051-7 fi
dc.relation.isformatof Helsinki: Unigrafia, 2018, Department of Computer Science, Series of Publications A. 1238-8645 fi
dc.rights Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. fi
dc.rights This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. en
dc.rights Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden. sv
dc.subject fi
dc.title Crowdsensed Mobile Data Analytics en
dc.type.ontasot Väitöskirja (monografia) fi
dc.type.ontasot Doctoral dissertation (monograph) en
dc.type.ontasot Doktorsavhandling (monografi) sv
dc.ths Tarkoma, Sasu fi
dc.ths Nurmi, Petteri fi
dc.opn Lane, Nicholas fi
dc.type.dcmitype Text fi

Tiedostot

Latausmäärä yhteensä: Ladataan...

Tiedosto(t) Koko Formaatti Näytä
Crowdsen.pdf 2.739MB PDF Avaa tiedosto

Viite kuuluu kokoelmiin:

Näytä tavanomaiset kuvailutiedot