Crowdsensed Mobile Data Analytics

Show full item record

Permalink

http://urn.fi/URN:ISBN:978-951-51-4052-4
Title: Crowdsensed Mobile Data Analytics
Author: Peltonen, Ella
Contributor: University of Helsinki, Faculty of Science, Department of Computer Science
Thesis level: Doctoral dissertation (monograph)
Abstract: Mobile devices, especially smartphones, are nowadays an essential part of everyday life. They are used worldwide and across all the demographic groups - they can be utilized for multiple functionalities, including but not limited to communications, game playing, social interactions, maps and navigation, leisure, work, and education. With a large on-device sensor base, mobile devices provide a rich source of data. Understanding how these devices are used help us also to increase the knowledge of people's everyday habits, needs, and rituals. Data collection and analysis can thus be utilized in different recommendation and feedback systems that further increase usage experience of the smart devices. Crowdsensed computing describes a paradigm where multiple autonomous devices are used together to collect large-scale data. In the case of smartphones, this kind of data can include running and installed applications, different system settings, such as network connection and screen brightness, and various subsystem variables, such as CPU and memory usage. In addition to the autonomous data collection, user questionnaires can be used to provide a wider view to the user community. To understand smartphone usage as a whole, different procedures are needed for cleaning missing and misleading values and preprocessing information from various sets of variables. Analyzing large-scale data sets - rising in size to terabytes - requires understanding of different Big Data management tools, distributed computing environments, and efficient algorithms to perform suitable data analysis and machine learning tasks. Together, these procedures and methodologies aim to provide actionable feedback, such as recommendations and visualizations, for the benefit of smartphone users, researchers, and application development. This thesis provides an approach to a large-scale crowdsensed mobile analytics. First, this thesis describes procedures for cleaning and preprocessing mobile data collected from real-life conditions, such as current system settings and running applications. It shows how interdependencies between different data items are important to consider when analyzing the smartphone system state as a whole. Second, this thesis provides suitable distributed machine learning and statistical analysis methods for analyzing large-scale mobile data. The algorithms, such as the decision tree-based classification and recommendation system, and information analysis methods presented in this thesis, are implemented in the distributed cloud-computing environment Apache Spark. Third, this thesis provides approaches to generate actionable feedback, such as energy consumption and application recommendations, which can be utilized in the mobile devices themselves or when understanding large crowds of smartphone users. The application areas especially covered in this thesis are smartphone energy consumption analysis in the case of system settings and subsystem variables, trend-based application recommendation system, and analysis of demographic, geographic, and cultural factors in smartphone usage.Erilaiset älylaitteet, erityisesti älypuhelimet, ovat muodostuneet oleelliseksi osaksi arkipäivän elektroniikan käyttöä. Älypuhelinten käyttö ei rajoitu perinteisiin kommunikaatiotoimintoihin, vaan niillä on voitu korvata monia muita laitteita ja palveluita, kuten pelit, kartat, sosiaalinen media, ja monet Internetin kautta saavutettavat palvelut. Koska laitteita on saatavilla monissa eri hintaluokissa, ne ovat pääsääntöisesti lähes kaikkien saatavilla, myös maailmanlaajuisesti. Aina mukana kannettavan älypuhelimen käyttö tuottaa runsaasti henkilökohtaista tietoa, mikä tarjoaa mahdollisuuden analysoida käyttäjien päivittäistä elämää. Henkilökohtaisia suosituksia hyödyntäen käyttäjille voidaan tarjota tietoa, joka auttaa parantamaan käyttäjäkokemusta ja laajentamaan älylaitteen käyttömahdollisuuksia. Joukkoistava havainnointi tarkoittaa tiedonkeräysmenetelmää, jossa useat erilliset laitteet osallistuvat automaattisesti suuremman datajoukon kartuttamiseen. Puhelinlaitteista tällaista kerättävää dataa ovat muun muassa tieto suorituksessa olevista ja asennetuista sovelluksista, erilaiset järjestelmäasetukset, kuten verkkoyhteystiedot ja näytön kirkkaus, sekä lukuisat muut järjestelmätason parametrit, kuten suorittimen ja muistin käyttö. Automaattista datan keräystä voidaan täydentää käyttäjille lähetettävillä kyselyillä. Älypuhelimista kerättävän datan analysoinnissa on monia vaiheita, jotka tekevät koko prosessista haasteellisen. Automaattisesti kerättyyn dataan päätyy helposti virheitä ja puutteita, joiden käsittely on hallittava. Datan määrä kasvaa helposti teratavuluokkaan, jolloin analysointiin tarvitaan suurten datajoukkojen käsittelyyn sopivia hajautettuja laskenta-alustoja ja algoritmeja. Hyödyllisten suositusten generoimiseksi puhelinlaitteisiin liittyvän analyysin halutaan usein olevan reaaliaikaista, mikä asettaa lisää haasteita analyysin suorituskyvylle. Tässä väitöskirjassa esitetään menetelmiä joukkoistetusti havainnoidun älypuhelindatan käsittelemiseksi tehokkaasti ja hyödyllistä informaatiota tuottaen. Väitöskirjan alussa kuvaillaan älypuhelindatan keräämistä prosessina, datan esikäsittelyä ja siistimistä hyödylliseen ja käsiteltävään muotoon. Väitöskirja esittää, että puhelinlaitteen tila tulisi ottaa huomioon kokonaisuutena, jossa useat eri tekijät, kuten samanaikaisesti suoritettavat sovellukset ja toisiinsa liittyvät järjestelmäasetukset vaikuttavat toisiinsa. Tämän jälkeen väitöskirjassa esitetään joitakin sopivia tilastollisen analyysin ja koneoppimisen menetelmiä, joita väitöskirjan tutkimuksessa on käytetty älypuhelindatan analysointiin. Kaikki näistä menetelmistä ovat suoritettavissa hajautetussa laskentaympäristössä ja toteutettu Apache Spark -järjestelmää käyttäen. Lopuksi väitöskirja näyttää, kuinka analyysiä sovelletaan käytännössä käyttäjille suunnatun palautteen ja suositusten generointiin. Päähuomion saavat puhelinlaitteiden energiankulutuksen analysointi, puhelinsovellusten trendien havainnointi, ja erilaisten kulttuuristen ja sosioekonomisten taustatekijöiden huomiointi mobiilikäyttöä tutkittaessa.
URI: URN:ISBN:978-951-51-4052-4
http://hdl.handle.net/10138/231682
Date: 2018-02-26
Subject:
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
Crowdsen.pdf 2.739Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record