Modeling Cross-Border Mobility Using Geotagged Twitter in the Greater Region of Luxembourg

Show full item record



Permalink

http://urn.fi/URN:NBN:fi:hulib-201910293781
Title: Modeling Cross-Border Mobility Using Geotagged Twitter in the Greater Region of Luxembourg
Author: Massinen, Samuli
Contributor: University of Helsinki, Faculty of Science
Publisher: Helsingin yliopisto
Date: 2019
URI: http://urn.fi/URN:NBN:fi:hulib-201910293781
http://hdl.handle.net/10138/306530
Thesis level: master's thesis
Abstract: Luxemburgin suuralue on Euroopan Unionin suurin, valtioiden rajat ylittävä markkina-alue. Euroopan integraatio, Schengen-alue sekä valtioiden sosio-ekonomiset eroavuudet ovat merkittävimpiä tekijöitä, jotka ovat vaikuttaneet valtioiden rajat ylittävän liikkuvuuden kasvuun sekä rajamaayhteisöjen syntyyn ja laajenemiseen. Vapaasta liikkuvuudesta huolimatta valtioiden rajat eivät ole kokonaan hämärtyneet eivätkä sosio-ekonomiset erot valtioiden välillä ole tasoittuneet. Lisäksi päivittäisten liikkeiden spatiaalinen ulottuvuus ei ole tarkalleen tiedossa. On täten tärkeää tutkia valtioiden rajat ylittävää liikkuvuutta sekä dynamiikkaa ja yrittää erottaa toistuvat liikkuvuusmallit epäsäännöllisistä liikkeistä. Tähän asti valtioiden rajat ylittävän liikkuvuuden tutkimus on nojannut pitkälti kansallisiin rekistereihin sekä väestölaskenta-aineistoihin. Nämä aineistot ovat olleet pääasiassa liian niukkoja, jotta valtioiden rajat ylittävän liikkuvuuden kompleksisuutta voitaisiin kunnolla ymmärtää. Useat aiemmat tutkimukset ovat keskittyneet ainoastaan ylätason liikkuvuusmallien tarkasteluun, ja yksilönäkökulma on jäänyt puuttumaan. Näistä syistä yksilötason aineistoille on ollut kasvavaa tarvetta valtioiden rajat ylittävän tutkimuksen kontekstissa. Tässä tutkimuksessa tutkitaan valtioiden rajat ylittävän liikkuvuuden spatio-temporaalisia malleja Luxemburgin suuralueella sosiaalisen median Twitter-aineistoa hyödyntäen. Tutkimuksen tarkoituksena on selvittää, kuinka sosiaalisen median aineistoja voidaan jalkauttaa osaksi valtioiden rajat ylittävää liikkuvuustutkimusta. Tavoitteena on erottaa päivittäiset rajanyliliikkujat epäsäännöllisistä matkoista ja täten löytää uutta tietoa, jota kumpuaa ylätasoa syvemmältä. Tutkimus on yksi ensimmäisistä luonteeltaan, minkä johdosta käytetty metodologia on heuristinen. Kirjoittajan tietämyksen mukaan sosiaalisen median tietolähteitä ei olla aiemmin hyödynnetty erilaisten rajat ylittävien liikkuvuusmallien erottamisessa. Kaikki tässä tutkimuksessa kehitetyt ohjelmakoodit ovat avoimesti saatavilla Digital Geography Lab:in GitHub-sivuilta osoitteesta https://github.com/DigitalGeographyLab/cross-border-mobility-twitter. Tulokset osoittavat, että sosiaalinen media voidaan jalkauttaa osaksi valtioiden rajat ylittävää liikkuvuustutkimusta: regionaalisella tasolla sosiaalisen median aineistoista voidaan louhia päivittäisen liikkuvuuden toteumaa vastaavia malleja. Tässä tutkimuksessa havaitut ylätason liikkuvuusmallit vastaavat aiempien tutkimusten tuloksia, ja tulokset temporaalisesta vaihtelusta indikoivat liikkujamallien luokittelun olevan validi. Päivittäisiksi rajanyliliikkujiksi luokitellut Twitter-käyttäjät vaikuttivat liikkuvan kaikista eniten arkipäivinä, kun taas harvaltaan valtioiden rajat ylittävät yksilöt viikonloppuisin. Päivittäiset rajanyliliikkumiset tarjosivat myös uutta tietoa liikkeiden spatiaalisesta laajuudesta. Lisäksi heuristinen lähestyminen saavutti korkean tarkkuustason käyttäjien kotimaan tunnistuksessa: tässä tutkimuksessa kehitetty ”uniikit viikot” -algoritmi tunnisti käyttäjien kotimaan 88,6 % tarkkuudella. Vaikka tulokset ovatkin lupaavia regionaalisella tasolla, tulee niitä tarkastella kriittisesti väestötiheyden sekä Twitterkäyttöaktiivisuuden suhteen, jotka kummatkin vaihtelevat spatio-temporaalisesti ja voivat tuottaa vinoumaa. Jatkotutkimuksia sekä metodien kehitystä tarvitaan, jotta johtopäätöksiä voidaan tehdä globaalilla tasolla: muut maantieteelliset alueet ja tutkimusasetelmat voivat tuottaa eriäviä tuloksia. Lisäksi joihinkin tässä tutkimuksessa tehtyihin ratkaisuihin datan ja metodien osalta on syytä suhtautua kriittisesti kunnollisen vertailupohjan puuttumisen vuoksi. Tästä huolimatta tämä tutkimus on onnistunut tunnistamaan, että Twitter-aineiston kattavuus on riippuvaista tiedonhankintaprosessien monikerroksisuudesta, ja että yleisesti Twitter voi tarjota arvokasta tietoa liikkuvuustutkimukseen. Jatkotutkimuksia on suositeltavaa lähestyä yksilöiden näkökulmasta spatio-temporaalisesti täydentäen kokonaisuutta sisältöanalyysi-metodeilla.The Greater Region of Luxembourg is the largest cross-border labor market in the European Union with the greatest number of cross-border workers in the area. European integration, the Schengen Area, and socio-economical divergences have been the main factors facilitating human cross-border movements in the area and thus the birth and expansion of the borderland community. Despite the freedom of movement, country borders have not been erased and socio-economic divergences have not been levelled. In addition, the spatial extent of the daily movements is not well known. Thus, it is important to study cross-border dynamics and try to separate daily movements from infrequent mobility patterns. Thus far, cross-border mobility studies have mainly leaned on national registers and census data. These datasets have mostly been too scarce in trying to understand the complexities of cross-border mobility. Many studies have only focused on aggregate-level movement patterns, and the viewpoint of individuals has been missing. Hence, there has been a growing need for individual-level data to be applied in cross-border mobility research. In this study, a person-based approach is employed using geotagged Twitter Big Data to study spatio-temporal cross-border mobility patterns in the Greater Region of Luxembourg. The aim is to examine how to implement social media in cross-border research as well as how to separate daily cross-border movers from infrequent border crossers and consequently move beyond aggregate-level inspections. Being one of the first studies of its kind, a heuristic programmatic approach is utilized. To the writer’s knowledge, social media data sources have not been applied previously to distinguish different cross-border mobility types. All developed scripts in this study are openly available on Digital Geography Lab’s GitHub -pages (https://github.com/DigitalGeographyLab/cross-border-mobilitytwitter) to promote open science and to introduce new quantitative method tools for cross-border mobility research. The results show that social media can be implemented in cross-border mobility research, and social media Big Data can provide a relatively good proxy for daily cross-border mobility of people on a regional level. Aggregate-level cross-border mobility patterns and activity location densities correspond closely with previous studies, and outcomes from temporal variation inspections indicate a valid cross-border mover type identification; Twitter users classified as daily cross-border movers seem to be more mobile on weekdays whereas infrequent border crossers on weekends. Daily cross-border mobility patterns also provided new information about the spatial extent of the movements. In addition, heuristic approach resulted in high accuracy in home detection; the “unique weeks” algorithm introduced in this study produced an accuracy of 88.6 % with respect to the ground truth. Although the results are promising on a regional level, they should be considered in relation to population densities and Twitter use activity; attributes that both vary spatio-temporally and thus can cause bias. Further studies and method development are also needed to draw global conclusions about cross-border mobility; other geographical areas and study settings could result in varied outcomes. In addition, some solutions with data and methods should be considered with a critical stance due to scarcity of valid references. Yet, this study has identified that the coverage of geotagged Twitter data is dependent on data acquisition processes and that Twitter can provide valuable information for cross-border mobility research. In future studies, multi-level data acquisition processes are recommended jointly with person-based approach combining spatio-temporal and content analysis methodologies.
Subject: human mobility
cross-border mobility
social media
big data
the Greater Region of Luxembourg
GIS
ihmisten liikkuminen
valtioiden rajat ylittävä liikkuminen
sosiaalinen media
big data
Luxemburgin suuralue
GIS
Discipline: Maantiede


Files in this item

Total number of downloads: Loading...

Files Size Format View
Massinen_Samuli_Pro_gradu_2019.pdf 2.736Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record