Browsing by Subject "Big data"

Sort by: Order: Results:

Now showing items 1-12 of 12
  • Andrienko, Gennady; Andrienko, Natalia; Boldrini, Chiara; Caldarelli, Guido; Cintia, Paolo; Cresci, Stefano; Facchini, Angelo; Giannotti, Fosca; Gionis, Aristides; Guidotti, Riccardo; Mathioudakis, Michael; Muntean, Cristina Ioana; Pappalardo, Luca; Pedreschi, Dino; Pournaras, Evangelos; Pratesi, Francesca; Tesconi, Maurizio; Trasarti, Roberto (2021)
    The exponential increase in the availability of large-scale mobility data has fueled the vision of smart cities that will transform our lives. The truth is that we have just scratched the surface of the research challenges that should be tackled in order to make this vision a reality. Consequently, there is an increasing interest among different research communities (ranging from civil engineering to computer science) and industrial stakeholders in building knowledge discovery pipelines over such data sources. At the same time, this widespread data availability also raises privacy issues that must be considered by both industrial and academic stakeholders. In this paper, we provide a wide perspective on the role that big data have in reshaping cities. The paper covers the main aspects of urban data analytics, focusing on privacy issues, algorithms, applications and services, and geo-referenced data from social media. In discussing these aspects, we leverage, as concrete examples and case studies of urban data science tools, the results obtained in the "City of Citizens" thematic area of the Horizon 2020 SoBigData initiative, which includes a virtual research environment with mobility datasets and urban analytics methods developed by several institutions around Europe. We conclude the paper outlining the main research challenges that urban data science has yet to address in order to help make the smart city vision a reality.
  • Hausmann, Anna; Toivonen, Tuuli; Fink, Christoph; Heikinheimo, Vuokko Vilhelmiina; Tenkanen, Henrikki; Butchart, Stuart; Brooks, Thomas; Di Minin, Enrico (2019)
    Understanding worldwide patterns of human use of sites of international significance for biodiversity conservation is crucial for meeting global conservation targets. However, robust global datasets are scarce. In this study, we used social media data, mined from Flickr and Twitter, geolocated in Important Bird and Biodiversity Areas (IBAs) to assess i) patterns of popularity; ii) relationships of this popularitywith geographical and biological variables; and iii) identify sites under high pressure fromvisitors. IBAs located in Europe and Asia, and in temperate biomes, had the highest density of users. Sites of importance for congregatory species, which were also more accessible, more densely populated and provided more tourism facilities, received higher visitation than did sites richer in bird species. Wefound 17% of all IBAs assessed to be under very high threat also received high visitation. Our results showinwhich IBAs enhancedmonitoring should be implemented to reduce potential visitation risks to sites of conservation concern for birds, and to harness the potential benefits of tourism for conservation. (C) 2019 The Authors. Published by Elsevier B.V.
  • Järv, Olle; Tenkanen, Henrikki Toivo Olavi; Salonen, Maria Pauliina; Ahas, Rein; Toivonen, Tuuli Kaarina (2018)
    The concept of accessibility – the potential of opportunities for interaction – binds together the key physical components of urban structure: people, transport and social activity locations. Most often these components are dynamic in nature and hence the accessibility landscape changes in space and time based on people's mobilities and the temporality of the transport network and activity locations (e.g. services). Person-based accessibility approaches have been successful in incorporating time and space in the analyses and models. Still, the more broadly applied location-based accessibility modelling approaches have, on the other hand, often been static/atemporal in their nature. Here, we present a conceptual framework of dynamic location-based accessibility modelling that captures the dynamic temporality of all three accessibility components. Furthermore, we empirically test the proposed framework using novel data sources and tools. We demonstrate the impact of temporal aspects in accessibility modelling with two examples: by investigating food accessibility and its spatial equity. Our case study demonstrates how the conventional static location-based accessibility models tend to overestimate the access of people to potential opportunities. The proposed framework is universally applicable beyond the urban context, from local to global scale and on different temporal scales and multimodal transport systems. It also bridges the gap between location-based accessibility and person-based accessibility research.
  • Tyhtilä, Taavi (Helsingin yliopisto, 2020)
    Teknologinen murros on mahdollistanut teollisuusyhteiskuntien siirtymän kohti uudentyyppisiä datayhteiskuntia. Muutoksessa on kyse monitasoisesta ja dynaamisesta sosiaalisesta ilmiöstä, joka järjestää uudelleen yhteiskuntien rakenteita, toimintaperiaatteita ja sosiaalisia suhteita. Tutkielma tarkastelee kriittisesti Euroopan komission vuosien 2010-2020 välillä kommunikoimaa visiota eurooppalaisen datayhteiskunnan tulevaisuudesta ja tavoitteista. Komission mukaan uuden teknologiaekosysteemin ja digitaalisen poliittisen talouden muodostamalla digitaalisella toimintaympäristöllä sekä sen tuottamalla datalla on strateginen merkitys Euroopan tulevaisuudelle. Tutkielma selvittää 1) millaista visiota komissio kommunikoi eurooppalaisen datayhteiskunnan tulevaisuudesta ja miten digitaalisen toimintaympäristö, sen eri osatekijät ja toimijat merkityksellistetään tavoitteiden määrittelyn yhteydessä, sekä 2) millaisille ideoille komission visio perustuu ja millaisia ideationaalisia elementtejä hyödynnetään sen kerronnallistamisen yhteydessä. Tutkielmassa omaksutaan ideationaalisesti suuntautunut kriittisen poliittisen talouden ja teknologian tutkimuksen holistinen lähestymistapa, jonka apuna analyysin yhteydessä hyödynnetään narratiivista politiikkakehystä (NPK). Teoreettiset lähtökohdat kyseenalaistavat datayhteiskuntien kehitysprosessien luonnollisuuden ja deterministisyyden, osoittamalla niiden olevan valintojen seurausta, joiden taustalla vaikuttavat ideoiden tuottamat oletukset ja kuvitelmat kehityksen seurauksista ja haluttavuudesta. Tämä mahdollistaa datapolitiikkaa ohjaavan vision haastamisen sekä sen etujen ja mahdollisuuksien, haittojen ja kustannusten kriittisen arvioinnin. Primääriaineiston muodostavien komission politiikkadokumenttien (33kpl) ja ehdotusten pohjalta annetun lainsäädännön (3kpl) yhteydessä tunnistettujen politiikkanarratiivien laadullinen analyysi ja kriittinen arviointi auttaa tarkastelemaan, miten komissio kerronnallistaa datayhteiskuntien muutoksen osatekijöiden ja toimijoiden merkitystä sekä näiden välisiä suhteita. Kerronnallistamisen kautta selviää, miten komissio luo talouteen, teknologiaan ja edistykseen yhdistyvien kuvitelmien välityksellä käsitystä yhteiskunnalliseen muutoksen liittyvistä jaetuista tavoitteista ja yhteisestä hyvästä. Analyysin keskiössä ovat tavat, joilla komissio rajaa ja merkityksellistää datafikaatioon liittyvän poliittisen projektin yhteydessä digitaalisen toimintaympäristön historialliset kehitysprosessit, objektit ja subjektit politiikan, hallinnan ja julkisen keskustelun kohteeksi. Analyysin perusteella komissio on omaksunut positivistiselle epistemologialle, talousliberaalille uskomusjärjestelmälle ja dataimperatiiville perustuvan teknoutopistisen kuvitelman moderniudesta, joka rajaa datapolitikan tavoitteet teknologisen determinismin, Big data -paradigman ja valvontakapitalismin talouslogiikan saneleman instrumentaalisen rationaliteetin edellyttämän digitaalisen hallinnan toiminnoiksi. Datapolitiikan tarkoitus ei ole muuttaa vallitsevan järjestelmän logiikkaa tai sen kehityssuuntaa vaan 1) mahdollistaa oikeanlainen toiminta ja 2) rajoittaa haittavaikutuksia. Taustalla on uskomus Big Datan, markkinoiden ja digitaalisen hallinnan muodostaman kolminaisuuden ongelmanratkaisukyvystä, joka takaa datayhteiskuntien tehokkuuden, talouskasvun ja sosiaalisen edistyksen. Kehityssuunta ei ole ongelmaton, ja on johtamassa valvontayhteiskuntien syntymiseen. Yhteistuotannolliset palautesilmukat legitimoivat datafikaation kiihdyttämistä ja luonnollistavat valvontakehitystä, normalisoimalla prosessit osaksi modernien datayhteiskuntien elämää. Datan sekä sitä tuottavien subjektien ja objektien arvouttamisprosessit noudattavat vallitsevan talousjärjestelmän imperatiiveja, jotka ovat usein ristiriidassa demokraattisten arvojen kanssa. Hallitsevan vision rajattu ja itseään vahvistava episteeminen positio hankaloittaa vaihtoehtoisten kuvitelmien esittämistä ja uusien ideoiden syntymistä, mikä lisää kehityksen determinististä luonnetta ja tulkintaa sen väistämättömyydestä. Vaihtoehtoja on olemassa, mutta niiden tekeminen kilpailukykyiseksi edellyttää yhteiskunnallista painetta ja poliittista halua muuttaa nykyistä järjestystä.
  • Smith, Stephen M.; Hyvärinen, Aapo; Varoquaux, Gael; Miller, Karla L.; Beckmann, Christian F. (2014)
    Increasingly-large datasets (for example, the resting-state fMRI data from the Human Connectome Project) are demanding analyses that are problematic because of the sheer scale of the aggregate data. We present two approaches for applying group-level PCA; both give a close approximation to the output of PCA applied to full concatenation of all individual datasets, while having very low memory requirements regardless of the number of datasets being combined. Across a range of realistic simulations, we find that in most situations, both methods are more accurate than current popular approaches for analysis of multi-subject resting-state fMRI studies. The group-PCA output can be used to feed into a range of further analyses that are then rendered practical, such as the estimation of group-averaged voxelwise connectivity, group-level parcellation, and group-ICA. (C) 2014 Elsevier Inc. All rights reserved.
  • Kauppi, Konsta (Helsingin yliopisto, 2020)
    Tässä tutkielmassa tarkastellaan kameravalvontaa osana yhteiskuntaa ja osana rikosoikeusjärjestelmää. Ihmisistä kerätään nykyään runsaasti tietoja, ja ihmiset myös luovuttavat itsestään tietoja muiden käyttöön tietoisesti tai tiedostamatta. Massavalvonta ja big data ovat käsitteitä, jotka kuvastavat nykyajan informaatioyhteiskuntia ja datataloutta, jossa tiedolla on aiempaa suurempi merkitys. Tietoa voidaan kerätä monin eri tavoin; yksi keino on kameravalvonta. Osa valvontakameroiden keräämistä tiedoista ovat hyvinkin henkilökohtaisia, kun taas joitakin tietoja annamme ihan mielellämme itsestämme, jos koemme saavamme vastineeksi jotakin. Joskus puolestaan emme välttämättä haluaisi altistaa itseämme tietojen keruulle ja valvonnalle. Tähän kuitenkin saatetaan päätyä, jos jonkin hyväksyttävän tavoitteen nimissä pystytään saavuttamaan jotakin arvokasta, joka palvelee yksilöä tai laajemmin koko yhteiskuntaa. On myös mahdollista, että emme edes tiedä, missä ja milloin meistä on kameravalvonnan keinoin hankittu tietoja tai mihin näitä tietoja on hyödynnetty. Valvontakameroita käyteään erityisesti rikosten ehkäisyssä ja selvittämisessä. Kameroita käytetään nykyään myös moniin muihin tarkoituksiin, kuten työpaikan tuotantoprosessien varmistamiseen, yleisen järjestyksen ja turvallisuuden varmistamiseen, turvallisuuden tunteen lisäämiseen, tehokkaampien valvontakäytäntöjen toteuttamiseen, jälkikäteiseen faktantarkistukseen ja puhtaasti viihteellisiin tarkoituksiin sekä moniin muihin. Kameravalvonta on siten hyvin moninainen ilmiö, joka on yleisesti koettu yhteiskunnissa kuitenkin hyväksyttäväksi. Kameravalvonta liittyy vahvasti niin yksityisyyden ja yksityiselämän suojaan kuin henkilötietojen suojaankin. Suomessa ei ole kuitenkaan nimenomaisesti kameravalvontaa koskevaa yleislakia, jollainen esimerkiksi Ruotsin lainsäädännössä on (kamerabevakningslag 2018:1200). Kameravalvonta ei kuitenkaan ole jäänyt Suomessa täysin sääntelemättä, sillä lainsäädännöstämme on johdettavissa kameravalvonnan käytölle pelisääntöjä ja reunaehtoja useasta eri suunnasta. Myös EU:n tietosuojalainsäädäntö asettaa kameravalvonnalle rajoja. Voidaan puhua yhtäältä laillisesta kameravalvonnasta ja toisaalta laittomasta kameravalvonnasta. Viime kädessä rikoslaki asettaa rajat rikosoikeudellisesti moitittavalle menettelylle kameravalvonnassa. Rikosoikeudellinen laillisuusperiaatteen mukaisesti ketään ei saa tuomita sellaisesta teosta, joka ei ole tekohetkellä laissa nimenomaisesti säädetty rangaistavaksi. Rikosoikeudellisen säännön tulee olla selkeä ja täsmällinen. Yksilöllä tulee olla kyky tietää, mikä on rikosoikeudellisesti moitittavaa ja paheksuttavaa kameravalvontaa, jotta yksilö pystyy mitoittamaan oman toimintansa oikein. Laillisuusperiaate asettaa vaateita myös lainsäätäjälle, sillä rikosoikeudelliset säännöt on kyettävä muotoilemaan sanamuodoltaan niin, että rangaistavan käyttäytymisen ala on mahdollisimman hyvin ennakoitavissa. Ideaalitilanteessa tunnusmerkistöstä käy selvästi ilmi, mitä tarkoitusta varten tietty käyttäytymismalli on kriminalisoitu. Rikosoikeudellisesti moitittavaa kameravalvontaa voi lähestyä esimerkiski itse kuvaamisteon tai kuvadatan levittämisen kautta. Laittomalle kameravalvonnalle rangaistavuuden rajat asettavat tällöin ennen muuta rikoslain (39/1889) salakatselua ja salakuuntelua koskevat tunnusmerkistöt sekä yksityisyyden suojasta työelämässä annetun lain (759/2004) kriminalisointi. EU:n tietosuoja-asetuksen vastaisesta menettelystä voi vain rajoitetusti seurata rikosoikeudellinen seuraamus. Tunnusmerkistöjä ja oikeuskäytäntöä tarkastelemalla ilmenee, että kriminalisoitu kameravalvonta on sidottu muiden tunnusmerkistötekijöiden ohella pitkälti alueellisiin edellytyksiin, joiden perusteella teon moitittavuutta arvotetaan. Tällöin suojeluintressin toteuttaminen – yksityisyyden suoja – on sidottu katseltavan tai tarkkailtavan henkilön fyysiseen sijaintiin. Sääntelyn hyväksyttävyyttä voi tällöin perustellusti tarkastella kriittisesti huomioiden esimerkiksi Euroopan unionin tuomioistuimen ja Euroopan ihmisoikeustuomioistuimen ratkaisukäytäntö itsemääräämisoikeuteen ja henkilötietojen suojaan liittyen. Rikosoikeudelliset tulkintaopit rajoittavat kuitenkin sitä, missä määrin pelkkä suojelutavoite määrittää rangaistavuuden alaa. Jos monitulkintainen yksityisyyden suoja sidotaan kriminalisoinneissa alueellisiin edellytyksiin, kriminalisointien hyväksyttävyyden arvioimisen mittapuuna oikeushyvien suojelun periaate on merkittävässä roolissa. Nykyistä kameravalvontasääntelyä ei voida pitää rikosoikeudellisesti täysin ongelmattomana eikä selkeänä.
  • López, Asier; Ratni, A.; Trong, T.N.; Olaso, J.M.; Montenegro, S.; Lee, M.; Haider, F.; Schlögl, S.; Chollet, G.; Jokinen, K.; Petrovska-Delacrétaz, D.; Sansen, H.; Torres, M.I. (Springer, 2017)
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
    This paper describes work on dialogue data collection and dialogue system design for personal assistant humanoid robots undertaken at eNTERFACE 2016. The emphasis has been on the system’s speech capabilities and dialogue modeling of what we call LifeLine Dialogues, i.e. dialogues that help people tell stories about their lives. The main goal behind this type of application is to help elderly people exercise their speech and memory capabilities. The system further aims at acquiring a good level of knowledge about the person’s interests and thus is expected to feature open-domain conversations, presenting useful and interesting information to the user. The novel contributions of this work are: (1) a flexible spoken dialogue system that extends the Ravenclaw-type agent-based dialogue management model with topic management and multi-modal capabilities, especially with face recognition technologies, (2) a collection of WOZ-data related to initial encounters and presentation of information to the user, and (3) the establishment of a closer conversational relationship with the user by utilizing additional data (e.g. context, dialogue history, emotions, user goals, etc.). © 2017, Springer International Publishing AG.
  • Palander-Collin, Minna; Nevala, Minna (2020)
    This article explores the interrelatedness of societal changes and changes in language practices. By using a combination of corpus linguistic and socio-pragmatic methods, we track diachronic changes in word patterns and interpret findings in the framework of democratization. The data comes from a small and representative corpus of British English (ARCHER-3.1) and from three "big data" sets (Google Books, British Library Newspapers and The Economist). We suggest that data triangulation, including sociohistorical contextualization, allows us to conclude that especially from the mid-nineteenth century onwards words signaling social status and referring to individuals have decreased and from the first decades of the twentieth century onwards words referring to collectivities of people have increased.
  • Jia, Peng; Yu, Chao; Remais, Justin; Stein, Alfred; Liu, Yu; Brownson, Ross C.; Lakerveld, Jeroen; Wu, Tong; Yang, Lijian; Smith, Melody; Amer, Sherif; Pearce, Jamie; Kestens, Yan; Kwan, Mei-Po; Lai, Shengjie; Xu, Fei; Chen, Xi; Rundle, Andrew; Xiao, Qian; Xue, Hong; Luo, Miyang; Zhao, Li; Cheng, Guo; Yang, Shujuan; Zhou, Xiaolu; Li, Yan; Panter, Jenna; Kingham, Simon; Jones, Andy; Johnson, Blair T.; Shi, Xun; Zhang, Lin; Wang, Limin; Wu, Jianguo; Mavoa, Suzanne; Toivonen, Tuuli; Mwenda, Kevin M.; Wang, Youfa; Verschuren, W. M. Monique; Vermeulen, Roel; James, Peter (2020)
    Spatial lifecourse epidemiology is an interdisciplinary field that utilizes advanced spatial, location-based, and artificial intelligence technologies to investigate the long-term effects of environmental, behavioural, psycho-social, and biological factors on health-related states and events and the underlying mechanisms. With the growing number of studies reporting findings from this field and the critical need for public health and policy decisions to be based on the strongest science possible, transparency and clarity in reporting in spatial lifecourse epidemiologic studies is essential. A task force supported by the International Initiative on Spatial Lifecourse Epidemiology (ISLE) identified a need for guidance in this area and developed a Spatial Lifecourse Epidemiology Reporting Standards (ISLE-ReSt) Statement. The aim is to provide a checklist of recommendations to improve and make more consistent reporting of spatial lifecourse epidemiologic studies. The STrengthening the Reporting of Observational Studies in Epidemiology (STROBE) Statement for cohort studies was identified as an appro-priate starting point to provide initial items to consider for inclusion. Reporting standards for spatial data and methods were then integrated to form a single comprehensive checklist of reporting recommendations. The strength of our approach has been our international and multidisciplinary team of content experts and con-tributors who represent a wide range of relevant scientific conventions, and our adherence to international norms for the development of reporting guidelines. As spatial, location-based, and artificial intelligence technologies used in spatial lifecourse epidemiology continue to evolve at a rapid pace, it will be necessary to revisit and adapt the ISLE-ReSt at least every 2-3 years from its release.
  • Wasastjerna, M.C. (2019)
    The article examines the implications of big data for competition law, with a focus on personal data and the privacy concerns that such data may give rise to, especially in the area of merger control. Today, one of the biggest challenges for competition authorities in data-driven markets is how to deal with issues related to personal data and the protection of privacy in their analysis. A key question is the role of competition law in protecting consumers from potential data privacy risks arising in the context of mergers in digital markets. The article also engages with one of the currently most debated topics in the competition community, namely the competition-privacy interface, and considers how personal data in the digital economy is considered a currency in exchange for online offerings, and how a loss of privacy can be factored into quality competition. The article addresses some of the challenges with incorporating privacy as a non-price parameter into competition analysis and offers food for thought by discussing relevant methodologies to assign monetary values to personal data. © 2019 Kluwer Law International BV, The Netherlands.
  • Tupasela, Aaro; Snell, Karoliina; Tarkkala, Heta (2020)
    The Nordic countries aim to have a unique place within the European and global health data economy. They have extensive nationally maintained and centralized health data records, as well as numerous biobanks where data from individuals can be connected based on personal identification numbers. Much of this phenomenon can be attributed to the emergence and development of the Nordic welfare state, where Nordic countries sought to systematically collect large amounts of population data to guide decision making and improve the health and living conditions of the population. Recently, however, the so-called Nordic gold mine of data is being re-imagined in a wholly other context, where data and its ever-increasing logic of accumulation is seen as a driver for economic growth and private business development. This article explores the development of policies and strategies for health data economy in Denmark and Finland. We ask how nation states try to adjust and benefit from new pressures and opportunities to utilize their data resources in data markets. This raises questions of social sustainability in terms of states being producers, providers, and consumers of data. The data imaginaries related to emerging health data markets also provide insight into how a broad range of different data sources, ranging from hospital records and pharmacy prescriptions to biobank sample data, are brought together to enable "full-scale utilization" of health and welfare data.
  • Ruckenstein, Minna (2019)
    This article is inspired by the social life of methods approach, joining a movement among social scientists engaging with ‘big data’ to contribute to methodological innovation and conceptual development in research and knowledge translation. It explores human-drug associations using a computational tool, Medicine Radar, meanwhile raising questions about the ways a digital device pushes us to rethink how drugs are known in the everyday. Medicine Radar is an apparatus for exploring human-drug associations by means of Suomi24 (Finland24) data, containing 19 million health-related online posts spanning a period of 16 years. Using defined markers, Medicine Radar sorts the medicine talk in health-related discussions, thereby assisting us to ‘see’ the actions of the drug and human responses to them. This kind of approach distances the drug from the illness experience, drawing attention to the private details of the human-drug relationship. The empirical analysis separates three areas of antidepressant use: articulations of reactions, stabilizing the life effects of drugs and coming to terms with antidepressants. Together, the online posts urge us to think of everyday experience where the effects of drugs – intended or unintended – are always lived. The side effects of antidepressants, including drowsiness, ravenous hunger, loss of sexual desire and emotional numbness, become life effects. As will be demonstrated, the move from conceptualizing such fallout as side effects to understanding them as life effects has political ramifications. The computation tool adds collective weight to antidepressant experiences and calls for politicizing their effects on life.