Information Retrieval with Finnish Case Law Embeddings

Näytä kaikki kuvailutiedot



Pysyväisosoite

http://urn.fi/URN:NBN:fi:hulib-202001211119
Julkaisun nimi: Information Retrieval with Finnish Case Law Embeddings
Tekijä: Sarsa, Sami
Muu tekijä: Helsingin yliopisto, Matemaattis-luonnontieteellinen tiedekunta
University of Helsinki, Faculty of Science
Helsingfors universitet, Matematisk-naturvetenskapliga fakulteten
Julkaisija: Helsingin yliopisto
Päiväys: 2019
Kieli: eng
URI: http://urn.fi/URN:NBN:fi:hulib-202001211119
http://hdl.handle.net/10138/310006
Opinnäytteen taso: pro gradu -tutkielmat
Oppiaine: Tietojenkäsittelytiede
Tiivistelmä: In this work, five text vectorisation models' capability in embedding Finnish case law texts to vector space for inter-textual similarity computation is studied. The embeddings and their computed similarities are used to create a Finnish case law retrieval system that allows effective querying with full documents. A working web application is presented as a part of the work. The case law data for the work is provided by the Finnish Ministry of Justice, and the studied models are: TF-IDF, LDA, Word2Vec, Doc2Vec and Doc2vecC.


Tiedostot

Latausmäärä yhteensä: Ladataan...

Tiedosto(t) Koko Formaatti Näytä
grappa-gradu.pdf 1.863MB PDF Avaa tiedosto

Viite kuuluu kokoelmiin:

Näytä kaikki kuvailutiedot