Julkaisun nimi: | Information Retrieval with Finnish Case Law Embeddings |
Tekijä: | Sarsa, Sami |
Muu tekijä: |
Helsingin yliopisto, Matemaattis-luonnontieteellinen tiedekunta
University of Helsinki, Faculty of Science Helsingfors universitet, Matematisk-naturvetenskapliga fakulteten |
Julkaisija: | Helsingin yliopisto |
Päiväys: | 2019 |
Kieli: | eng |
URI: |
http://urn.fi/URN:NBN:fi:hulib-202001211119
http://hdl.handle.net/10138/310006 |
Opinnäytteen taso: | pro gradu -tutkielmat |
Oppiaine: | Tietojenkäsittelytiede |
Tiivistelmä: | In this work, five text vectorisation models' capability in embedding Finnish case law texts to vector space for inter-textual similarity computation is studied. The embeddings and their computed similarities are used to create a Finnish case law retrieval system that allows effective querying with full documents. A working web application is presented as a part of the work. The case law data for the work is provided by the Finnish Ministry of Justice, and the studied models are: TF-IDF, LDA, Word2Vec, Doc2Vec and Doc2vecC. |
Latausmäärä yhteensä: Ladataan...
Tiedosto(t) | Koko | Formaatti | Näytä |
---|---|---|---|
grappa-gradu.pdf | 1.863MB | Avaa tiedosto |