Building a Finnish SOM-based ontology concept tagger and harvester

Show full item record



Permalink

http://hdl.handle.net/10138/234570

Citation

Nyrkkö , A S A 2018 , Building a Finnish SOM-based ontology concept tagger and harvester . in T Pirinen (ed.) , The 4th International Workshop on Computational Linguistics for Uralic Languages by ACL SIG for Uralic Languages : Proceedings of the Workshop . The Association for Computational Linguistics , Stroudsburg , pp. 18-25 , International Workshop on Computational Linguistics for Uralic Languages , Helsinki , Finland , 08/01/2018 .

Title: Building a Finnish SOM-based ontology concept tagger and harvester
Author: Nyrkkö, Alpo Seppo Antero
Editor: Pirinen, Tommi
Contributor: University of Helsinki, Language Technology
Publisher: The Association for Computational Linguistics
Date: 2018-01
Language: eng
Number of pages: 8
Belongs to series: The 4th International Workshop on Computational Linguistics for Uralic Languages by ACL SIG for Uralic Languages Proceedings of the Workshop
URI: http://hdl.handle.net/10138/234570
Abstract: Kehitän luonnollisessa kielessä ilmenevien sanojen merkitysten eroteluun sopivaa automaatista koneoppivaa työkalua. Laskennallinen malli perustuu itseoppivaan kartaan (SOM, Self-Organizing Map) ja annetuun suomenkieliseen semantisen webin ontologiaan. Malli oppii tunnistamaan käsiteiden ilmenemistä mallitekstistä, johon on annotoitu (tagatu) malliksi aiemmin laaditun ongologian käsiteitä. Koe liityy aiemmin englanninkielisten käsiteiden taggaamiseen liityvään OntoR-koejärjestelyyn joka tutki tekstisyöteessä ilmenevien termien liitämistä SOM-kartan soluihin malliksi annetun annotoidun tekstiesimerkin avulla. Tällainen malli oppii annetun käsitemallin huomatavan niukalla esimerkkiaineistolla ja sopii käytökohteisiin joissa ei ole tarjolla riitävän suurta datamäärää syvän oppimisen neuroverkkomallin opetamiseksi. Suomenkielisen kokeen morfologisen analyysin pohjalla on OMORFI- ja HFST-työkalut. Koneoppimisen toteutava SOM-karta lasketaan SOM-PAK-ohjelmistopaketin avulla. Kehitetyä laskennallista mallia käytetään käsiteiden tunnistamisen lisäksi myös uusien ontologiakäsiteiden ehdokkaiden löytämiseksi.
Subject: 6121 Languages
113 Computer and information sciences
Rights:


Files in this item

Total number of downloads: Loading...

Files Size Format View
nyrkko2018building_acl_iwclul2018.pdf 287.2Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record