Compiling Simple Context Restrictions with Nondeterministic Automata

Show full item recordPermalink

http://hdl.handle.net/10138/29898

Citation

Yli-Jyrä , A M 2011 , Compiling Simple Context Restrictions with Nondeterministic Automata . in M Constant , A Maletti & A Savary (eds) , Proceedings of the 9th International Workshop on Finite State Methods and Natural Language Processing . The Association for Computational Linguistics , Stroudsburg, PA, USA , pp. 30-38 , International Workshop on Finite State Methods and Natural Language Processing , Blois , France , 12/07/2011 . < http://aclweb.org/anthology-new/W/W11/#4400 >

Title: Compiling Simple Context Restrictions with Nondeterministic Automata
Alternative title: Yksinkertaisten kontekstirajoitusten kääntäminen epädeterminististen automaattien avulla
Author: Yli-Jyrä, Anssi Mikael
Other contributor: Constant, Matthieu
Maletti, Andreas
Savary, Agata
Contributor organization: Department of Modern Languages 2010-2017
Anssi Mikael Yli-Jyrä / Principal Investigator
Krister Linden / Research Group
Publisher: The Association for Computational Linguistics
Date: 2011
Language: eng
Number of pages: 9
Belongs to series: Proceedings of the 9th International Workshop on Finite State Methods and Natural Language Processing
URI: http://hdl.handle.net/10138/29898
Abstract: Paperi kuvaa epäkonventionaalisen menetelmän (fonologisten ja morfo-syntaktisten) kontekstirajoitesääntöjen kääntämiseksi epädeterministisiksi automaateiksi äärellistilaisissa työkaluissa ja pintajäsennysjärjestelmissä. Metodi redusoi minkä tahansa kontekstirajoitteen yksinkertaiseksi rajoitteeksi, joka rajoittaa tyhjän merkkijonon esiintymisiä ja esittää oikean puolen kontekstit takaperindeterminististen tilojen avulla. Tapauksissa, joissa täysin deterministinen esitysmuoto olisi eksponentiaalisesti isompi, tällainen sisäänpäin deterministinen kontekstien esitysmuoto voi olla edullisempi kuin erilaiset De Morgan -lähestymistavat, joissa täysi determinisointi on välttämätöntä. Menetelmän yhteydessä jokainen hyväksytty merkkijono saa yksiselitteisen polun, joka on kontekstien tunnistaja-automaatissa olevan tikapuumaisen rakenteen projektio. Tämä projektio voidaan laskea (koko rajoitteelle) ajassa, joka on polynomisessa suhteessa kontekstitilojen määrään. Menetelmästä voi kuitenkin olla vaikea saada hyötyä, jos sitä käytetään äärellistilaisessa kirjastossa, joka pakottaa välitulokset kanonisiksi automaateiksi ja jonka leikkaus-operaatio edellyttää deterministisiä automaatteja operandeinaan.This paper describes a non-conventional method for compiling (phonological or morpho-syntactic) context restriction (CR) constraints into non-deterministic automata in finite-state tools and surface parsing systems. The method reduces any CR into a simple one that constraints the occurrences of the empty string and represents right contexts with co-determististic states. In cases where a fully deterministic representation would be exponentially larger, this kind of inward de- terminism in contexts can bring benefits over various De Morgan approaches where full determinization is necessary. In the method, an accepted word gets a unique path that is a projection of a ladder-shaped structure in the context recognizer. This projection is computed in time that is polynomial to the number of context states. However, it may be difficult to take advantage of the method in a finite-state library that coerces intermediate results into canonical automata and whose intersection operation assumes deterministic automata.
Subject: 111 Mathematics
logic
LOGIC
QUANTIFICATION
quantification
first-order logic
implication
rational series
logiikka
kvantifiointi
ensimmäisen kertaluokan logiikka
implikaatiot
rationaaliset potenssisarjat
logik
kvantifiering
första ordingens logik
implikation
rationell potensserier
113 Computer and information sciences
compliers
regular expressions
finite automata
finite-state transducers
string algorithms
regular languages
ohjelmointikielten kääntäjät
äärelliset automaatit
äärellistilaiset transduktorit
merkkijonoalgoritmit
säännölliset lausekkeet
säännölliset kielet
kompilatorer
reguljära uttryck
ändliga automater
finita-statliga transduktorer
strängalgoritmer
reguljära språk
6121 Languages
finite-state methods
finite automata
finite-state morphological analysis
constraints
two-level rules
two-level morphology
grammar formalisms
äärellistilaiset menetelmät
äärelliset automaatit
äärellistilainen morfologinen analyysi
rajoitteet
rajoitesäännöt
constraint grammar
kaksitasosäännöt
kaksitasoinen morfologia
kielioppiformalismit
finita-statliga metoder
ändliga automater
morfologisk analys
begränsningar
two-nivå morfologi
grammatiska formalismer
Peer reviewed: Yes
Usage restriction: openAccess
Self-archived version: publishedVersion


Files in this item

Total number of downloads: Loading...

Files Size Format View
ylijyra_fsmnlp11_online_slides.pdf 557.3Kb PDF View/Open
W11_4405.pdf 192.9Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record