7. Akustinen, aerodynaaminen ja auditiivinen fonetiikka

7.1. Yleisiä termejä

Akustinen fonetiikka sisältää ensisijaisesti spesifisesti fonetiikkaan (puheen akustiikkaan) ja toissijaisesti yleiseen akustiikkaan liittyviä käsitteitä. Lisäksi on otettu mukaan kokeelliseen metodologiaan liittyviä käsitteitä. Aerodynamisen ja auditiivisen fonetiikan termit on myös sijoitettu tähän lukuun.

Akustinen (acoustic)

Termi viittaa fonetiikassa nykyisin ensisijaisesti äänivärähtelyyn, kun taas kuulohavaintoon viitataan termillä perseptiivinen (myös: perkeptiivinen) (perceptual) ja auditiivinen (auditive, auditory). Edellinen viittaa havaintoon yleensä, jälkimmäinen spesifisesti kuulohavaintoon. Ks. myös psykoakustinen.

Ääni (sound)

Kuuloalueen sisäpuolelle jäävien mekaanisten värähtelyiden aiheuttama havainto. Kuuloalueen alapuolelle jäävät infraäänet, yläpuolelle ultraäänet.

Äänilähde (sound source)

Äänen tuottamiseen tarvittavan painevaihtelun aiheuttaja (puheessa esim. äänihuulet).

Ilmanvirtausmekanismi (air stream mechanism)

Aeordynaaminen tekijä, jolla kuvataan tapaa, jolla äänteiden tuotossa tarpeellinen ilmanvirtaus saadaan aikaan. Tästä käytetään myös nimitystä initiaatio (initiation)(Catford 1977; 1988). Yleensä erotetaan pulmoninen (pulmonic), glottaalinen (glottalic) ja velaarinen (velaric) initiaation. Pulmoninen initiaatio on tavallisin ja tarpeen suurimmassa osassa äänteitä. Glottaalinen initiaatio esiintyy ejektiiveissä ja implosiiveissa, veraalinen naksausäänteissä. Ilmanvirtauksen suunta voi olla ulospäin (exgressive) sisäänpäin (ingressive) suuntautunut.

Subglottaalinen paine (subglottal pressure)

Paine, joka pulmonisen paineen (pulmonic pressure)] XE "pulmonisen paineen (pulmonic pressure)"  eli keuhkoissa vallitsevan paineen vaikutuksesta esiintyy ääniraon (glottiksen alapuolella). Vastakohtina ovat glottaalinen paine (glottal pressure; transglottal pressure),] XE "glottaalinen paine (glottal pressure),"  joka on ääniraossa vallitseva paine sekä supraglottaalinen paine (supraglottal pressure), joka vallitsee paine ääniraon yläpuolella. Myös termiä intraoraalinen paine (intraoral pressure) käytetään (=paine suuontelossa).

Säteily (radiation)

Ääniaallon leviäminen suuaukosta ympäristöön.

Kohina, melu (noise)

Informaatiota sisältämätön ääni.

Segmentaatio (segmentation)

Puhesignaalin jakaminen äännesegmenteiksi.

Vaste (response)

Kuulijan reaktio ärsykkeeseen.

Erottelu eli diskriminaatio (discrimination)

Kahden ääniärsykkeen havaitseminen erilaisiksi kuulon avulla.

Akustinen vihje (acoustic clue, acoustic cue)

Puheen akustisessa ilmenemismuodossa esiintyvä, fonologisesti relevantteja piirteitä edustava signaali. Esim. äänteiden siirtymävaiheet voivat toimia konsonanttien artikulaatiopaikkoja ilmaisevina akustisina vihjeinä.

Sointiväri (timbre)

Äänen havaittava laatuominaisuus, joka perustuu pääasiallisesti äänen spektriominaisuuksiin.

Intensiteetti (intensity)

Puheen akustinen ominaisuus, joka voidaan mitata intensiteettikäyrästä. Intensiteetti ei ole suoraan verrannollinen esim. havaitun äänekkyyden tai painollisuuden kanssa. Intensiteettikäyrä saadaan, kun alkuperäinen aaltomuoto (kuva 7.1.) tasasuunnataan (B) ja integroidaan (C). Tasasuuntauksessa värähtelyn negatiivinen puoli kääntyy positiiviseksi. Integrointi ilmaisee värähtelyn verhokäyrän. Integroidun käyrän karkeusaste on riippuvainen sovelletusta integrointiajasta (aikaikkunasta). Ks. myös > integrointi.

KUVA 7.1. Aaltomuodosta intensiteettikäyräksi. Katso [intensiteetti] [tasasuuntaus] [integrointi]
Kuva esittää, miten alkuperäisestä aaltomuodosta (A), saadaan tasasuuntauksen (B) ja integroinnin (C) kautta intensiteettikäyrä (äänenpainetason kuvaus)
.

 

 

KUVA 7.2. Ylempänä spektrogrammi naispuhujan tuottamasta lauseesta "Mene aamulla muualle". Kuvassa näkyvät perussävel (alinna) ja sen kerrannaiset, yläsävelet. Niistä näkyvissä enintään viisi. Alempana automaattinen perustaajuusanalyysi samasta lauseesta. Sanojen "mene" ja "aamulla" välissä esiintyy glottalisaatio. (Analyysit tehty SoundScope-ohjelmalla.)

Yläsävel (harmonic)

Kompleksisessa jaksollisessa värähtelyssä perussävelen kerrannainen (seuraava kuva 7.3.). Jos perussävel on 120 Hz, niin yläsävelet ovat 240, 360, 480, 600, 720 jne. Hz. Perussävelen ja yläsävelten keskinäiset amplitudisuhteet määräävät äänteen (resonantin) akustisen kvaliteetin eli laadun.

Perussävel ja yläsävelet ovat yhdessä osasäveliä.

KUVA 7.3. Kaksi esimerkkiä perussävelestä (F0) ja yläsävelistä. Yläsävelten taajuus määräytyy kokonaan perussävelen korkeudesta. Katso [yläsävel]

 

Kurkunpää-ääni eli laryngaalinen ääni (laryngeal tone)

Äänihuulten värähtelyn seurauksena syntynyt kompleksinen värähtely, joka sisältää perussävelen ja yläsävelet (kuva 11, I). Yläsävelten voimakkuus on sitä heikompi, mitä korkeampia ne ovat Hz-asteikolla. Ääntöväylän muoto muuttaa laryngaalisen äänen osasävelten suhteita, mistä aiheutuu erilaisia äännekvaliteetteja. Vrt. siirtofunktio.

Äänihuuliperiodi (glottal period)

Äänihuulten tuottama yksi värähdysjakso, jonka aikana äänihuulet tuottavat yhden avauma- ja yhden sulkeumaliikkeen. Akustisesti äänihuuliperiodi voidaan esittää oskillogrammin avulla (seuraava kuva 7.4. ja kuva 8.1.).

 

KUVA 7.4. Yksi vajaa ja kolme kokonaista akustista jaksoa [y]-vokaalista sanassa "Ryti". Jaksot ovat fysiologisten äänihuliperiodien aiheuttamia. Jaksoissa ilmenee äänihuulten värähtelyn aiheuttaman perusvärähtelyn ohella ääntöväylän siirtovaikutus. Miespuhuja. (Kuva laadittu QuickSig-ohjelmalla.) Katso [äänihuuliperiodi]

 

Verhokäyrä eli vaippakäyrä (envelope)

Käyrä, joka kuvaa spektrin muotoa (kuva 7.5.). Fonetiikassa verhokäyrä voi esittää mm. ääntöväylän siirtofunktiota tai spektrin osavärähtelyiden huippuja yhdistävää viivaa.

Formantti (formant)

Formantti on (1) äänteen spektrissä todettavissa oleva vahvistunut osavärähtelyalue (peak) tai (2) tämän taustalla vaikuttava siirtofunktio-ominaisuus (pole). Ks. kuvat 7.5., 7.6., 8.2. ja 8.4. Kun viitataan formanttiin kokonaisuutena, käytetään esim. lyhennettä F1 (=ensimmäinen formantti); kun viitataan formantin taajuuteen, käytetään esim lyhennettä F1 (=ensimmäisen formantin taajuus; formantin järjestysluku alaindeksinä). Taajuuden lisäksi formanttia kuvataan intensiteetin (L) ja kaistanleveyden (B) avulla. Intensiteetin asemesta voidaan ilmoittaa amplitudi (A). Frikatiivisista formanteista käytetään lyhenteitä K1 ja K2. Nasaaliformantista lyhennettä FN tai N. Formantit ovat useiden äänteiden kvalitatiivisten erojen perusta. Vokaaleissa kaksi ensimmäistä formanttia ovat kielellisesti tärkeimmät (ks. formanttikartta).

Formantit löytyvät spektrianalyysiä käyttäen seuraavien periaatteiden avulla:

  • leveäkaistainen spektrogrammi: formantit näkyvät vaakasuorina leveinä juovina
  • kapeakaistainen spektrogrammi: formantit näkyvät osasävelten tummennoksina
  • FFT-lyhytaikaisspektri laskettuna suhteellisen pienellä aikaikkunalla (time window, esim. 5 ms). Tällöin kuitenkin ikkuna sattuu usein yhden äänihuuliperiodin sisään ja voi sisältää epätoivottuja ominaisuuksia
  • määrittämällä aaltomuodosta yhden äänihuuliperiodin mittainen aikaikkuna ja tekemällä siitä FFT-analyysi; aikaikkunan alkupisteen muuttaminen voi parantaa formanttien näkyvyyttä
  • yhdistämällä spektrintasoitus (smoothing) ja FFT-lyhytaikaisspektri pitkällä aikaikkunalla (esim. 30 ms; 45 Hz:n suodin); tällöin aikaikkunan paikka aaltomuodon periodirakenteessa ei vaikuta juurikaan spektrin muotoon
  • digitaaliset analyysiohjelmat voivat tarjota automaattisia formanttimittausmenetelmiä

 

KUVA 7.5.Formanttia kuvataan käsitteillä taajuus (Fn, Hz), kaistanlveys (Bn, Hz) ja intensiteetti (Ln tai An, dB). Katso [formantti], [verhokäyrä] [kaistanleveys]

 

Resonanssimaksimi (pole) ja spektrimaksimi (peak)

Resonanssimaksimi on ääntöväylän siirtofunktion aiheuttama formantti, jolla ei välttämättä tarvitse olla akustista vastinetta. Vastine esiintyy, jos resonanssimaksimin kohdalle tai sen lähelle osuu yksi tai useampia osasäveliä, jolloin resonanssimaksimi synnyttää osasäveliä vahvistamalla spektrihuipun (formantin). Tietyissä tapauksissa (kuten usein [u]-vokaalissa) kaksi resonanssimaksimia joutuu lähes yhteen ja tuloksena voi tällöin olla ehkä vain yksi (leveä) spektraalinen maksimi. Ks. kuva (7.6.).

 

KUVA 7.6. Vokaalien formanttirakenne ajan (t) ja taajuuden (Hz) sekä taajuuden (Hz) ja voimakkuuden (dB) asteikoissa esitettynä. Katso [resonanssimaksimi] [spektrimaksimi]

 

Antiformantti (antiformant; zero)

Formantin vastakohta, siirtofunktiossa amplitudia heikentävä voima, joka spektrissä tulee esiin joko osasävelten puuttumisena tai osasävelten heikentymisenä. Antiformantteja esiintyy mm., kun akustisessa pääväylässä on sivuväylä (vrt. nasaalit) tai kun äänilähde ei sijaitse ääntöväylän takaosassa (äänihuulissa). Antiresonansseja esiintyy siten nasaalikonsonanteissa ja nasaalivokaaleissa, frikatiiveissa, affrikaatoissa ja klusiileissa. Niitä on myös lateraaleissa.

Kaistanleveys (bandwidth)

Spektrissä esiintyvän huipun leveys Hz-arvoina mitattuna huipusta 3 dB alaspäin (kuva 7.5.).

Siirtofunktio (transfer function)

Siirtofunktio merkitsee fonetiikassa sitä suodatinvaikutusta, mikä ääntöväylän kulloisellakin muodolla (joka on lähinnä seuraus kielen aiheuttamasta konstriktiosta ja huuliaukosta) on laryngaaliseen ääneen. Siirtofunktio on siten äänteiden erilaisuuden aiheuttava perusilmiö. Siirtofunktio voidaan kuvata verhokäyrällä. Ks. kuva (7.7.), jossa ns. siirtokäyrä (transmission curve).

 

KUVA 7.7. Resonanttiäänteiden äänilähteen (A) ja ääntöväylän siirtovaikutuksen (B) tuloksena syntynyt äännespektri (C). Katso [siirtofunktio]
Siirtofunktion vaikutus:
A - Äänilähteen (äänihuulten cärähtelyn) aiheuttama spektri
B - Tietyn ääntöväylämuodon siirtovaikutus
C - Syntyneen äänteen spektri (eli tulos siitä,että B vaikuttaa A:han).
Image101A.gif (1509 bytes)Image101B.gif (1428 bytes)Image101C.gif (1623 bytes)
(G. Fantin mukaan.)

 

Nomogrammi (nomogram)

Yleensä: esim. kolmen muuttujan välistä riippuvuutta kuvaava käyrä. Fonetiikassa: Fantin käyttämä termi käyrästä, joka esittää ääntöväylän konstriktion (kapeikon) paikan, huuliaukon ja formantin korkeuden välistä riippuvuutta. Konstriktion paikka ilmaistaan etäisyytenä äänihuulista, huuliaukon suuruus pinta-alana huulten kohdalla.

Resonanssi (resonance)

Myötävärähtelyilmiö, jossa kappale alkaa värähdellä tai kappaleen värähtelyamplitudi kasvaa toisen kappaleen värähtelyn vaikutuksesta, kun molempien frekvenssit ovat samankorkuiset tai lähellä toisiaan.

Formanttikartta, formanttikoordinaatisto (formant chart)

Kahden formantin (useimmiten F1/F2, mutta myös esim. F2/F3) koordinaatisto, jossa vokaalit saavat paikkansa (kuva 7.8.). Koordinaatiston origopiste (asteikkojen nollapiste) on vaihtelevasti joko vasemmalla alhaalla (yleisen koordinaatistoperiaatteen mukaisesti), oikealla ylhäällä (jolloin saadaan vokaalinelikulmiolle (kvasi)isomorfinen suhde tai vasemmalla ylhäällä.

Psykoakustinen formanttikartta (psychoacoustical formant chart)

Koordinaatisto, joka käyttää formanttien arvoja psykoakustisesti perustelluilla asteikoilla. Asteikoiksi on ehdotettu Koenigin asteikkoa, mel-, Bark-, Erb- ja logaritmista asteikkoa. Kuvassa 7.8.on formanttien F1 ja F2 arvot Bark-asteikkolla niin, että F1-asteikkoa on laajennettu 60% F2-asteikkoon verraten. Vokaalipisteet on esitetty 1 Barkin kokoisina ympyröinä, jotta vokaalien psykoakustinen erotettavuus F1/F2-avaruudessa saisi kuvassa vastaavan ilmaisun. Esitys mahdollistaa vokaalijärjestelmän varsin todenmukaisen likiarvon, kun kuvataan ns. perusvokaaleja (vokaalit etisyyden, väljyysasteen ja pyöreyden suhteen). Mikäli vokaalipisteet eivät eroa toisistaan kartalla Bark-ympyrän vertaa enemmän, ne ovat laadullisesti samankaltaisia tai on muita akustisia muuttujia, jotka ovat erottavia vihjeitä. Eräissä kielissä suppeat etuvokaalit eivät enää erotu toisistaan kuvauksessa, jolloin on viitattu kolmannen formantit (F3) merkitykseen ja F2:n ja F3:n sulautumiseen (ns. F2':n käsite; "F2 pilkku"; F2 prime) ja mainittujen formanttien desibelisuhteisiin. Joissakin tapauksissa pyöreiden etuvokaalien ja keskivokaalien erottelu kartalla aiheuttaa myös ongelmia (kuvassa 7.8. sanojen "bet" ja "bird" vokalit).

KUVA 7.8.Psykoakustinen formanttikartta. Englannin vokaalit (monoftongit). Kutakin vokaalityyppiä havainnollistetaan avainsanalla. (Numeerinen aineisto: Deterding 1997, jossa käytetty viiden miespuhujan digitaalisesta puhetietokannasta saatuja vokaaleja noin 10 esiintymää vokaalityyppiä kohden). Katso [psykoakustinen formanttikartta]

 

Valkoinen häly eli valkoinen kohina (white noise)

Värähtely, jonka spektrissä kaikki frekvenssikomponentit edustettuina suunnilleen yhtä voimakkaina. Äänteistä lähinnä irrallaan äännetty [f] muistuttaa valkoista hälyä.

Vakiovaihe (steady state)

Formantin ajallinen vaihe, jonka kestäessä formantin taajuus pysyy muuttumattomana (kuva 7.9.).

Tavoitevaihe (target)

Formantin taajuus, jota on pidettävä ko. äänteen kannalta tavoitteellisena, äänteen kvaliteetin kannalta olennaisena (kuva 7.9.).

Siirtymävaihe (transition)

Kahden äänteen välinen vaihe. 1950-luvulla tehdyt synteesikokeet osoittivat, että siirtymävaiheet ovat tärkeitä konsonanttien artikulaatiopaikkoja ilmaisevia akustisina vihjeitä. Vokaalien formanttien frekvenssi muuttuu siirtymävaiheessa (eli formantti "taipuu" (kuva 7.9.), mikä ilmaisee viereisen konsonantin artikulaatiopaikan.

Kohtio (locus; mon. loci)

Useiden äänneryhmien kuten klusiilien, frikatiivien ja nasaalien akustisessa rakenteessa auditiivisesti relevantti konsonantin artikulaatiopaikkaa ilmaiseva taajuus, johon vieressä olevan vokaalin formantti "osoittaa". Kullekin artikulaatiopaikalle tyypillinen (puhujakohtaisesti muuttumaton) ja vokaalin laadusta riippumaton "piste" taajuusdimensiolla, jota sellaisenaan ei lainkaan ole akustisesti olemassa (seur. kuva 7.9.). Velaarisilla konsonanteilla on kaksi lokusta eli kohtiota.

KUVA 7.9. Formantin "taipuminen" äänteen siirtymävaiheessa ja siihen liittyviä käsitteitä.
Katso [formantti] [kohtio] [siirtymävaihe] [tavoitevaihe] [vakiovaihe]

 

 

 

 

7.2. Aikafunktioon liittyvät termit

Aikafunktio (time function) ja aaltomuoto (wave form)

Värähtelyä kuvaava esitys ajan ja amplitudin funktiona (kuvat 7.1., 7.4., 8.2.).

Amplitudi eli värähdyslaajuus (amplitude)

Värähtelevän kappaleen, esim. ilmahiukkasen suorittama värähdysliike lepoasemasta ääriasemaan painevaikutuksen suunnassa (kuva 8.2.). Lyhenne A.

Jakso (cycle)

Periodisessa värähtelyssä esiintyvä värähtelyn yksikkö, joka toistuu (kvasi)identtisenä tietyn ajan (kuvat 7.4., 8.2.).

Periodinen eli jaksollinen värähtely (periodic vibration)

Värähtelytyyppi, jossa on identtisinä toistuvia jaksoja (kuvat 7.4., 8.2.).

Epäperiodinen eli jaksoton värähtely (non-periodic vibration)

Värähtelytyyppi, jossa ei voida erottaa identtisiä jaksoja. Toisaalta puhutaan myös kvasiperiodisesta (quasi periodic) ja kvasiperiodittomasta (quasi random) värähtelystä. Edellisessä jaksot ovat lähes samanlaisia, mutta eivät identtisiä; jälkimmäisessä värähtely ei ole jaksollista, mutta siinä voidaan kuitenkin havaita tiettyä säännöllisyyttä. Äänteitä voidaan luonnehtia seuraavasti: soinnilliset vokaalit ovat kvasiperiodisia, samoin soinnilliset lateraalit ja nasaalit; soinnittomat frikatiivit ovat eräperiodisia, mutta niissä voidaan, toisissa enemmän, toisissa vähemmän, erottaa säännöllisyyksiä. Soinnillisissa frikatiiveissa (kvasi)periodisuus yhdistyy epäperiodisuuteen (tai kvasiperiodittomuuteen).

Aallonpituus (wave length)

Välimatka jakson huippuamplitudista seuraavan jakson vastaavaan kohtaan.

Vaihe (phase)

Kaksi värähtelyä, joilla on sama frekvenssi, ovat eri vaiheissa, kun niiden aaltomuoto sattuu eri ajankohdille.

Nollanylitys (zero-crossing)

Aaltomuodon kohta, jossa värähtely ylittää lepotason. Tärkeäksi osoittautunut akustinen piirre, välttämätön puheen ymmärrettävyydelle (nollanylitysten taajuuspiirre). Myös "nollanohitus".

Frekvenssi (frequency)

Värähtelyn taajuus eli jaksoluku. Värähtelyn jaksojen lukumäärä aikayksikköä (sekuntia) kohti. Yksikkö hertsi (Hz). 1 Hz = 1 jakso/s. Lyhenne f.

Sinivärähtely eli äänes (sinusoidal vibration; pure tone; simple tone; sine wave)

Aaltomuoto, jossa jakson muodostaa yksinkertainen amplitudin kasvu, paluu lepotilaan sekä vastaava negatiivinen poikkeama lepotilasta .

Kompleksinen värähtely (complex vibration)

Värähtelytyyppi, jonka voidaan katsoa koostuvan osavärähtelyistä (Ohm, Fourier) tai periodisessa värähtelyssä perussävelen kerrannaisista (esim. kuvat 8.3b ja 8.5.). Puheessa esiintyy vain kompleksisia värähtelyitä.

Sole eli sekaääni

Ääni, joka sisältää periodisia ja epäperiodisia värähtelyitä. Puheessa tällaisia ovat mm. soinnilliset frikatiivit, mutta termi ei ole fonetiikassa vakiintunut.

Vaimennus (damping)

Värähtelyn amplitudin säännöllinen väheneminen.