Íslensk og evrópsk málföng, opin og frjáls

Málstofan verður í Aðalbyggingu Háskólans laugardaginn 16. mars kl. 10.30-12.00.

Um mánaðamótin janúar-febrúar lauk Evrópuverkefninu META-NORD sem Máltæknisetur tók þátt í af hálfu Íslands. Þetta verkefni tók til Norðurlanda og Eystrasaltslanda og var eitt þriggja svæðisbundinna systurverkefna sem saman náðu til allrar Evrópu, en yfir þeim öllum var regnhlífin META-NET. Markmið verkefnanna var að styrkja stöðu evrópskra tungumála og samskipti milli málsvæða með því að efla máltækni og gera hvers kyns málfræðileg gagnasöfn aðgengileg. Gerð var úttekt á stöðu 30 Evrópumála og máltæknilegum stuðningi við þau og niðurstöður birtar í skýrslum sem eru bæði prentaðar og á netinu. Komið hefur verið upp gagnabrunninum META-SHARE þar sem málleg gagnasöfn og máltæknibúnaður er skráð.

Í málstofunni verður sagt frá meginafurðum verkefnisins - málskýrslunum og gagnabrunninum. Þar sem skýrslurnar hafa töluvert verið kynntar áður verður megináhersla lögð á gagnabrunninn. Sýnd verða dæmi um innihald hans og notkun, og gerð grein fyrir mögulegri nýtingu þeirra gagna sem þar eru. Gefið verður yfirlit um þau íslensku gögn sem þar hafa verið lögð inn og fjallað um vinnuna við að afla þeirra og ganga frá þeim. Þá verður rætt um alþjóðlega staðla um textagögn (TEI, LMF, TBX o.fl.) og kostina við að fylgja þeim stöðlum í frágangi gagna. Einnig verður fjallað um síðuna málföng.is þar sem ætlunin er að setja inn upplýsingar um sem flest íslensk gagnasöfn og krækjur á þau.

Fyrirlesarar:

  • Eiríkur Rögnvaldsson, prófessor í íslenskri málfræði: Opin málföng ─ Allra hagur
  • Sigrún Helgadóttir MSc og Steinþór Steingrímsson MSc: Alþjóðlegir staðlar um textagögn
  • Kristín M. Jóhannsdóttir málfræðingur: Málföng.is ─ aðgengi að íslenskum málföngum

Málstofustjóri: Halldóra Jónsdóttir verkefnisstjóri hjá Árnastofnun

Útdrættir:

Eiríkur Rögnvaldsson, prófessor í íslenskri málfræði: Opin málföng ─ allra hagur

Evrópuverkefninu META-NORD sem Máltæknisetur átti aðild að lauk um mánaðamótin janúar-febrúar. Þetta var hluti af stærra verkefni, META-NET, sem náði til nær allrar Evrópu. Einn megintilgangur verkefnisins var að safna saman hvers kyns mállegum gagnasöfnum og hugbúnaði, málföngum (e. language respources) fyrir öll Evrópumál. Samdar eru staðlaðar lýsingar á málföngunum og þau gerð aðgengileg gegnum META-SHARE sem er net gagnahirslna. Þannig á að vera auðvelt að fá yfirsýn yfir þau gögn sem eru til, hvernig hægt er að nálgast þau, og með hvaða skilmálum. Áhersla er lögð á að gögnin séu sem opnust ─ helst ókeypis. Á bak við það er sú sannfæring að gott aðgengi að málföngum sé allra hagur. Þetta er líka bæði í samræmi við stefnu ríkisstjórnarinnar um opinn hugbúnað og íslenska málstefnu um opinn aðgang að málföngum. Í erindinu verða sýnd dæmi um notkun META-SHARE og þau gögn sem þar eru geymd.

 

Sigrún Helgadóttir MSc og Steinþór Steingrímsson MSc: Alþjóðlegir staðlar fyrir textagögn

Sagt verður frá þremur alþjóðlegum stöðlum sem voru notaðir fyrir málföng sem voru gerð aðgengileg í META-NORD verkefninu. Til þess að gera málföng aðgengileg í alþjóðlegu samhengi þurfti að koma þeim í það snið sem viðkomandi staðall segir til um. Allir staðlarnir byggjast á xml-staðlinum. Þessir staðlar eru: TEI P5 fyrir málheildir, LMF fyrir orðasöfn og orðabækur og TBX fyrir íðorðasöfn. Sagt verður frá þeim málföngum sem voru umrituð samkvæmt réttum staðli og sýnd dæmi. Lögð verður áhersla á mikilvægi þess að skrá textagögn samkvæmt alþjóðlegum stöðlum til þess að þau geti nýst sem flestum.

 

Kristín M. Jóhannsdóttir, málfræðingur: Málföng.is ─ aðgengi að íslenskum málföngum

Þótt íslenskan standi ekki vel að vígi þegar kemur að fjölda málfanga og skipi sér í lægsta flokk Evrópumála á nær öllum sviðum máltækni má ekki horfa fram hjá þeim málföngum sem þó eru til. Þetta eru stafræn gögn eins og orðasöfn, vinnsluforrit, málheildir og fleira sem sum hver hafa frá upphafi verið gerð aðgengileg þeim sem áhuga hafa en önnur hafa lengst af legið niðri í skúffu eftir að vinnslu þeirra lauk eða fjármagn til vinnslunnar þvarr. Eitt af markmiðum META-NET verkefnisins var að gera stafrænar gagnahirslur til þess að lýsa þessum málföngum, skrá þau, varðveita og gera aðgengileg á opinn, notendavænan og öruggan hátt. Þetta markmið náðist og íslensku gögnin eru nú að mestu skráð á META-SHARE vefsvæðinu innan um önnur evrópsk máltækniverkefni. Auk þess var stofnuð sérstök, íslensk síða fyrir íslensk málföng, málföng.is, sem hýsir fyrst og fremst tengla á íslensk málföng auk töluverðra upplýsinga á íslensku og ensku um flest þeirra. Í fyrirlestrinum verður fjallað um tilurð þessarar síðu, notagildi hennar og hugsanlega framtíð.

Deila: 
Þú ert að nota: brimir.rhi.hi.is