Tekið út úr trjábanka: Nýir möguleikar í megindlegum setningafræðirannsóknum

Föstudagur 25. mars kl. 13.00-14.30 í stofu 50 í Aðalbyggingu Háskólans

Um þessar mundir er unnið að gerð setningafræðilegs trjábanka fyrir íslensku, en trjábanki er safn texta sem hafa verið greindir setningafræðilega. Íslenski trjábankinn mun taka til texta allt frá 12. öld til hinnar 21., og stefnt er að því að í honum verði um ein milljón orða. Trjábankar eru ómissandi hjálpartæki við gerð ýmiss konar máltæknibúnaðar og sögulegir trjábankar eins og sá íslenski eru ómetanlegir við rannsóknir á setningafræðilegum breytingum. Íslenski trjábankinn er líka gerður eftir sambærilegum reglum og sögulegir enskir trjábankar og þýskir sem opnar möguleika á margs kyns samanburði á þróun málanna. Á málstofunni verða flutt þrjú erindi sem sýna gagnsemi trjábankans við rannsóknir á íslenskri setningafræði, sögu hennar og samanburði við skyld tungumál.

Málstofustjóri: Eiríkur Rögnvaldsson, prófessor í íslenskri málfræði

 Fyrirlesarar:

  • Anton Karl Ingason, meistaranemi í íslenskri málfræði og Laurel MacKenzie, doktorsnemi við Háskólann í Pensilvaníu: Þyngd
  • Einar Freyr Sigurðsson, meistaranemi í íslenskri málfræði: Uppruni nýju þolmyndarinnar
  • Joel Wallenberg, nýdoktor við Málvísindastofnun: Towards A Field of Comparative Quantitative Information Structure

Útdrættir: 

Anton Karl Ingason, meistaranemi í íslenskri málfræði og Laurel MacKenzie, doktorsnemi við Háskólann í Pensilvaníu
Þyngd

Staða setningaliða er stundum skýrð með vísun í svokallaða þyngd þeirra. Þannig er þungum liðum gjarna eðlilegra að koma aftar í setningu en samsvarandi léttir liðir. Í þessum fyrirlestri verður fjallað um eðli þyngdar. Færð verða rök fyrir því að þyngd sé ekki tvígild breyta heldur sé hún mælanleg á kvarða. Stuðst verður við megindlega athugun á frestun tilvísunarsetninga í trjábönkum fyrir íslensku og ensku. Þá verður bent á galla á hugmyndum um þyngd sem byggjast á upplýsingaformgerð og rök færð fyrir því að mælieining þyngdar sé hrynræns eðlis. Loks verður rætt um almennar afleiðingar þessarar niðurstöðu fyrir ólík kenningakerfi í málfræði og hugmyndir um rót tilbrigða.

 

Einar Freyr Sigurðsson, meistaranemi í íslenskri málfræði
Uppruni nýju þolmyndarinnar

Nýja þolmyndin (Sigríður Sigurjónsdóttir og Maling 2001) hefur rutt sér til rúms í íslensku á mjög skömmum tíma að því er virðist. Ýmsar tilgátur hafa verið settar fram um uppruna hennar en þó hefur ekki tekist að sýna fram á hver hann er. Hvað veldur því að nýja þolmyndin er tæk í íslensku og pólsku en ekki í nágrannamálunum? Í fyrirlestrinum verður rætt um breytingar í sögu íslensku sem kunna að hafa ýtt undir breytinguna. Þá verður fjallað um þætti sem virðast ekki hafa breyst, svo sem hlutfallslega tíðni af-liða í þolmynd.

 

Joel Wallenberg, nýdoktor við Málvísindastofnu
Towards A Field of Comparative Quantitative Information Structure

While there has long been an intuition that the subject position is “topical” or “(back)ground” (cf. Vallduvi 1992), there is little precise comparative data on the syntax-information-structure interface across languages. This paper brings a quantitative crosslinguistic perspective to this question, and investigates how the passive is used to manipulate the information structure by promoting an internal argument to subject. Using three syntactically parsed corpora which contain parallel texts (Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME), the Parsed Corpus of Early New High German, and the Icelandic Parsed Historical Corpus (IcePaHC)), I show that English uses passivization at a significantly higher frequency than two closely related languages, Icelandic and German. I argue that V2 languages use the passive at a lower frequency because they can accomplish the same information structural goals using other methods (e.g. scrambling, A'-movement). Finally, data from the York-Toronto-Helsinki Corpus of Old English Prose provides evidence that Old English is more like Icelandic and German than it is like modern English in its use of passivization, showing that languages can change in how they fit syntax to information structure.

Deila: 
Þú ert að nota: brimir.rhi.hi.is