Syntactic patterns in Pite Saami
A corpus-based exploration of 130 years of variation and change
   
 
   
 
Kort projektbeskrivning

Projektets huvudmål är att skapa korpusbaserade beskrivningar av syntaktiska mönster i pitesamiska, ett starkt (utrotnings)hotat finskt-ugriskt språk som talas i norra Sverige. Korpusen ska bestå av pitesamiska talspråkstexter som representerar mer än ett århundrade av språkanvändning, från slutet av 1800-talet fram till början av 2000-talet. Med detta i åtanke kommer texternas ålder betraktas som en möjlig faktor för att förklara variation i belagda syntaktiska mönster, vilket möjliggör en undersökning av strukturella förändringar över tid. Projektet ska använda kvantitativa metoder för att besvara följande forskningsfrågor: 1. Vilka konstituenter är möjliga eller krävs i de olika pitesamiska fras- och satstyperna? Finns det en preferens för vissa strukturer? 2. Hur påverkar informationsstrukturen syntaktiska strukturer? 3. Visar korpusen diakrona förändringar i syntaktiska mönster? I så fall, i vilka mönster?

I ett första steg ska en grundligt annoterad korpus skapas. För att göra detta på mest effektiva sätt ska existerande språkteknologiska verktyg förfinas så att de pitesamiska texterna automatiskt annoteras för lexem, morfologiska kategorier och ordklasser. Projektet kommer att ge tre huvudresultat: 1. en beskrivning av belagda syntaktiska mönster i form av en monografi; 2. en grundligt annoterad, digital talspråkskorpus som omfattar texter från mer än ett århundrade, och som kommer att vara tillgänglig för ytterligare forskning samt 3. en modell för användning av språktekniska verktyg för att automatiskt annotera en talspråkskorpus för ett hotat språk. Beskrivningen av syntaktiska strukturer ska bidra med nya insikter om ett hittills underbeskrivet språk. Dessa kommer inte bara vara av intresse för uralisk språkforskning (särskilt för historiska jämförande studier), utan även till den synkrona jämförande teoretiska lingvistiken med både formella och funktionella metoder.