Sidkarta   |   Kontakt
 
Större textMindre text

En språkbank för finlandssvenska

78 miljoner ord modern text
6,8 miljoner ord äldre text

En korpus är en textsamling som används för språk- eller litteraturvetenskapliga studier. I våra dagar avser ordet först och främst texter i maskinläsbar form, och ett viktigt krav är att det ska vara autentiskt språkmaterial. En samling med korpusar brukar benämnas språkbank. I våra dagar finns det omfattande språkbanker för ett stort antal språk. De största har ett omfång på över en miljard ord. En språkbank kan innehålla också annat material än korpusar.

Som ett delprojekt inom språkprojektet Svenskan i Finland – i dag och i går har den finlandssvenska språkbanken byggts ut. Arbetet pågick i tre och ett halvt år, från januari 2011 till juni 2014, och det var ett samarbetsprojekt mellan Svenska litteratursällskapet, Institutet för de inhemska språken och Göteborgs universitet. Resultatet är en språkbank över modern finlandssvenska med en omfattning på 78 miljoner ord och en samling med historiska texter på 6,76 miljoner ord. Den finlandssvenska textsamlingen ingår i Språkbanken vid Göteborgs universitet som en del av Korp. Texterna är kodade så att det är möjligt att göra grammatiska sökningar av olika slag, vilket ger helt andra ingångar i språket än sökning på enkla sökord.

Följande personer i Finland har arbetat med projektet:

Julia von Boguslawski (textanskaffare, historiskt material)
Pieter Claes (textanskaffare, historiskt material)
Helena Holm-Cuzdan (textanskaffare, historiskt material)
Tuomas Katila (datalingvist)
Anna Silvan (textanskaffare, modernt material)

Nina Martola (projektledare, Institutet för de inhemska språken)
Marika Tandefelt (projektledare för projektet Svenskan i Finland – i dag och i går)

 

| Mer
Svenska litteratursällskapet i Finland | PB 158, 00171 Helsingfors | Tfn (09) 618 777 | info(a)sls.fi |