Här beskriver vi textanalysverktyget BasALT. Verktyget är avsett att användas som ett stöd för informationsansvariga i kommuner för att skriva på enkel svenska. Verktyget utvecklas av företaget Access and Language Technology ALT http://accesslt.se.

Ladda ner beskrivningen som Pdf-fil.

Innehåll

Varför har vi skapat BasALT?

Behovet av lättförståeliga texter ökar hela tiden eftersom mer och mer information sprids via nätet. Många av Sveriges invånare klarar bara att förstå information som är skriven på väldigt enkel svenska. Mycket av den information som är väsentlig för att man fullt ut ska kunna delta i samhällslivet blir därmed till stor del oanvändbar för dem. I arbetet med BasALT har vi fokuserat på analys och bearbetning av informationstexter skrivna för kommuninvånare.

Utvecklingen av BasALT har finansierats av Post- och Telestyrelsen (PTS) som har genomfört olika satsningar på tillgänglighet ”Begriplighet och interaktion”. Satsningen innebär att man stödjer arbete med att förbättra tillgängligheten av information så att alla kan tillgodogöra sig den.

Arbetet med BasALT har sitt ursprung i en bedömningsmodell (SVIT) för läsbarhet som utvecklades inom ramen för Katarina Heimann Mühlenbocks avhandlingsarbete (ref.).

Vad menar vi med enkel svenska?

Skillnaden mellan olika begrepp om texters tillgänglighet är väsentlig. Man hör ofta talas om lättläst och klarspråk, som bägge är benämningar på texter som skrivits för att vara lättbegripliga. Lättläst är den generella benämningen på mycket lättförståeliga texter, oavsett genre, medan klarspråk betecknar enkel myndighetstext. Den textförenkling som vi erbjuder med hjälp av BasALT kallar vi för enkel svenska, eftersom ambitionen är att vårt verktyg ska underlätta framställning av enkel text oavsett genre.

Enkel svenska

Det går inte att producera vare sig ”Lättläst”, ”Klarspråk” eller ”enkel svenska” enbart utifrån mätningar av LIX-värde eller ordvariation i en text. Aspekter som rör meningsbyggnad, informationstäthet, tilltal osv. låter sig inte fånga med dessa enkla mått. För att bli en bra skribent av lättförståelig text behöver man känna till en del saker om hur språket är uppbyggt.

Vilken sorts läsbarhetsanalyser som görs i BasALT

BasALT analyserar din text dels som helhet, dels på meningsnivå. Anledningen till detta är att vissa karakteristiska drag endast yttrar sig och är möjliga att analysera för texten som helhet, som till exempel läsbarhetsindex. Andra drag kan bara analyseras inom en mening, till exempel meningsbyggnad.

Analys på textnivå

Här beskrivs vilken analys som görs på textnivå med exempeltexter. De analyser som utförs på hela texten är; 1) läsbarhetsindex, 2) meningslängd, 3) ”svåra ord”, 4) ordvariation och 5) nominalkvot.

1) Läsbarhetsindex (LIX) – detta läsbarhetsmått har använts sedan början på 1960-talet (Björnsson, 1962). LIX används för att bedöma andel ord per mening och andel långa ord. Ju högre värde desto svårare text. I allmänhet är ett högt värde ofta ett tecken på att en text innehåller mycket information. Den är då informationstät. Därför har t.ex. en text från en dagstidning ofta högre värde än en text från en skönlitterär text. LIX kan vara användbart som tumregel då man vill bedöma vilken genre en text tillhör. Det är viktigt att känna till att LIX endast kan användas för att analysera längre texter eftersom det utgår från medelvärden. LIX är därmed oanvändbart som instrument för att värdera enstaka meningar.

 lix
 Tabell 1. Beskrivning av genomsnittliga LIX-värden per texttyp (Melin & Lange, 2000).

2) Meningslängd, beskriver genomsnittligt antal ord per mening i en text. I BasALT bedöms ett värde på mer än 12 som alltför hög för informationstext.

3)Svåra ord, är en procentuell andel ord som inte finns med i en basvokabulär som består av de 3 750 vanligaste orden i en referenslista genererad från en stor samling svenska texter (korpusar). Om ett ord av tio ord i en mening inte finns i basvokabulären blir analysvärdet 10%.

4) Ordvariation, dvs. andel olika ord i en text, kan studeras med ordvariationsindex (OVIX). OVIX beskriver andel olika ord vilket också är en indikation på att texten är svår. Andel olika ord stiger i allmänhet med textens svårighetsgrad och informationstäthet. En dagstidning har därför högre ordvariation än en lärobokstext. Den formel som normalt används för att räkna ut ett värde för ordvariation, tar hänsyn till textens längd. Det är viktigt därför att ju kortare en text är, desto högre värde har ordvariation. Men allteftersom texten ökar i längd så blir värdet mer stabilt eftersom vissa ord normalt upprepas i en text och då sjunker ordvariationsvärdet.

ovix

Tabell 2. Beskrivning av genomsnittliga OVIX-värden per texttyp (Melin & Lange, 2000).

I BasALT används en rättvisare version av ordvariationsindex, nämligen Grundordsvariation (GV). Med GV beräknar man variationen av grundord, alltså ord som har samma stam men förekommer i olika böjningsformer. Orden rinner, rann, runnit, rinnande ochrunnen är alla böjningar av samma grundord, rinna, och om de förekommer med olika former i samma text räknas de bara en gång.

5) Nominalkvot är en beskrivning av textens karaktär i termer av skriftspråk eller talspråk. Det analysen visar är i allmänhet ett mått på informationstäthet (IT). Ett högt värde innebär mycket information i texten. En text som är nominal innehåller fler substantiv, adjektiv och particip än en text som är verbal och innehåller fler verb, adverb och pronomen.

nq

Tabell 3. Beskrivning av genomsnittliga värden på OVIX per texttyp (Melin & Lange, 2000).

Analys på meningsnivå

I analyser på meningsnivå undersöks fyra olika parametrar:

1) meningslängd, 2) frasstruktur, 3) meningsstruktur och 4) ”svåra ord”.


Exempel: En levande landsbygd som tar tillvara kommunens natur- och kulturvärden förutsätter även serviceorter som Lillby – Storby men också en del glesare bebyggelse på landsbygden.

ex1

Kan ändras till: En levande landsbygd tar vara på kommunens natur- och kulturvärden.

ex2

Serviceorter som Lillby – Storby ska finnas.

ex3

*Egennamn och skiljetecken räknas inte i analysen av meningslängd; **Egennamn ingår och räknas som ”svåra ord” eftersom de inte finns i ordlistan.

Det ska också vara mindre bebyggelse på landsbygden.

ex5

Hur responstexten efter analysen ska tolkas

Efter analys på text- eller meningsnivå ges responstext på hur analysresultaten. Här beskrivs hur responstexten ska tolkas och exempel på hur arbetstexten ska förändras utifrån det. Detta beskrivs med utgångspunkt från tabellen nedan.

bkpam2166633_tabell8

Riktlinjer för texter

Här beskrivs resultatnivåer som kan tolkas som normala för olika analyser. Nivåerna baseras på analys av autentiska texter, både icke-bearbetade eller enkla texter och även texter som är klassificerade som enkla.

Tabell med normalvärden för hela texter (obearbetad informationstext).

varden

Referenslista

Heimann Mühlenbock, Katarina, 2013, I see what you mean. Assessing readability for specific target groups. Doktorsavhandling. Göteborgs universitet. http://hdl.handle.net/2077/32472

Melin Lars & Lange Sven, 2000, Att analysera text. Stilanalys med exempel. 3 uppl. Studentlitteratur.

Annonser