Varför travintresse ska ut och fotbollsintresse in
4/2010

Sture Berg, Sven-Göran Malmgren

Varför travintresse ska ut och fotbollsintresse in Urvalsprinciper för nästa SAOL

Vilka ord får komma med i Svenska Akademiens ordlista och varför? En ny upplaga av ordboken är under arbete, och redaktörerna Sture Berg och Sven Göran Malmgren berättar här om principerna för urvalet.

Den trettonde och senaste upplagan av Svenska Akademiens ordlista (SAOL 13) publicerades 2006. De närmast föregående upplagorna kom ut 1998, 1986 respektive 1973. Det har sålunda på senare tid utbildats en praxis att en ny upplaga av SAOL ska komma ut en gång per decennium, och gärna nära mitten av decenniet. Följdriktigt planeras utgivningen av nästa upplaga, SAOL 14, till 2015.

För dem som lärt sig känna igen SAOL och skilja den från Svenska Akademiens ordbok    (SAOB) är kanske det mest iögonfallande just dess karaktär av ordlista med väldigt många uppslagsord (lemman). En stor majoritet av uppslags­orden är sammansättningar som visserligen i många fall kan anses lexikaliserade (t.ex. järnväg) men som i ännu många fler fall är helt transparenta och snarast får ses som exemplifieringar av svenskans rika sammansättningsmorfologi (t.ex. fotoaffär, bildörr).

Man skulle kunna tro att det alltid har varit så, men de första upplagorna av SAOL präglades tvärtom av en starkt begränsad lemmauppsättning (ca 40 000 uppslagsord). Först med sjunde upplagan (1900) började lemmaantalet stiga kraftigt. Den trenden fortsatte i åttonde (1923) och särskilt nionde upplagan (1950) vars lemmaantal innebar ett all-time-high med noteringen 155 000. Sedan dess har en försiktig reduktion skett och i de båda senaste upplagorna har antalet lemman stabiliserats kring 120–125 000. Det antalet får också sägas vara ett riktmärke för SAOL 14.

Viktigare än det exakta antalet uppslagsord är dock att det urval som måste göras känns någorlunda optimalt. Tidigare SAOL-redaktörer – senast Martin Gellerstam – har löst det problemet på ett bra sätt, och vi följer i hög grad deras linje. Viktigt är emellertid att förutsättningarna för SAOL-arbetet har förändrats, genom att vi på senaste tiden fått tillgång till betydligt bättre hjälpmedel för att navigera i de språkliga materialen än vad även redaktionen för SAOL 13 hade tillgång till. Vi återkommer strax till dessa hjälpmedel. (För en något utförligare beskrivning av hjälpmedlen, se Berg & Holmer 2010.)

SAOL som produktions- och receptionsordbok

SAOL får i första hand sägas vara en produktionsordbok. Man håller på att skriva en text och har problem med stavningen eller böjningen av ett ord, eller kanske med fogen i en sammansättning – då går man i första hand till SAOL. I andra fall kanske man ska hålla tal och behöver kontrollera uttalet av ett ord.

Det är emellertid välkänt att SAOL också används som receptionsordbok. Användare som vill veta vad främst främmande ord betyder slår gärna upp i SAOL och får ofta tillräcklig hjälp, trots att det inte är SAOL:s uppgift att ge mer subtila betydelseanalyser.

I det följande har vi i första hand SAOL:s primära funktion som produktionsordbok i tankarna.

Några urvalsprinciper vid olika grupper av ord i SAOL 14

a) Namn
SAOL tar i princip inte upp namn, men det finns några undantag. Viktigast är att namnen på Sveriges landskap traditionellt är med, där­emot inte namn på länder, bara beteckningar på invånare. Det kan nog vara värt att överväga att också ta med landsnamn. De har ett uppen­bart informationsvärde (uttal, stavning) och man skulle undvika att ordlistan pekade till informationskällor utanför sig själv enligt mönstret tysk ’invånare i Tyskland’. Det är fråga om ca 200 lemman. När landsbeteckningen och invånarbeteckningen ligger långt ifrån varandra i alfabetet (Elfenbenskusten – ivorian), kunde det finnas en hänvisning. Användaren skulle då få svar på frågan ”Vad kallas invånarna i Elfenbenskusten”, något som inte är fallet nu (om han/hon inte vet det från början). Ordlistans produktiva kraft – dess värde som produktionshjälpmedel – skulle med andra ord öka (jfr Martola 2007:257).

b) Ett par viktiga typer av avledningar
Det har funnits en tendens i senare upplagor av SAOL att i mycket stor utsträckning ta upp verbalsubstantiv på -ing/-ning och adjektivavledningar med suffixet -het, i stort sett så snart de är tänkbara. I SAOL 13 hittar man sålunda mycket ovanliga och intuitivt lite udda avledningar som accelerering, ackompanjering, irritering, letning och absurdhet (men inte t.ex. letande, slopande och sparande). Frågan är om inte ordlistan skulle få större produktiv kraft om den bara tog upp de normalare avledningarna acceleration, ackompanjemang, irritation och absurditet, och dessutom angav letande, slopande, sparande m.fl. ande-avledningar som saknas nu. Det är trots allt en ganska naturlig situation vid textproduktion att man vill ha reda på det bästa eller vanligaste abstrakta substantivet till ett givet verb eller adjektiv. Som det är nu framgår det inte av SAOL att man normalt använder acceleration och inte accelerering, ackompanjemang och inte ackompanjering, absurditet och inte absurdhet etc.

SAOL 14 kommer därför att vara något restriktivare med ing-/ning- och het-avledningar än SAOL 13, och något generösare med ande-avledningar. Alla någorlunda vanliga ning- och het-avledningar, som simning, skjutning, skönhet och ensamhet, kommer självfallet att vara kvar. Men det ska helst framgå om det är normalare att använda ande-avledningen än ing/ning-avledningen, och om ande-avledningen är den enda brukliga bör den vara med (som slopande och sparande). Och vidare bör ordlistan spegla det faktum att förekomsten av avledningar med klassiska suffix som ‑tion eller ‑mang ofta gör ing/ning- och ande-avledningarna mer eller mindre obrukliga.

c) Partikelverb
I sin ingående granskning av SAOL 13 (Martola 2007) efterlyser Nina Martola en tydligare behandling av partikelverben, framför allt de som är löst sammansatta (säga till, hålla med etc.). Det är inte tillfredsställande, menar hon, att man hittar partikelverb som oftast är löst sammansatta enbart genom en hänvisning (egentligen bara ett s.k. transponaturtecken) under den fast sammansatta varianten. Nästan alla skriver eller säger torka av och nästan ingen använder varianten avtorka, men det är bara avtorka som är upptaget som lemma i SAOL 13.

Martola har en klar poäng när hon påpekar att SAOL på det här sättet missar att beskriva en av de viktigaste lexikala förändringarna i svenskan under 1900-talet. Så länge fast sammansatta varianter som avtorka var levande, var det rimligt att de hade en framträdande plats i ordlistan. Men den tiden är numera förbi, bl.a. genom skriftspråkets närmande till talspråket. Det bör speglas i ordlistan.

I SAOL 14 kommer många löst sammansatta partikelverb att för första gången få lemmastatus, eller rättare sublemmastatus. Under lemmat torka kommer sublemmat torka av att anges, dock med något mindre fetstil och med indrag. Större verb som hålla och dra kommer på det sättet följas av en ganska lång lista med ”indragna” partikelverb. Den alfabetiska ordningen kommer inte att brytas. När både den fast och den löst sammansatta varianten är brukliga och har samma betydelse, ska det finnas hänvisningar åt båda hållen.  

Tabell 1.
De vanligaste sammansättningarna med intresse i Språkbanken+ samt deras frekvens och förekomst/icke-förekomst (+/-) i SAOL 13.
SB410_s6.jpg

d) Sammansättningar

Det är förstås i första hand sammansättningarna som gör att lemmaantalet i SAOL ligger en bra bit över 100 000. Det är också här vi möter det svåraste urvalsproblemet. Ett studium av vilken större ordgrupp som helst i SAOL 13 ger oundvikligen upphov till frågor av typen ”varför är forskariver med men inte forskarskola, varför fluortandkräm men inte fluortablett, varför flumpedagogik men inte flumskola, varför intressebolag men inte intresseföretag?” En viktig faktor i det sammanhanget är givetvis sammansättningarnas frekvens i texter. Med avsevärd förenkling kan man säga att ju oftare en sammansättning används, desto större anledning är det att ta med den i SAOL.

Tack vare nya datalogiska verktyg, utarbetade av Christian Sjögreen, kan vi numera snabbt få fram listor över frekvenserna för de olika sammansättningarna med forskar-, fluor-, flum-, intresse- och alla andra sammansättningsgrupper. Det fina är att frekvenserna gäller lemman, inte bara enskilda former – värdet för t.ex. intressebolag i tabellen är summan av frekvenserna för intressebolag, intressebolaget och alla andra böjningsformer. Frekvenserna är oftast pålitliga, även om de som alltid kan störas av homografi (något som dock är ett litet problem vid sammansättningar). Materialet som frekvenserna beräknas på är en förbättrad version av Språkbanken (”Språkbanken+”, inte allmänt tillgänglig till skillnad från den vanliga Språkbanken som man ju når på adressen http://spraakbanken.gu.se/). Den förbättrade versionen av Språkbanken innehåller över 260 miljoner ord. Den uppdateras hela tiden; f.n. är den färskaste delkorpusen från 2009.

Låt oss se på en tabell som visar de vanligaste sammansättningarna som börjar med intresse, och vilka av dem som är med i SAOL 13.

Vi ser att nästan alla de frekventaste sammansätt­ningarna med intresse som förled är med i SAOL 13. Det är precis vad man önskar sig, och vad vi kunnat finna gäller detsamma för nästan alla liknande grupper av sammansättningar. För att ytterligare verifiera det kan vi också se på de frekventaste sammansättningarna med ett konkret ord, stjärna:

Tabell 2.
De vanligaste sammansättningarna med stjärna i Språkbanken+ samt deras frekvens och förekomst/icke-förekomst (+/-) i SAOL 13.
SB410_s7.jpg

Även här känns nästan alla de medtagna orden tämligen givna; flera av dem har dessutom en överförd betydelse och är alltså lexikaliserade. Något mindre självklara än de övriga är kanske stjärnkock och stjärnanis. Av de utelämnade orden är Stjärnblom ett namn, medan stjärnlag men knappast stjärnhäst möjligen kunde övervägas.

När det gäller så pass högfrekventa sammansättningar blir det därför inte några stora förändringar i SAOL 14. Vi kommer emellertid att gå igenom tusentals liknande frekvenslistor och bl.a. överväga om det finns skäl att i vissa fall ta in mycket vanliga sammansättningar som inte kom med i SAOL 13 (t.ex. intresseparti och stjärnlag).

Längre ner i frekvenslistorna blir bilden brokigare, och det är där de största urvalsproblemen uppkommer. Här följer en lista med sammansättningar med intresse med frekvens mellan 14 och 6:

Tabell 3.
Ett urval lågfrekventa sammansättningar med intresse i Språkbanken+ samt deras frekvens och förekomst/icke-förekomst (+/-) i SAOL 13.
SB410_s8.jpg

SAOL 13 tar alltså upp två sammansättningar från tabellen. Ordet intressekollision kan väl sägas vara lexikaliserat, och ordet intressepolitisk kan ha tagits med av systematiska skäl. Det tycks i varje fall vanligen vara så, att när en sammansättning med ‑politik tas upp, så följer ‑politisk med. (För resonemang kring sådana frågor i samband med SAOL 10, se Mattsson 1974:79f.)

Av de utelämnade orden kan möjligen intresseförfrågan förtjäna att övervägas.

Det bör understrykas att ensiffriga frekvens­er i en 260-miljonerordskorpus betyder att motsvarande ord är ganska ovanliga. Men det finns många ord i SAOL 13 som har frekvensen 2, 1 och t.o.m. 0 i Språkbanken+. En genomgång av sådana extremt lågfrekventa ord gjordes i arbetet på SAOL 13 och resulterade i många uteslutningar. Det finns skäl att göra en liknande genomgång med förbättrade hjälpmedel inför utgivningen av SAOL 14, kanske av ord med frekvens mindre än 5 (korpusen är ju större nu än den var i början av 2000-talet). Det betyder inte att alla eller ens de flesta av dessa ord ska utmönstras. Det kan t.ex. vara en avgörande skillnad om ett ovanligt ord förekommer i bara en delkorpus eller om det har bättre spridning (jfr Gellerstam 1996). Det kan också finnas systematiska skäl för att ta med ett ovanligt ord (jfr ovan), och ibland kan det vara motiverat att ta med en ovanlig sammansättning för att ge upplysning om sammansättningsfog.

Vi har hittills enbart sett på förledssammansättningar utifrån de enkla orden intresse och stjärna. Också frekvenstabeller över efterledssammansättningar är av stort värde för vårt arbete. Låt oss – med hjälp av samma dataprogram som tidigare – se på de vanligaste sammansättningarna med intresse som efterled:

Tabell 4.
De vanligaste sammansättningarna med intresse som efterled i Språkbanken + samt deras frekvens och förekomst/icke-förekomst (+/-) i SAOL 13.
SB410_s9.jpg

Med hjälp av sådana tabeller kan vi göra systematiska bedömningar av annat slag än vad som är möjligt utifrån tabeller över förledssammansättningar. Vi kan exempelvis jämföra ord där efterleden har samma relation till förleden, i det här fallet t.ex. musikintresse, fotbollsintresse och idrottsintresse. Är fotbollsintresse mindre förtjänt av att tas in i ordlistan än idrottsintresse och musikintresse? Det är inte lätt att ge ett omedelbart svar på den frågan, men när man längre ner i frekvenslistan hittar SAOL-ord som jazzintresse (med frekvensen 23) och travintresse (med frekvensen 16), så får man nog säga att fotbollsintresse stärker sin kandidatur. Om vi bara hade sett på förledstabellerna, så hade vi troligen inte kommit på att fotbollsintresse kanske är en bättre kandidat än trav­intresse.

Efter fullbordad genomgång av frekvenstabeller av den första typen (med förledssammansättningar) kommer vi därför att studera tabeller av den andra typen (med efterledssammansättningar). Vi tror att vi då kan eliminera en och annan systematisk lucka och ersätta ett antal mindre frekventa ord med vanligare ord av jämförbart slag.

Slutord

Om man ser på lemmauppsättningarna i SAOL 12 och SAOL 13, så finner man att de överlappar till något mindre än 90 procent. Drygt 5 000 ord från SAOL 12 har utmönstrats i SAOL 13 och drygt 10 000 ord har tillkommit. Det är ingen djärv gissning om man förmodar att överlappningen mellan SAOL 13 och SAOL 14 kommer att vara jämförbar, eller kring 90 procent.
Vi har pekat på en del troliga förändringar som gäller namn, avledningar, partikelverb och sammansättningar. Dessa förändringar medför bara till en begränsad del att rena nyord tillförs ordlistan. Självklart är det en av våra viktigaste uppgifter att ta in ord som inte var etablerade i svenskan 2006 i SAOL 14. Här följer vi precis samma principer som de närmast föregående upplagorna, vilket bl.a. innebär en ganska liberal inställning till (frekventa) lånord (jfr SAOL 13, s. xiv–xviii, där också metoder för att hitta nyord diskuteras). Även om vi idag, 2010, inte kan veta vilka nya ord som kommer att visa sig ha varit dagsländor, är det ett gott tips att bl.a. följande nyord kommer med i SAOL 14: alliansregering, barista, bloggosfär, burkini, ensamkommande, etanolbil, jobbskatteavdrag, klimatsmart, kreddig, livspussel, prio, regnbågsbarn, rotavdrag, skimning, twittra och wiki.

Litteratur
Berg, Sture & Louise Holmer 2010. Från ankomst till åtkomst. Några lexikaliska iakttagelser i arbetet på SAOL och SO. I: Bo65. Festskrift till Bo Ralph. Sammanställd av Kristinn Jóhannesson, Ida Larsson, Erik

Magnusson Petzell, Sven-Göran Malmgren, Lena Rogström & Emma Sköldberg. Göteborg, s. 311–320.

Gellerstam, Martin 1996. Rätt och fel i korpusen. LexicoNordica 3, s. 35–47.

Martola, Nina 2007. Den trettonde upplagan av SAOL. LexicoNordica 14, s. 245–266.

Mattsson, Gösta 1974. Ordlistans tionde upplaga – riktlinjer och kommentarer.  I: Johannisson, Ture &

Gösta Mattsson, Svenska Akademiens ordlista genom 100 år. Stockholm, s. 55–116.

SAOL 10 = Svenska Akademiens ordlista över svenska språket. 10. upplagan. Stockholm 1973.
SAOL 13 = Svenska Akademiens ordlista över svenska språket. 13. upplagan. Stockholm 2006.

Sture Berg

Skribenten är forskare vid Lexikaliska institutet vid Institutionen för svenska språket samt biträdande redaktör på Svenska Akademiens ordlista.

Sven-Göran Malmgren
Skribenten är professor vid Lexikaliska institutet vid Institutionen för svenska språket vid Göteborgs universitet och huvudredaktör för Svenska Akademiens ordlista.

I denna tidskrift: 4/2010