Nationalencyklopedins ordbok på cd-rom
3/1998

Nina Martola

Nationalencyklopedins ordbok på cd-rom

Elektroniska ordböcker blir allt vanligare. Fördelarna med dem är många: de erbjuder bland annat mångsidigare sökmöjligheter än det traditionella bokformatet och kan också låta användaren lyssna på uttalsangivelser. Lexikograf Nina Martola presenterar National-encyklopedins ordbok på cd-rom som utkom för drygt ett år sedan. Denna presentation är en starkt förkortad version av en recension som kommer att ingå i LexicoNordica 5, som utkommer i november 1998.

Nationalencyklopedins ordbok i tre band publicerades under åren 1995-1996. (recenserad i Språkbruk 1/96). Våren 1997, drygt ett år efter det sista bandet, kom cd-rom-versionen ut. De båda verken är i det stora hela samma ordbok, även om smärre förändringar har gjorts i den elektroniska versionen i och med att materialet bearbetas kontinuerligt.

CDNEO är enkel till sin uppläggning. I princip finns det bara två fönster, ett ingångsfönster, där man slår upp alfabetiskt bland uppslagsorden, och ett sökfönster för avancerad sökning. Ingångsfönstret har ett inmatningsfält där man skriver in det uppslagsord man vill söka. Nedanför det fältet finns artikellistan som programmet bläddrar i vartefter man skriver in bokstäver i inmatningsfältet. Man kan också själv bläddra i listan. När man fått fram rätt ord i listan dubbelklickar man på det eller klickar på Visa-symbolen så visas hela ordboksartikeln i artikelrutan till höger. Själva artiklarna ser ut precis som i den tryckta versionen, utom att fonten är en annan och att marginalcitaten återfinns underst i artikeln. Man kan välja mellan tre olika fontstorlekar och ändra spaltbredden.

En stor fördel med en ordbok i elektronisk form är naturligtvis att man kan ha den öppen parallellt med sitt ordbehandlingsprogram i datorn när man sitter och skriver och lätt och behändigt slå upp ord vid behov. Man kan också kopiera text ur artiklarna och klistra in den i sitt eget dokument.

En annan stor fördel med den elektroniska versionen är att man lätt och behändigt kan hoppa mellan artiklarna vid hänvisningar. Länkarna känns igen på att de är understrukna och står i fetstil. Vill man återgå till den artikel man hoppade ifrån kommer man enkelt tillbaka med hjälp av Bläddra-funktionen. Överlag fungerar länkarna, men vid vissa typer av hänvisningar, särskilt vid artiklar som inte innehåller annan information än en hänvisning till en annan artikel, är det väldigt många länkar som inte leder någonstans.

För de uppslagsord som har uttalsangivelse  – parenteserna med uttalsangivelser finns alltså kvar i artiklarna – finns det en ljudsymbol (en bild av en megafon och texten Lyssna) i artikelrubriken, och om man enkelklickar på symbolen får man höra ordet uttalat. Om uttalsalternativen är fler läses naturligtvis alla varianter upp. Auditiva uttalsangivelser är förträffligt och något som borde vara en självklarhet i dagens elektroniska ordböcker. I framtida upplagor av CDNEO hoppas jag att samtliga uppslagsord kommer att finnas inlästa. Nackdelen med ett urval är ju alltid att det finns användare som har problem med andra ord än de som redaktionen har bedömt som svåra, och när utrymmet inte på samma vis som i en tryckt ordbok är en avgörande faktor är det ingen orsak att vara restriktiv härvidlag.

Sökfunktioner

Den avgörande skillnaden mellan en tryckt ordbok och den elektroniska versionen av exakt samma material är de vida bättre åtkomstmöjligheterna, och det är utifrån de sökfunktioner som finns utöver den alfabetiska som man bedömer vad en sådan ordbok verkligen går för.

En självklar funktion i en elektronisk ordbok är möjligheten till fritextsökningar över hela ordbokstexten. För att göra en fritextsökning i CDNEO klickar man på Söka-symbolen och får då fram ett nytt fönster med ett inmatningsfält, knappar för fem olika sökkategorier (normalvärdet ord samt filtren ordklass, ämne, språk och årtal), en ruta för sökvillkoren och en för träfflistan. När man väljer sökning med något av filtren kommer det fram en ruta nedanför inmatningsfältet med listor på vad som är valbart.

Avancerade sökningar

En avancerad sökning i sin enklaste form går till så att man skriver in sökordet i inmatningsfältet och klickar på Söka, varvid sökordet flyttas till söklistan och träfflistan dyker upp när sökningen är klar. Skriver man in ett nytt sökord kombineras detta automatiskt med det föregående med den booleska operatorn ELLER om man inte har kommit ihåg att ta bort det. Det kan man dock göra i efterskott varvid träfflistan automatiskt korrigeras. När man använder programmet mycket vänjer man sig också så att man kommer ihåg att rensa sökvillkorsrutan. Vill man byta operator gör man det i efterskott. Programmet ger automatiskt sist använda operator tills man byter. När man använder sig av booleska operatorer fyller man alltså på med ett sökord + operator åt gången och programmet söker för varje sökvillkor som matas in i sökvillkorsrutan.

Det är irriterande att inmatningsfältet töms för varje gång man klickar Söka. Ofta har man ju behov av att modifiera ett sökord och göra en ny sökning och då vore det enklare om man slapp skriva om ordet (eller komma ihåg att kopiera det i förväg för att kunna klistra in det). Åtminstone borde det gå att klicka tillbaka ord från sökvillkorsrutan till inmatningsfältet.

När man klickar på ett ord i träfflistan går programmet till ett fönster som i princip är ingångsfönstret men med ett fält ovanför inmatningsfältet där sökvillkoren finns. Träfflistan har tagit uppslagsordslistans plats och längst ner finns en uppgift om hur många artiklar som ingår i listan. Nu kan man söka alfabetiskt i denna subkorpus tills man klickar på symbolen Alla, för att få med samtliga uppslagsord i sökningen, eller på symbolen Söka för att göra en ny fritextsökning.

Vid fritextsökning finns det möjligheter att använda maskeringstecken. En asterisk står för vilket antal tecken som helst (0n) först eller sist i en söksträng medan ett frågetecken står för ett (1) tecken. Man kan använda många frågetecken i en söksträng placerade var som helst i strängen. Som en liten jämförelse kan nämnas att en fritext-sökning på förolyckad ger en träff, förolyckad* ger fyra och förolycka* ger sju, medan en sökning på förolycka? ger fem träffar och ????lyckad ger tio. Söksträngar med både asterisk och frågetecken tycks programmet inte klara av. Däremot klarar det två asterisker; *olycka* ger 175 träffar.

Brister i sökfunktionerna

En stor brist är att man inte kan trunkera vid sökning på uppslagsord eller alternativt begränsa fritextsökningen till att gälla bara uppslagsord. Det innebär att man får med väldigt mycket brus om man söker uppslagsord av en viss typ, exempelvis sammansättningar med samma huvudled eller avledningar av samma slag.

Vill man t.ex. veta vilka sammansättningar på ‑björk det finns som uppslagsord kan man söka strängen *björk. Det ger 27 träffar och början av listan ser ut så här:

björk

björke

björkgräns

björklag

björkna

bladminerare

blöda 2

[...]

I träfflistan ingår de sju sammansatta uppslagsorden dvärgbjörk, fjällbjörk, glasbjörk, hängbjörk, masurbjörk, ornäsbjörk och vårtbjörk. Hade man kunnat begränsa sökningen till uppslagsorden skulle man direkt ha fått en träfflista med dessa ord. Den möjligheten finns i CDNEO:s finska motsvarighet, CD-Perussanakirja (recenserad i Språkbruk 2/1997).

Vill man veta vilka sammansättningar på  ‑björk det överhuvudtaget förekommer i materialet räcker det inte med att söka *björk, eftersom programmet inte erbjuder möjlighet till lemmatiserad sökning, utan man måste beakta samtliga åtta former av ordet, och alltså göra en sökning på *björk ELLER *björken ELLER *björkar ELLER *björkarna ELLER *björks ELLER *björkens ELLER *björkars ELLER *björkarnas. Det ger 41 träffar, och här konfronteras man med en av CDNEO:s verkligt stora brister. Att gå in i en sådan mängd artiklar och ögna igenom dem för att hitta björk-sammansättningarna är tämligen arbetsamt och tidskrävande, i all synnerhet som träffarna inte ens är markerade i artiklarna. Värre blir det dessutom om man söker en vanligare slutled. En sökning på exempelvis *byggnad (endast grundformen) ger hela 434 träffar.

Här ligger CDNEO långt efter CD-Perussanakirja, som dels erbjuder möjlighet till lemmatiserad sökning, dels kan visa resultatet som ett KWIC-index (konkordansrader med förekomsterna understrukna). Om man söker strängen *koivu i hela texten med beaktande av alla former får man 94 träffar och det är bara att ögna igenom konkordansraderna utan att behöva gå in i artiklarna.

Sökning på fraser

Fraser söker man med hjälp av booleska operatorer. För det mesta fungerar det bra, men om det är vanliga ord som ingår i den fras man är ute efter får man väldigt mycket brus, eftersom närheten mellan sökorden inte kan justeras utan det alltid är hela artikeln som är storheten. En sökning på t.ex. lägga OCH upp ger 52 träffar och skriva OCH av ger 161. Det säger sig självt att man inte börjar kontrollera alla dem, utan man nöjer sig med den information som finns i artiklarna lägga upp och skriva av. Det går tyvärr inte att ha flerordsfraser som sökargument. Det hade också varit en fördel om idiom hade funnits med som ett filter tillsammans med ordklass, ämne, språk och årtal, för man har ju relativt ofta behov av att kontrollera stående fraser.

En typ av sökning som det inte går att göra i en tryckt ordbok är att snabbt och enkelt leta fram ord som hör till samma semantiska grupp. För att ta reda på vilka gröna ädelstenar det finns kan man söka på ädelsten OCH grön och det ger fyra adekvata träffar. För att kontrollera vilka sjukdomar hästar kan få kan man söka på häst* med filtren veterinärväsen och substantiv, vilket ger en träfflista på nio adekvata artiklar. Ju stringentare definitionsspråket är utformat i en ordbok, desto säkrare är det att man får med samtliga relevanta förekomster av det man är ute efter, och härvidlag finns det fortfarande rum för förbättringar i CDNEO, trots att en hel del möda veterligt har lagts ned på det redan nu. Möjlighet till lemmatiserad sökning skulle ytterligare förbättra sökresultaten.

Med hjälp av ett elektroniskt ordboksprogram har man faktiskt också vissa möjligheter att leta sig fram till ett uppslagsord man inte känner till med hjälp av de fakta man besitter, något som ju är en omöjlighet i en tryckt ordbok. Om man t.ex. undrar vad de där klämmorna kallas som kirurger använder för att klämma ihop blodkärl med vid operationer kan man söka på klämm* med filtren medicin och substantiv. Det ger två träffar, artiklarna peang och pormask, varav det första ju är svaret. För att en sökning av det här slaget skall lyckas gäller det att komma på de adekvata sök-argumenten (vilket inte alltid är lika lätt som i detta fall) och pröva olika möjligheter. Man kan ju dock aldrig vara säker på om en utebliven träff beror på att man inte kommit på de rätta sökargumenten eller på att ordet man är ute efter helt enkelt inte finns med som uppslagsord.

Tekniska disfunktioner

Programmet är inte helt Windowsanpassat, vilket gör att det till vissa delar verkar litet klumpigt för den som är van med Windows- och Macintoshgrepp. Skivan är en hybridskiva och passar alltså också för Macintosh, men jag har tyvärr inte haft tillfälle att testa hur väl den fungerar i den miljön.

Det går inte att klicka mellan de båda fönstren, utan sökfönstret måste stängas varje gång man vill gå till ingångsfönstret. Man kan inte heller förminska fönstren så att man kunde klicka sig från ordboken till ordbehandlingsprogrammet med hjälp av fönsterklickning i stället för att gå via operativsystemets balk. Eftersom inskrivningen i inmatningsfältet går långsammare i och med att programmet söker vartefter man skriver skulle jag gärna ha kopplat bort den funktionen.

Bläddringen/rullningen i artikel- och träfflistan fungerar inte enligt Windowsprinciper. Vid klickning på pil upp eller ner åker listan i väg ett obestämt antal rader (borde flytta sig en rad) och vid klickning längst ner eller längst upp på balken hoppar listan också ett varierande antal rader åt gången (borde flytta sig exakt en hel ruta åt gången). Efter några klickningar börjar listan i regel åka i väg med en sådan fart att man inte hinner läsa den och det är svårt att få stopp på den. Bästa sättet att hantera listan är att ta tag i hissen och dra den långsamt neråt och uppåt. Då kan man, om än med en viss möda, få listan att röra sig i sådan takt att man hinner läsa den och kan ta ställning till orden vartefter.

Jag lyckades inte heller få markeringsfunktionen att fungera ordentligt. Det var svårt att få programmet att markera exakt det avsnitt ur en artikel som jag ville kopiera. Ibland togs markeringsförsöken över huvud taget inte emot och ibland markerade programmet ett helt annat av-snitt än det jag tänkt mig. I all synnerhet var det svårt att få det att markera artikeln ända från början. Snabbkommandot ctrl – A (Markera allt) fungerade inte alls och det gick inte heller att dubbelklicka inne i ett ord för att markera bara det ordet. Att klistra in ord i inmatningsfältet gick bara om ordet var kopierat från CDNEO, inte om det hade kopierats i ordbehandlingsprogrammet.

Nu vet jag inte i vilken mån de här problemen beror på barnsjukdomar hos programmet och i vilken mån det beror på omgivningen i den PC jag använde, men å andra sidan fungerar t.ex. CD-Perussanakirja klanderfritt i samma miljö.

Sammanfattande omdöme

CDNEO är en lättillgänglig produkt, som ovana användare av elektroniska ordböcker snabbt torde bli du med. Layouten är överskådlig och klar och också visuellt tilltalande. Handboken är dessutom föredömligt lättläst och tydlig i den mån den behövs. På pluskontot kan också läggas inlästa uttalsangivelser och framför allt möjligheterna att använda sig av olika filter i sökningarna. En stor fördel är att skivan kan användas både i PC och Macintosh.

Strävan att göra en elektronisk ordbok enkel är i och för sig angelägen, men går man för långt i denna strävan finns det en risk för att en mycket viktig (och säkert allt större) målgrupp, de som är vana vid elektroniska sökverktyg av olika slag, känner sig litet snopna. Det hade kanske varit bra att lägga in en söknivå till för den som är intresserad av mer avancerade sökningar än de som nu står till buds. Det jag saknar allra mest är möjlighet till lemmatiserad sökning, möjlighet att avgränsa sökningarna till olika element i artiklarna och en KWIC-indexfunktion på träffarna.

På något vis förefaller det nästan som om programmet inte vore utarbetat med tanke på språkliga sökningar utan att det snarare är tänkt att kunna fungera för olika typer av uppslagsverk. Vissa inexaktheter i funktionen och överraskande många länkar som inte fungerar bidrar ytterligare till intrycket att produkten inte är riktigt färdig.

Nina Martola