En artikeldatabase bliver til

<>

af Henrik Clement, udgivet i avisen Samtid 18. september 1996

det er i begyndelsen af august. Luften står stille, og termometeret viser lige omkring de 30 grader. Badevandet har endelig nået en temperatur, som gør stranden til det eneste fornuftige sted at opholde sig.

Men et sted i Vejle på 1.sal bag nedrullede gardiner finder vi én, som ikke er taget til stranden. det er lærer Torsten Skovmand, der sidder klistret til sin computer mindst 12 timer om dagen.

Hvad er det, som får denne mand til frivilligt at afskrive sin sommerferie for at give sig i computerens vold. Spiller han Doom? Er han Internet-zombie? Eller er han bare flov over at vise sine blege ben?

12 millioner bogstaver

Nej - det vi overværer er, at SamtidBasen bliver til. Der er hektisk i lokalet. telefonerne ringer, faxen spytter metervis af papir ud, og da en af computerne driller for gud ved hvilken gang, lyder der en højlydt stønnen.

En scanner står og summer.

Torsten arbejder foran en computer

"Samtids artikler er scannet ind i basen. Det tog to måneder. Og derefter kom så arbejdet med at få selve databasen til at fungere med de forskellige søge-muligheder, indekser, referater osv.", fortæller Torsten Skovmand, der udover at undervise har arbejdet som edb-udvikler i mange år.

"I den første udgave, som dækker de sidste seks år års udgivelser af Samtid og gymnasieavisen Revyen, er der over 2000 artikler.

Ialt er der ca. 12 millioner bogstaver - svarende til ca 5000 A4-sider fyldt med tekst", fortæller Torsten Skovmand.

Pionerarbejde

SamtidBasen er den første her i landet af sin art. Der er altså en slags pionérarbejde, Torsten Skovmand har stået i spidsen for, og han og hans medarbejdere er stødt på hundredvis af små og større problemer undervejs.

"For eksempel viste det sig, at Scanneren laver fejl. Den opfatter teksten som billeder, og i nogle tilfælde har den 'misforstået' ord under indlæsningen.

Det betyder at der er opstået stavefejl, som desværre er kommet med på demo-cd-rom'en. Men det problem vil selvfølgelig være løst, når den rigtige version af Samtidbasen kommer ud i novemner", siger Torsten Skovmand.

EU i stedet for FBI

Et andet problem er, at der er opstået søgeordsfejl. Visse artikler har fået de samme stikord og referater. det hænger sammen med, at nogle af artiklerne optræder i temaer. Men desværre betyder det, at nogle af artiklerne ikke har sammenhæng med stikordene.

Hvis jeg for eksempel vælger FBI som søgeemne, får jeg en række artikler frem, som har noget med EU at gøre og ikke med FBI.

Det skyldes, at FBI er nævnt i en artikel om internationalt politisamarbejde. Men stikordet FBI smuttede videre med i de andre EU-artikler, og derfor dukker de nu også frem på skærmen, når man er ude efter FBI", siger Torsten Skovmand.

Hær af korrekturlæsere

"Vi er selvfølgelig kede af, at demo-cd'en har disse skavanker, man vi har valgt at sende den ud alligevel, fordi vi mener, den trods alt giver en rigtig god fornemmelse af, hvordan samtidBasen og SamtidNettet fungerer", siger Torsten Skovmand, der nu har hyret en mindre hær af korrekturlæsere, der skal endevende alle artikler og søgeord, inden den "rigtige" cd-rom, der også indeholder en kort- og billdbase, bilver sat i produktion.