Bokhylla.no skal gjøre all norsk litteratur (nokså) tilgjengelig for deg og meg. Vi tok turen til Mo i Rana for å finne ut hvordan det store digitaliseringsarbeidet foregår.

— Vi har valgt å ikke bruke tid på å velge ut hva vi skal digitalisere. Vi har like godt sagt at vi skal digitalisere alt, sier Svein Arne Solbakk, som er avdelingsdirektør for IKT og digitalisering ved Nasjonalbiblioteket.

Det er et ambisiøst mål, men ved hjelp av et storstilt, og i høy grad automatisert, digitaliseringsprosjekt ser det ut til at Nasjonalbiblioteket klarer oppgaven. Der man tidligere måtte møte opp på biblioteket, kanskje stå på venteliste eller ha tålmodighet til det man ville ha ble sendt fra et annet bibliotek, kan du nå gå til bokhylla.no og «låne» nesten akkurat hva du vil av norsk litteratur.

Men hvordan er det mulig?

NRKbeta ble med på omvisning i Nasjonalbiblotekets lokaler, for å se hvordan digitaliseringsprosessen av både bøker og annet materiale Nasjonalbiblioteket besitter foregår.

Begynner med bøkene

Siden mesteparten av innholdet på bokhylla.no er bøker, begynner vi i bokavdelingen. Bøkene som skal digitaliseres hentes ut fra arkivet, som er et helautomatisk hyllesystem som vanligvis brukes i store varehus. I hyllene står det metallkasser med plass til rundt 15 bøker. Kassene er merket med en strekkode, og i hver kasse ligger bøkene i en bestemt kartotekmappe som også er merket med en strekkode. Når hver bok også har sin unike ID, er det lett for roboten å hente frem den bestemte kassen hvor den bestemte boken ligger.

En liten film som viser hvordan hylleroboten ser ut:



Nasjonalbiblioteket skal ha minst tre eksemplarer av hver bok på lager — ideelt sett.

— I de tilfellene hvor vi har mer enn tre eksemplarer, skjærer vi ryggen av bøkene, slik at vi til slutt får en stabel med enkeltark, som vi enkelt kan digitalisere, forteller Solbakk.

Den avskårne permen blir også digitalisert, og satt sammen med de scannede sidene når boken legges ut på bokhylla. Sidene i slike slaktede bøker scannes ved hjelp av en nokså standard tosidig scanner, som kan mates med en hel bok (eller: alle sidene i en bok) av gangen.

I tilfeller hvor Nasjonalbiblioteket ikke har mer enn tre eksemplarer av boken, kan ikke boken skjæres i stykker. Da må den digitaliseres slik den er, noe som kan være en langsom affære om man skal gjøre det manuelt.

— Heldigvis finnes det firmaer der ute som lager roboter for digitalisering av bøker og manuskripter. De er både skånsomme og effektive, og gjør også hele prosjektet mulig, sier Solbakk, mens han tar oss med inn til rommet hvor de spesielle bokscannerne, utviklet i Østerrike, befinner seg.

Her scannes eldre dokumenter, bøker som kun finnes i få eksemplarer eller bøker som er for skjøre for de tosidige scannerne. Nasjonalbiblioteket har per i dag to forskjellige typer scannere. I begge tilfeller ligger boken med ryggen nedover, og er omtrent halvveis åpen. Den ene typen scanner har en mekanisk «finger» som blar i bøkene. Sidene scannes ved at to speilreflekskameraer tar bilder av hver side:

Den andre typen scanner tar tak i hver side ved hjelp av undertrykk, og løfter dokumentsiden opp samtidig som siden scannes:

Etter at bøkene er scannet, på enten den ene eller andre måten, skjer mye automatisk; de nå digitale bøkene settes sammen, og innholdet i boken indekseres. Posisjonen for hver bokstav og hvert ord blir logget, og i tillegg blir bokens indeks-sider registrert. Dersom programmene som utfører denne oppgaven opplever feil eller problemer blir dette loggført.

Når indekseringen og sammensetningen er fullført, blir resultatet gjennomgått for endelig «godkjenning», før de digitale bøkene overføres til den digitale bokhylla. I tillegg påføres boken informasjon om forfatter, tittel, emne og diverse katalogiserigstagger.

De aller skjøreste dokumentene må digitaliseres for hånd, hvor dokumentet må håndteres av en person som forsiktig blar fra side til side og tar bilder ved hjelp av et fastmontert kamera.

Alt i alt digitaliserer Nasjonalbiblioteket 1000 bøker per uke.

— Nasjonalbiblioteket har ikke fått tilført noen nye midler for å gjennomføre dette digitaliseringsprosjektet. Det vi har gjort er å omdisponere midlene våre, for å satse digitalt, sier Solbakk.

Digitaliserer hele kulturarven

Det er ikke bare bøker som blir digitalisert hos Nasjonalbiblioteket. Fotografier, aviser, blader, lyd og film — alt Nasjonalbiblioteket tar vare på skal etter planen digitaliseres. Hver dag digitaliseres for eksempel en stor mengde ferske aviser, som Nasjonalbiblioteket får inn.

— Egentlig ønsker vi å få den digitale utgaven fra avisutgiverne, for eksempel den versjonen de sender til trykkeriet likevel, men det er ikke alle som gir oss det. Da må vi digitalisere en papirutgave selv, her hos oss, sier Solbakk.

Se video av en av Nasjonalbibliotekets avisscannere her:

Selv om mye kan gjøres ved hjelp av nåtidens teknologi, er det mange av de gamle formatene, for eksempel på musikkfronten, som ikke kan spilles av på annet enn originalt utstyr.

Han viser frem en snelle med syltynn ståltråd.

— Dette var en dansk oppfinnelse, og er i grunnen et slags magnetbånd. Jeg tror ikke produktet tok helt av, men vi har noen spoler i arkivet vårt som vi måtte digitalisere. Til slutt fikk vi tak i en original avspiller, så nå er innholdet reddet, forteller Solbakk.

Nasjonalbibliotekets lydavdeling er i det hele tatt en stor samling med dels underlige avspillingsmaskiner, som enten er kjøpt i fungerende stand eller satt sammen av deler man har klart å få tak i.

— Vi sitter mye på ebay, for å si det sånn – det er stort sett der vi får tak i gammelt avspillingsutstyr, sier Solbakk.

Film er også noe Nasjonalbiblioteket digitaliserer. Her finnes det, som på musikkfronten, mange forskjellige formater, og originalene kan være i svært forskjellig stand. På filmrommet fortelles det om gammel nitratfilm som spontant kan ta fyr, om film som krymper eller strekker seg, eller om gamle oppbevaringsbokser som ruster og ødelegger filmen.

Likevel renses og lappes filmene så godt det lar seg gjøre, før de kjøres gjennom en filmscanner som scanner filmene i 4k-oppløsning. Nasjonalbiliotekets scanner kan digitalisere film i sanntid (som ennå ikke er så vanlig i 4k-verden), og kan ta opp lyd samtidig. Etter scanning blir filmene behandlet digitalt for å fjerne fargestikk, riper og lignende.

Plass

Den store digitaliseringsjobben krever naturligvis lagringsplass. Foreløpig har Nasjonalbiblioteket digitalisert materiale nok til å fylle 10 petabyte — eller ti millioner gigabyte. Det genereres foreløpig omtrent 3-5000 gigabyte per dag.

Når filmdigitaliseringen for alvor kommer i gang, beregnes det at dette vil generere omtrent 1 gigabyte per sekund, som vil stille enda større krav til filhåndtering og lagringskapasitet.

— Vi lagrer data på et nokså standard serveroppsett inne i fjellhallen vår, sier Solbakk.

— I tillegg har vi to backuper på tape, eller magnetbånd. Èn tapemaskin står i fjellhallen, den andre i kjelleren i hovedbygget. Vi ønsker oss også en off-site backup, og jobber med å få det til, sier han.

I Nasjonalbibliotekets fjellhall finner vi også meter på meter med det analoge materialet — alt det som enten har blitt eller skal scannes.

Rettigheter og fremtiden

Når det gjelder bokhylla.no, tilgjengelighet og tilrettelegging forteller han at strikken nok er tøyet så langt det er mulig.

— Jeg deltok ikke i forhandlingene selv, men forstår på dem som var med at vi neppe hadde fått i stand en bedre avtale, rettighetsmessig, enn den vi har nå, sier Solbakk.

Han forteller likevel at det jobbes med Norges Blindeforbund for å få i stand en løsning som gjør bokhylla bedre å bruke for blinde og svaksynte, for eksempel.

— Grunnen til at vi kan digitalisere materialet i det omfanget vi gjør, er egentlig at Norge er et veldig lite land. Andre land, hvor samlingene er mye større, har nok neppe mulighet til å digitalisere absolutt alt, slik vi tenker, forteller Solbakk.

Digitaliseringsarbeidet er en stor jobb, og Solbakk forteller om et langsiktig perspektiv.

— Vi har nå holdt på med digitaliseringsarbeidet i seks år, og planlegger å holde på i 25 til. Det er ennå mye materiale som skal digitaliseres, sier Solbakk.