the ISAN-explaination the ISAN-list the ISAN-language-list the ISAN-startpage



Op weg naar een standaardnummer: Het ISAN


Dit artikel is bestemd voor eenieder die zich bezighoudt met het verstrekken van informatie uit periodieken: bibliothecaris, mediathecaris, informatiebemiddelaar, informatiemanager, informatiemakelaar, kennismanager, kennismakelaar etc.

Probleemstelling:
- Grote hoeveelheden artikelen uit periodieken (kranten, tijdschriften etc.)
- Hoe deze artikelen terug te vinden?
- Snelheid invoer (automatisering en handwerk) (formele en inhoudelijke gegevens)
- Standarisering invoer

Oplossing:
- gebruikmaken van bestanden om standaard invoer te bevorderen
- databases voor databases

Inleiding

Met verwondering heb ik de laatste jaren de ontwikkeling op het automatiseringsgebied binnen de bibliotheekwereld gevolgd. Het blijft mij bezighouden, waarom er zoveel tijd, geld en moeite wordt ingestoken, terwijl echt resultaat enigszins uitblijft. Oké, er zijn enkele grote spelers in het veld die grote databanken met full-text artikelen verkopen. En we hebben Internet. Maar ....

De hedendaagse vraag en aanbod van informatie


De ontsluiting van periodieken

Met het ontsluiten van periodieken heeft iedereen wel enige ervaring. Ik mag dan ook aannemen dat men met mij zal beamen dat men door periodieken te ontsluiten, men dus ook periodieken zal terugvinden als men hierop gaat zoeken.
Ik wil hier opmerken dat het de vrager niet om een tijdschrift of iets dergelijks gaat, maar om de artikelen uit desbetreffende tijdschrift. In principe gaat het dus niet om het tijdschrift of periodiek, maar om het artikel uit dat blad.

Het nut van periodieken ontsluiten is dat men weet dat het er is, wat er qua tijdspanning van is en waar het te vinden is. Zolang er op geen enkele wijze een verwijzing naar de inhoud van het tijdschrift gemaakt wordt, kan niemand weten wat de specifieke inhoud van het periodiek is. Men kan alleen raden dat de onderwerpen binnen een bepaald kader zullen liggen. Voor het terugvinden van artikelen heeft dit (ontsluiting van periodieken) dus geen enkele zin.

Het uitgangspunt in bibliotheekwereld en in schrijversland (literatuuropgaven) is dat men verwijst naar een tijdschrift als bronvermelding. Eigenlijk zou men moeten verwijzen naar betreffende artikel, wat vervolgens uit een bepaald tijdschrift komt. Dit gebeurt ook wel, want we zien in een literatuuropgave meestal keurig netjes het volgende staan:
Artikeltitel / Auteur
In: Tijdschrifttitel, Jrg etc.
Het vreemde hierbij is echter dat om het artikel terug te vinden / op te vragen, eerst het tijdschrift gezocht moet worden en daarna het artikel en niet meteen het artikel. Er worden dus twee stappen genomen, waarvan m.i. er 1 van weg kan. Uiteraard de stap van het vinden van het tijdschrift.

Men kan een tijdschrift of periodiek eigenlijk vergelijken met een boek. Een boek dat geschreven is door diverse mensen. Neem als voorbeeld het Handboek ter hand. Hierin staan hoofdstukken (lees artikelen), geschreven door diverse auteurs. Elk op het gebied van haar of zijn eigen specialisme.
Wanneer men deze personen of onderwerpen terug willen zoeken, dan gaat dat niet zolang het boek ontsloten is op de gebruikelijke manier. Zo'n boek zal dan ook veelal op hoofdstukken worden ontsloten.

Het kostenaspect speelt hierbij een grote rol. Een boek ontsluiten of bv alle 18 hoofdstukken, dat is nogal een verschil. Het zal meer dan 18 maal zoveel werk opleveren.
Voor een tijdschrift geldt dit nog sterker. Dit wordt maand in maand uit, jaar in jaar uit weer uitgegeven. De titel blijft hetzelfde, de inhoud echter niet. Maar waar blijft het nut van zo'n tijdschrifttitelontsluiting als de echte inhoud verborgen blijft?

Een periodiek is m.i. dan ook niets anders dan een bundeling artikelen over uiteenlopende zaken (binnen een bepaald kader) door diverse auteurs geschreven. Bij het terugvindbaar maken van deze informatie moet het periodiek beschreven worden, maar dit geldt zeker voor het artikel. Een artikel, wil het snel en efficient of uberhaupt teruggevonden kunnen worden, moet op artikelniveau ontsloten worden.

De ontsluitingskenmerken van artikelen

In onderstaande lijst wordt een overzicht gegeven van de formele en inhoudelijke ontsluitingskenmerken van een artikel. Uiteraard zijn hierbij ook de formele kenmerken van het periodiek opgenomen.

De formele kenmerken van het periodiek zijn herkenbaar. Velen onder u zullen de (niet echte, maar zelf toegevoegde) kenmerken ook toekennen, al zal dat vaak anders genoemd worden. In mijn onderzoek naar KranteKnipsel Ontsluitings-Systemen (KKOS)(1) komen diverse andere benamingen naar voren. Enige standaardisering op dit gebied ontbreekt volledig. De hier genoemde kenmerken zijn een gemene deler.

De inhoudelijke kenmerken zijn natuurlijk dezelfde als bij de andere documentsoorten: onderwerp, tijdaspect, vorm, plaats (geografisch) en namen (van organisaties/personen)

FORMELE ONTSLUITINGKENMERKEN VAN EEN ARTIKEL:
- TITEL VAN PERIODIEK
- OFFICIELE AFKORTING VAN PERIODIEK
- EIGEN AFKORTING VAN PERIOKIEK
- EIGEN NUMMER VAN PERIODIEK
- ISSN EN/OF BARCODE VAN PERIODIEK
- NUMMER VAN PERIODIEK
- PUBLIKATIEDATUM VAN PERIODIEK
- JAARGANG VAN PERIODIEK
- PERIODIEKSOORT (DAGBLAD, WEEKBLAD etc./KRANT, TIJDSCHRIFT etc.)
- LAND VAN HERKOMST PERIODIEK
- EDITIE VAN PERIODIEK
- DRUK VAN PERIODIEK

- TAAL VAN ARTIKEL
- TITEL VAN ARTIKEL
- ONDERTITEL VAN ARTIKEL
- BOVENTITEL VAN ARTIKEL
- SERIETITEL VAN ARTIKEL
- RUBRIEKTITEL VAN ARTIKEL
- COLUMTITEL VAN ARTIKEL
- AUTEUR VAN ARTIKEL
- AUTEURCODE VAN ARTIKEL
- PERSBUREAU
- PAGINA-AANDUIDING
- KOLOM-AANDUIDING
- RIJ-AANDUIDING
- AANTAL PAGINA'S
- IDENTIFICATIENUMMER ARTIKEL (Dit is in feite de plaatsingscode van het artikel. In dit verhaal (artikel) gaat het mij eigenlijk hierom. Ik kom hierop in paragraaf 'Het ISAN' op terug.)

INHOUDELIJKE ONTSLUITINGKENMERKEN VAN EEN ARTIKEL:
- TREFWOORDEN
- GECONTROLEERDE TREFWOORDEN
- VERTAALDE GECONTROLEERDE TREFWOORDEN
- CLASSIFICATIECODES
- GEOGRAFISCHE TREFWOORDEN
- VERTAALDE GEOGRAFISCHE TREFWOORDEN
- GEOGRAFISCHE CLASSIFICATIECODES
- NAMEN TREFWOORDEN
- NAMENCODES
- VORM-AANDUIDING TREFWOORDEN
- VORM-AANDUIDINGCODES
- TIJDASPECT TREFWOORDEN
- TIJDASPECT CODES
- VRIJE TEKST

Standaardlijsten voor inhoudelijke ontsluiting

Mijn voorkeur zou uitgaan naar het maken van 5 standaardbestanden te weten die voor het onderwerp, tijd, vorm, plaats en namen. Elke belanghebbende zou hieruit zijn/haar informatie kunnen halen. Maar ook voor de aanvulling dient gezorgd te worden. De belanghebbende kan de nieuwe data kwijt in een tussendepot, die door een geautoriseerde instantie leeggehaald wordt en zo nodig bewerkt, aanlevert en invoert in de standaardbestanden.

Standaardisering ten behoeve van formele ontsluiting

Evenals voor de inhoudelijke ontsluiting kan ook voor elk gedeelte van de formele ontsluiting een standaardbestand aangemaakt worden. Voor enkele velden is dit zeer zeker lonend.

Automatiseren en ISAN

Automatisch vullen van velden door koppelingen met reeds gevulde standaardbestanden.

In de geautomatiseerde catalogi is het eenvoudig, doeltreffend en uitermate efficient om gebruik te maken van databestanden om de eigen databank te vullen. De inhoud kan worden overgenomen. De foutinvoer van de gegevens kan hierdoor worden beperkt. Standaardinvoer wordt hierdoor bevorderd. Door gebruik te maken van goede gegevensbestanden kan de invoer beperkt worden tot het kiezen van het juiste gegevens of nog beter de invoer gebeurt geheel automatisch. Het werk wordt hierdoor efficienter en tevens kwalitatief en kwantitatief hoger. Dit geldt natuurlijk ook als u zelf "kleine" standaardbestanden aanmaakt om van daaruit uw eigen catalogus te vullen.

Een voorbeeld: ISBN
Stel u voor, u bent boeken aan het invoeren. Op een gegeven moment komt u aan bij het beschrijven van de UITGEVER, PLAATS VAN UITGAVE en het ISBN.
Deze velden dienen nu met de hand worden ingevoerd.
Het zou op velerlei gebieden efficienter zijn, wanneer deze gegevens uit een gecontroleerde standaardbestand automatisch gekopieeerd zouden kunnen worden.
U komt bijvoorbeeld aan bij het invoerveld: ISBN.
U voert het ISBN in en zodra u op [ENTER] heeft gedrukt worden automatisch de velden UITGEVER en PLAATS VAN UITGAVE ingevuld.

Zoals u weet is het ISBN opgebouwd uit een aantal gegevens.
We nemen 90 234 0869 1 even als voorbeeld:
90 is het taalgebied waar dit boek is uitgeven, namelijk het Nederlands taalgebied.
(90) 234 is het uitgeversnummer van dit boek, namelijk Uitgeverij De Bezige Bij.
0869 is het boeknummer van deze uitgever, in dit geval Hoogste tijd : roman (van Harry Mullisch).
1 is het rekenkundig controlecijfer van deze ISBN.
We zien hier vier gegevens staan. Met drie van deze gegevens kunnen we aan de invoerkant in de bibliotheekwereld niet echt iets doen.
Het taalgebied is een niet gehanteerde term. (Mijn inziens ook een zinloos gegeven.)

Het boeknummer is in combinatie een interessant gegeven, maar zolang uitgevers en bibliotheken niet hierin samenwerken, heeft de bibliotheek hier niet echt iets aan.
Het controlecijfer is handig als dit als een standaardcontrole voor het ISBN-veld zou kunnen worden gebruikt. Een zinvol gegeven is het uitgeversnummer. In scherm 1 staat een gedeelte van de catalogusinvoerscherm.

In scherm 2 staat een gedeelte van het uitgevernummerbestand.
Door middel van een koppeling van het ISBN-veld met het uitgevernummerbestand en het UITGEVER-veld is het mogelijk geworden om het UITGEVER-veld automatisch te laten vullen.
Door het uitgevernummerbestand uit te breiden met een plaats-veld, kan ook het PLAATS VAN UITGIFTE-veld automatisch gevuld worden.
In feite is dit dus niets anders dan wat we doen met de talloze classificatiesystemen die we kennen. Dit zijn gecodeerde woorden (in dit geval onderwerpstrefwoorden).

Even terug naar waar het in dit artikel om gaat het ISAN.



I S A N Internationaal Standaard Artikel Nummer

Moet een artikel een uniek identificatienummer krijgen

Onder een uniek identificatienummer wordt verstaan een nummer die alleen bij een specifiek artikel of knipsel hoort. Dit nummer wordt gebruikt om de diverse artikelen te ordenen volgens een bepaald systeem en dient daardoor als vindplaatsaanduiding.
Er zijn verschillende mogelijkheden om uiting te geven aan een uniek identificatienummers.
Er zijn "domme" en "slimme" identificatienummers.
"Domme" zijn bijvoorbeeld opeenvolgende nummers volgens bijvoorbeeld de volgorde van binnenkomst. Dit soort nummers hebben geen enkele functionele waarde, afgezien van het feit dat het de vindplaats aanduidt waar het desbetreffende artikel is opgeborgen.
"Slimme" zijn bijvoorbeeld 'formele identificatienummers' en 'inhoudelijke identificatienummers' (ook wel classificatiecodes genoemd, wanneer dit in de zuiverste vorm geschied). Een mengvorm is ook mogelijk. Dit zijn nummers die een betekenisvolle waarde hebben.
De "domme" en classificatiecodes kunnen hiervoor eigenlijk niet gebruikt worden. De "domme" geeft namelijk alleen de vindplaats weer. De classificatiecode alleen het onderwerp waar het desbetreffende artikel over handelt en zodoende dus niet uniek.
De 'formele identificatienummers' en de mengvorm tussen formele en inhoudelijke blijven nu over.
Omdat een systeem helder en duidelijk moet zijn, is de keuze voor de 'formele identificatienummer' de meest voor de hand liggende. Inhoudelijke kenmerken kunnen dan door middel van een inhoudelijke ontsluitingssysteem terugvindbaar gemaakt worden.

Voordelen:
- Het nummer is altijd hetzelfde van samenstelling, m.a.w. iedereen die in het bezit is van de kranten/tijdschriftenlijst maakt dezelfde ISAN (International Standard Article Number of in het Nederlands Internationaal Standaard Artikel Nummer), waar men zich ook bevindt.
- Verder kan in een geautomatiseerd systeem de samenstellingsstruktuur worden opgevraagd d.m.v. het invullen van het ISSN (het International Standard Serial Number) in het systeem. Het ISSN is gekoppeld aan het tijdschriftennummer-gedeelte van het ISAN. Anderzijds kan de struktuur worden gezocht d.m.v. zoeken op titel. (Opmerking: niet elk tijdschrift heeft een ISSN.)
- Interpretatieverschillen zijn hierdoor uitgesloten.
- Grotere en betere communicatiemogelijkheden op dit gebied.
- Efficienter werkverdeling op diverse geografische plaatsen is hierdoor mogelijk gemaakt. Bv.: Amsterdam, Rotterdam, Groningen en Maastricht selecteren, knippen en plakken etc. en Den Haag ontsluit formeel dezelfde artikelen. De gegevens kunnen dan over en weer verstuurd worden. De link (het ISAN-nummer) is bij iedereen reeds aanwezig.
- Het artikel is altijd terugvindbaar.
- Zelfs handmatig is binnen het mapje van bv Telegraaf, zijn de artikelen op datum etc. terugvindbaar, wanneer de volgorde van dit nummer is aangehouden tijdens het rangschikken.
- Men kan intern zelf diverse opbergvolgordes bepalen, door bv de artikelen op datum van het ISAN-nummer gedeelte te rangschikken.
- In een geautomatiseerd systeem kan door invullen van dit nummer andere formele velden automatisch gevuld worden (dit zijn: taal, tijdschrifttitel, datum/nummer, pagina, kolom en rij). Er is dan tevens controle op het goed ingevuld hebben van het ISAN-nummer.
Nadelen:
- Cijferreeksen: Kans op fouten kan groter zijn, wanneer de controlemogelijkheid er niet is.
- Cijfers kunnen aversief zijn. Voor mensen met een aversie hiertegen, zal dit grote problemen opleveren, ook al zijn ze vaak wel aan bv telefoonnummers gewend.
"035?"
"O ja, dat is Hilversum."
Dat het in het ISAN-nummer 90 4056 de HP/De Tijd betekend zullen ze waarschijnlijk binnen de kortste keren uit hoofd weten.
En 910322 is nog sneller te herkennen als tweeentwintig maart negentienhonderdeenennegentig.

Het ISAN

Wat is ISAN? De afkorting kan geplaatst worden in het rijtje ISBN en ISSN en staat voor Internationaal Standaard Artikel Nummer en in het Engels International Standard Article Number.
Het is dus een internationaal hanteerbaar cijferreeks.
Het ISAN bestaat altijd uit 18 cijfers en bestaat uit 6 onderdelen

Hoe ziet dat ISAN-nummer eruit

Voorbeeld van kranteknipsel- en tijdschriftartikelnummer:
19910322 90 4212 03 4 2 (krantartikelnummer)
jjjjmmdd ll tttt pp k r

19910412 90 301 013 1 1 (tijdschriftartikelnummer)
jjjjmmdd ll ttt ppp k r

19913 90 700081 054 1 1 (tijdschriftartikelnummer)
jjjjmm ll tttttt pp k r

19914 0 8000030 064 1 1 (tijdschriftartikelnummer)
jjjjn l tttttttt pp k r

De positie-aantallen staan vast. Het ISAN-nummer zal altijd uit 18 posities bestaan. Onderdelen van de positie-aantallen kunnen varieren (net als bij het ISBN)

Een voorbeeld is 19910322 90 4212 03 4 2. Dit nummer is uit de volgende onderdelen opgebouwd: (1e voorbeeld)

19910322 = datum (jaar+maand+dag) (22 maart 1991)
90 = taal (Nederlands) (volgens ISAN-taallijst)
4212 = kranttitel (Dagblad voor Noord-Limburg) (volgens ISAN-lijst)
03 = paginanummer waar het artikel staat of het knipsel stond
4 = kolom waar het artikel begint
2 = nummer van n-de artikel in de kolom

Het tijdschriftartikelnummer is uit de volgende onderdelen opgebouwd, drie voorbeelden:

19910412 90 301 013 1 1: (2e voorbeeld)

19910412 = 12 april 1991
90 = taal (Nederlands) (volgens ISAN-taallijst)
301 = tijdschrifttitel (Elsevier) (volgens ISAN-lijst)
013 = paginanummer
1 = kolom waar het artikel begint
1 = nummer van n-de artikel in de kolom

19913 90 700081 054 1 1: (3e voorbeeld)

19913 =1991, nummer 3
90 = taal (Nederlands) (volgens ISAN-taallijst)
700081 = tijdschrifttitel (I&I) (volgens ISAN-lijst)
054 = paginanummer
1 = kolom waar het artikel begint
1 = nummer van n-de artikel in de kolom

19914 0 8000030 064 1 1: (4e voorbeeld)

19914 = 1991, nummer 4
0 = taal (Engels) (volgens ISAN-taallijst)
8000030 = tijdschriftitel (The Washington Quarterly) (volgens ISAN-lijst)
064 = paginanummer
1 = kolom waar het artikel begint
1 = nummer van n-de artikel in de kolom

In een geautomatiseerd systeem gaat het erom, dat de gebruiker en het softwarepakket moet weten hoe de opbouw per titel is, bv in:
1e voorbeeld: jjjjmmdd ll tttt pp k r
2e voorbeeld: jjjjmmdd ll ttt ppp k r
3e voorbeeld: jjjjn ll tttttt ppp k r
4e voorbeeld: jjjjn l ttttttt ppp k r

waar de volgende tekens staan voor de volgende betekenis:
- j voor jaar
- m voor maand
- d voor dag
- n voor nummer van jaargang
- l voor language = taal
- t voor nummer voor tijdschrifttitel
- p voor paginanummer
- k voor kolom
- r voor rij (van n-de artikel in kolom)

De 11 mogelijkheden van een datum en nummer aanduiding:
jjjjmmdd, jjjjmm, jjjjn, jjjjnn, jjjjnnn, jjjjnnnn, nn, nnn, nnnn, nnnnn, nnnnnn.

De 3 mogelijkheden van een taal aanduiding:
l, ll, lll

De mogelijkheden van een tijdschrifttitelnummer:
2 tt van 10 t/m 29
3 ttt van 300 t/m 399
4 tttt van 4000 t/m 5999
5 ttttt van 60000 t/m 69999
6 tttttt van 700000 t/m 799999
7 ttttttt van 8000000 t/m 8999999
8 tttttttt van 90000000 t/m 99999999

Het ISAN nummer is dus behoorlijk flexibel als het gaat om de onderdelen van het nummer. Al naar gelang het aantal pagina's een blad heeft, of het met jaarnummers, maandnummers of op dagdatum werkt, heeft het ISAN-nummer ruimte voor honderden miljoenen titels.

Automatisering en programeren:
Met bovenstaande gegevens is het vrij eenvoudig voor een softwareprogrammeur om dit in te brengen in een softwarepakket.
Neem bijvoorbeeld het 1e voorbeeld: jjjjmmdd ll tttt pp k r.
Het ISAN bestaat uit 6 blokjes met gegevens. Per blokje is bekend welke combinaties er mogelijk zijn en deze zijn te vertalen door het softwarepakket. Wanneer het tweede blokje bestaat uit 2 postities, dan zijn er een aantal cijfers te programeren, die te vertalen zijn: Als blokje 2 gelijk is aan 84, dan is veld-inhoud van veld taal gelijk aan Spaans. Zoniet dan: Als blokje 2 gelijk is aan 90, dan is veld-inhoud van veld taal gelijk aan Nederlands. Zoniet dan: etc.
U kunt zich voorstellen dat deze programmeer-lijn ook te maken is voor blokje 2 en blokje 3 samen: Als blokje 2 gelijk is aan 90 en blokje 3 is gelijk aan 4392, dan is veld-inhoud van veld taal gelijk aan Nederlands en is de veld-inhoud van bron/titel periodiek gelijk aan Dagblad van het Noorden. Zoniet dan: etc.
Een stapje verder en de programmeur heeft een invoerschermpje voor de gebruiker gemaakt, waar deze variabelen zijn in te voeren. Wij - als gebruiker - hoeven dan maar éénmalig de gegevens van een periodiek in te voeren en worden met behulp van het ISAN bij elk ontsloten artikel teruggehaald.
Tevens kunnen - als de artikelen als losse bestandjes bewaard worden - de artikelen opgeslagen worden met het unieke ISAN, bv.: 200204039043920423.htm (= 20020403 90 4392 04 2 3 en dan ziet u meteen dat dit een artikel is uit het Dagblad van het Noorden, welke gepubliceerd is op 3 april 2002 pagina 4, en het artikel begint in kolom 2, het 3e artikel van kolom 2. En deze plaats is uniek.)
Ter illustratie zie: Artikelen uit kranten over scheren

Regels voor het maken van een nieuw ISAN:
-bepaal de datum/nummeraanduiding (let op doornummeren)
-bepaal de taal of talen waarin het is geschreven
-bepaal het maximale aantal pagina's wat voor kan komen (let op doornummeren per jaar en denk aan dubbelnummers met kerst en zomer)
-bepaal hoeveel kolommen er maximaal voorkomen op een pagina (meestal 1 positie)
-bepaal hoeveel artikelen per kolom in een rij voorkomen (meestal 1 positie)
-tel alle gebruikte posities bij elkaar op en trekt dit af van 18
-de overgebleven posities wordt het t-aantal
-kies van de t het volgende open nummer (dit gebeurt door het ISAN-bureau)
-let ook op bijlagen van deze titel die met een nieuwe paginering beginnen, deze krijgen een nieuw ISAN
-let ook op edities van deze titel die een andere ondertitel of editienaam hebben, deze krijgen een nieuw ISAN

Conclusie

Met een standaardnummer - het ISAN - is het mogelijk om gestandaardiseerde informatie te gebruiken bij de ontsluiting van kranten- en tijdschriftartikelen. De computer vult na het invullen van een nummer van 18 posities zelf een aantal gegevens in, te weten:
datum
jaar
nummer
taal
tijdschrifttitel
beginpagina
kolom
rij
Het ISAN kan tevens dienst doen als opberglokatie, zowel voor hardcopy als digitaal.
Dit nummer kan internationaal gebruikt worden.
reacties kunt u mailen aan
Weiko Piebes

1. KKOS staat voor een beter kranteknipselontsluitingssysteem / Weiko Piebes. - Amsterdam : [Kopiebus], 1990. - 103 p. ; 30 cm
Scriptie BDI












ISAN-verhaal; versie 2012, 22 februari