dinsdag 18 december 2007

Knollen voor citroenen?

In de hogere klassen van de middelbare school werd mij opgedragen werkstukken te maken, toen nog scripties geheten. Een van de dingen die duidelijk werd gemaakt was, dat we kritisch naar onze bronnen moesten kijken. Een A&O boekje over het boerenbedrijf in de middeleeuwen is iets anders dan een gedegen studie van een gerenommeerd wetenschapper over de boerenopstanden in Engeland in de veertiende eeuw.

Voor de bronnen op het internet geldt natuurlijk hetzelfde. Er zijn bronnen die betrouwbaar zijn en andere zijn dat niet of minder. Er zijn bijdragen in Wikipedia die betrouwbaar en serieus zijn en andere zijn onvolledig of eenzijdig. Scholieren, studenten en wetenschappers moeten zich dat realiseren en ook getraind worden in het vellen van een juist oordeel. En dat dan ook verwoorden in hun werk. Maar je mag volgens mij niemand verbieden gebruik te maken van welke bron dan ook. Wel moet het alle betrokkenen duidelijk zijn dat een waardering van je werkstuk afhangt van:

a. de boodschap en de vorm waarin de boodschap is vervat
b. de gebruikte bronnen
c. de manier waarop je de bronnen gebruikt
d. de gekozen doelgroep

Het weigeren van Wikipediabijdragen als bron, op de middelbare school van onze jongste zoon is dat het geval, is merkwaardig. Merkwaardig omdat het argument merkwaardig is: de inhoud van de bijdrage kan in de loop der tijd verschillen. Dat nu is op zich juist, maar je kunt natuurlijk wel verwachten dat bij het maken van een verwijzing naar een dergelijke bijdrage op een bepaalde manier te werk wordt gegaan. Neem in ieder geval bij verwijzing datum gegevens mee, zou ik zeggen. Kan je nog eens terugkijken met wikiscanner of iets dergelijks, toch?

Op de middelbare school van onze zoon moet met enthousiasme gereageerd zijn op de berichten omtrent de plannen van Google om een nieuwe voorziening te bouwen met de welluidende naam "Knol".

Deskundigen zouden moeten worden uitgenodigd en misschien aangemoedigd een gecontroleerd, en dus stabiel, artikel of werkstuk af te leveren over een bepaald onderwerp. Uiteraard tegen betaling, ik citeer uit de hierboven genoemde blog (18 december 2007): "Google will provide the author with substantial revenue share from the proceeds of those ads" en uiteraard zonder controle door Google. Ik citeer opnieuw: "Google will not serve as an editor in any way, and will not bless any content. All editorial responsibilities and control will rest with the authors."

Kan iemand mij eens uitleggen hoe we dan als eenvoudige kennisconsument moeten vaststellen wat de precieze waarde is van dergelijke bijdragen? Hoe weet ik als consument dat wat er wordt geschreven niet eenzijdig is? Hoe weet ik als consument dat niet geschreven is vanuit het idee "hoe genereer ik zoveel mogelijk inkomsten uit mijn tekst zonder dat dat opvalt"? Het voorbeeld in bovengenoemde blog is wat dat betreft verhelderend. Hoe weet ik nu dat mevrouw de deskundige (over slapeloosheid) in haar opsomming van medicamenten niet een goedkoop, maar goed werkend, pilletje heeft weggelaten? Of hoe gaat Google om met de ranking van die medicijnenlijst?

Kortom we leveren de onduidelijkheid met betrekking tot het "niveau" van Wikipedia in voor onzekerheid met betrekking tot ware bedoelingen van de deskundigen. Natuurlijk, slechts een fractie van het aantal deskundigen zal zich niet kunnen beheersen, maar doorgaans is ook slechts een fractie van de Wikipediabijdragen van bedenkelijk niveau. In geval van Wikipedia hebben we als consument tenminste nog de mogelijkheid daar zelf iets aan te doen. Maar of "Knol"-auteurs van andermans bemoeienissen gediend zijn?

Bibliotheken hebben gezien de ontwikkelingen een rol te spelen in het bewustwordingsproces wat betreft punt c. "de manier waarop we bronnen gebruiken". Of niet?

woensdag 12 december 2007

Recht en WEB 2.0

Ik ben dan wel geen jurist, maar dat betekent natuurlijk niet dat ik mijn ogen altijd gesloten houd als ik, qualitate qua, boeken en artikelen zie langskomen die over het juridische veld gaan. Recht en geschiedenis, en dat laatste is een hobby van me, worden nog wel eens gecombineerd en heel soms levert dat wel eens iets interessants op.

Ook recht en werk kunnen gecombineerd worden. En zo zag ik onlangs een -vrij beschikbaar- artikel van Claire M. Germain, "Legal Information Management in a Global and Digital Age : Revolution and Tradition". Ik heb het niet alleen gezien, maar ook gelezen en, let wel ik zeg het nog maar eens, ik ben geen jurist.

Dit artikel is om twee redenen een must voor iedere bibliotheekmedewerker. Ik citeer de eerste paar zinnen uit de inleiding:
Blogosphere, folksonomy, the long tail, mashups, social bookmarking, tagging, filters, information architecture, podcasting, harvesting web content. These terms do not evoke the familiar library we are used to, but they have entered our daily lives as librarians. Times have changed drastically, and the information revolution is underway. This article presents an overview of the public policy issues surrounding digital libraries in the law field, and describes some current trends, such as Web 2.0, the social network. It discusses the free access to law movement, and mass digitization projects, then turns to some concerns, focusing on preservation and long term access to born digital legal information, and authentication of official digital legal information. It finally discusses new roles for law librarians.
En daar zien we ze voorbij komen, de bekende begrippen uit het ons zo vertrouwde WEB2.0 wereldje. Mw. Germain staat bij de meeste van de begrippen in een aparte paragraaf stil, ze legt uit en duidt op de consequenties voor de juridische wereld. En dat is de eerste reden. Maar het juridische kan wat mij betreft gewoon vervangen worden door wat dan ook, voor de wereld van de (andere) humaniora kan zo beetje hetzelfde worden gezegd, uiteraard mutatis mutandis.

De tweede reden is dat het artikel duidelijk aangeeft wat de rol moet zijn van de moderne bibliothecaris of bibliotheekmedewerker. In de hierboven geciteerde regels wordt daar in dat laatste zinnetje, "It finally discusses new roles for law librarians" naar verwezen. Ik noem de door Germain genoemde rollen:
  1. librarians as experts in quality evaluation
  2. librarians as teachers
  3. librarians as core participants in the mission of their institutions
  4. librairans as advocates for free access through global networks
En daar moeten we het dan mee doen. Als je in staat bent om het juridische in dit artikel zo'n beetje te vertalen naar je eigen werkomgeving en zo moeilijk is dat niet, dan is dit artikel wat mij betreft een absolute aanrader.

donderdag 6 december 2007

scanning en google

De laatste tijd vernemen we steeds meer kritiek op de kwaliteit van de door Google gemaakte scans van boeken. Ik realiseer mij dat dat soms niet anders kan, omdat het origineel simpelweg nu eenmaal van onvoldoende kwaliteit is. Ik liet dergelijke berichten maar passeren, besteedde er niet zoveel aandacht aan.

Vanochtend las ik in de blog van Edwin, "Een intrigerende hand in Google Books". Met name zijn link naar de band met enkele afleveringen van het tijdschrift The Gentleman's magazin nodigde uit om nu eens door zo'n gescand boek te 'bladeren'.

Dus de hele pdf gedownload (meer dan 47 MB!) en eens rustig 'doorgebladerd'. Werd ik niet vrolijk van! Teveel onleesbare - 'uitgesmeerde' tekst- bladzijden, onleesbare onderschriften bij plaatjes, inconsequenties in het scanformaat, weglopende tekst aan de randen bij de 'rugzijde', onleesbare noten en ga zo maar verder.

En hoe zit het met de ocr? Hieronder de tekst van -ik geef het toe- een lastige bladzijde (p. 326):

ber.vko «яттНы Un, h* Ka* baw! t-лг v/m •*
three daaThriTv T'I. H^rr-C'X'.ksyw. W." Л»-
Borlaa«, MwaM-fc'ulnubbT, 'лпгдв-Hïl, K»/T-
Aime, Хаг§;АГ»*-КТ:», »- -1 Г/л-«*>-1*л*. >л»И^» а
d*a¿Mer wt/, '!•>-: in Л[.г.;, Hti,is-ier «t n»r.<.h> ef «e». Mr. Adam's тала WM Xiru, «г.1т dauji, VT <* ТЬглпаа Спшмг. «f ЯчгЪ- та VsrUnd »Creel, !»ír*n/i, Vy Илгзмг**. tei/tV-r ах -1 rtça- She dlíd at frtfrird, «"ТЛ. 14, li«,i.™: -l.ttr only brother Jota Crin*«-*. «j. of I».il Mr. А4сги *г ! íi* «r,'e «rvi'insí «lí'er lUrriet, wtte oí the Hírr. Тьоггил Vara,v>nr Iwreil, ,и«1лч»1 of lit". e-U« of tf^ok End, la Chaetlrton, t<, the Нл... ir, 1 1>т. L/l»iH Kke, bean of Mou. nttr, for »V, .; í W/V , •!.,. h property, ai W'-ll M lí.f ariTowton '-*. , h К vi r**n dijTx«:d of pr,-Tioiii.//,had bw.r. f,'. r r :..ueil iíx.ve stxty year* before by their gr.ir.,ÍÍAther f'atien. e Thoma» Adán», «f Ь.кЬет гготе, Um», »vj. By thed*?tdi 4f hi* arv 1л líw Кет. Нгпту ArLu^-i, B.D. Kettnr of lUMwr.ll tat Snff,lk, t'- «;.f/ra he wu hftir-et-Uw, he ¡nh«rriled млн« ртг/f^rtj in that Tfllaee In F*b. IV î. frxm iftrr 1Ьд1 lime hif health, whu-lt for яотп« year» had Leen fü::rí, bwmme rapvlly w^^, а »'я! 'A xi-reral р*гг1/ч1ч, whW h had íírnitly enfeeMM !ih 10-» cr«, rei,-l/ ring it Mtuuit,!c f<,r him to rel.r.^iMh Mi ,1 :tj : be »<•- ronlinifly Avl чо.ап'1 inAjnl I»VÎ f'naKr, pitié,! hi* i»rUh. Ht« remain« were Interred on tbe ^4tb In the rhartJtyant at Farnilon, among hu pa- rUtfl/mer>. ï/y wnora be «a« jrreativ яЫ nr.irer- •ally beiden for Ь1я nnlforra kindnerf and affability, and for the tfreat attention wh^h he be- •Uiwed on the 'Jome lie coroforta and tbe w.rî'lly U wen u the «pirltual CODUTTU of the bombiert Jan. I«. At Orat, со. Stafford, aged S7, tbe Кет. Adolpluu l/'jpHiu, Vicar of that oarinh, to whlrb he wa« pre«ented by toe Lord Chancellor In 1924. He wa* of Emmanuel cuHeee, Cambridge, В.Л. ISM. /on. 21. At Rhyl, nintïhlre, the Бет. £мя Etant,

Een knappe jongen die met zijn fuzzy search programma hier nog iets van kan maken!

Natuurlijk is het zo dat het merendeel van de tekst van dit boek goed bruikbaar is, maar je zult maar op zoek zijn naar info over ene "George Adams" in de "Northumberland street". Ik heb even moeten puzzelen, maar dat staat volgens mij in de pdf op bladzijde 326.

maandag 3 december 2007

scannen, vernietigen, niet tevreden

In het afgelopen jaar hebben wij als bibliotheek van het Vredespaleis nogal wat hand- en spandiensten geleverd bij een scantraject. Alle banden (meer dan 300) van de “Recueil des cours / Académie de Droit International = Collected courses of The Hague Academy of International Law” zijn gescand en zullen binnenkort beschikbaar komen via de site van Brill uitgeverij. Op dit moment is hier in huis (PPL) ook al toegang tot diezelfde data te verkrijgen. Rechttoe rechtaan, een pdf van ieder op dit moment beschikbaar artikel. Zoeken door de artikelen heen is niet mogelijk, enkel via de metatags is de pdf te traceren.

De discussie die op dit moment wordt gevoerd over het vernielen van een exemplaar van ieder boek, in Nederland gepubliceerd tussen 1800 en 1950, enkel en alleen om een snelle scan te kunnen maken, is een discussie die niet is gevoerd toen de 300 banden van de Recueil werden versneden. Er zijn immers nog genoeg exemplaren van iedere band beschikbaar. Wel is gesproken over de kwaliteit van de ge-ocr-de tekst, maar tot een doortimmerd oordeel is het eigenlijk nooit gekomen. Het ging in eerste instantie om het plaatje, niet om een kwalitatief hoogwaardige elektronische tekst. Ik ben benieuwd wat de commercieel opererende uitgever met de data (tekst) gaat doen? Naar verluidt werkt Brill wel aan de e-tekst van de Recueil om structuur aan te brengen.

Kwalitatief hoogwaardige elektronische tekst, wat is dat eigenlijk? In mijn optiek is een elektronische tekst een 100% nauwkeurige weerslag van –laat ik zeggen- het op papier gedrukte equivalent van de e-tekst. Tekstueel en structureel dus. En dat betekent dus dat een simpele scan niet volstaat.

Niet alleen is de gegenereerde tekst aan de hand van een simpele scan op zijn zachtst gezegd onnauwkeurig (ga uit van gemiddeld 1 fout woord op de 10 woorden), ik verwijs naar Alle boeken thuis voor bijna niks: pennywise but poundfoolish door Cees Klapwijk & René van Stipriaan, ook de structuur is verdwenen. Natuurlijk, ik kan in het plaatje van een bladzijde (een deel van) de structuur wel waarnemen, maar zelden zie ik de algehele structuur.

Ik kan niet binnen een structuur zoeken. Stel ik zoek naar een woord in de tekst, maar ik hoef geen treffers uit hoofdstuktitels te zien, of voetnoten, of inhoudsopgaven, of conclusies, of voorwoorden…. Bij een simpele scan betekent dat dus dat ik zelf, achteraf, moet filteren.

Ik kan ook niet naar een structuur zoeken. Eigenlijk kan ik heel wat niet.

De discussie over het het snel en goedkoop maken van een digitale kopie van die naar schatting 500.000 boeken, moet niet alleen gaan over vaart en prijs, ook de algemene vraag “hoe gaan wij straks aan de slag met het verkregen resultaat” dient aan de orde te komen. Moet naar mijn idee zelfs de belangrijkste plaats innemen in de discussie!

Ter illustratie:

  1. Hoe toon je een bladzijde gemaakt met een simpele scan op een e-reader ? Lijkt mij erg lastig. Een grondtekst (bijna) zonder fouten in een structuur gezet die recht doet aan het origineel, biedt natuurlijk heel wat meer mogelijkheden. Kan misschien met een eenvoudige ingreep ook geschikt gemaakt worden voor de Kindle. Als Amazon dat goed vindt tenminste.
  2. Fuzzy search kan misschien een oplossing bieden, zou men kunnen zeggen. Dat is maar ten dele juist, want fuzzy searching kan ook juist vertroebelen. Ook juist ge-ocr-de tekst, maar slechts licht afwijkend van de zoekopdracht, kan als treffer worden gepresenteerd: opdracht ‘bonen’, resultaat ‘bonen, boenen,benen’. Ik pleit er overigens niet voor om fuzzy searching maar helemaal weg te laten. Bij het intoetsen van de zoekvraag kan iemand immers ook fouten maken, of geen rekening houden met verouderde spelling.

Ik heb beide zaken (e-readers, fuzzy search) niet in de discussie voorbij zien komen. Moet naar mijn idee gewoon wel gebeuren.

Ik heb er geen bezwaar tegen dat Nederlands cultuurgoed wordt vernietigd ten behoeve van een simpele en snelle scan onder de voorwaarden die zijn gesteld (kort gezegd, nooit een uniek exemplaar opofferen). Maar de stelling dat wij als consumenten met het verkregen resultaat dan allemaal erg blij moeten zijn, is een idiote gedachte. Ik wil als consument meer en dat kan dus niet voor 6 miljoen.

Hoe en door wie wordt trouwens bepaald welke bibliotheek haar exemplaar moet inleveren? En wat kost de discussie hieromtrent dan eigenlijk?

vrijdag 23 november 2007

Social bookmarking, tagging, labelling

Eerder sprak ik al over tagging en daar kom ik nu weer even op terug. In het artikel Can Social Bookmarking Improve Web Search? van Paul Heymann, Georgia Koutrika en Hector Garcia-Molina. - Infolab Technical Report 2007-33, Last Updated November 2, 2007, wordt uitvoerig geschreven over het nut van bookmarking van urls of websites zo u wilt. De auteurs hebben een gedegen stuk afgeleverd over de social bookmarking site del.icio.us. Ook Phil Bradley verwijst naar dit rapport. Hij is er positief over.

Voor de duidelijkheid, ik ook, voor zover ik er tenminste iets van kon begrijpen. Ik ben een op en top alpha, die indertijd drieen en vieren haalde voor algebra en meetkunde. Het enige wat ik wel snap is dat voor mij onleesbare formules uiteindelijk kunnen leiden tot grafiekjes. En als er dan in gewone mensentaal bij gezet kan worden wat zo'n grafiekje dan uitdrukt dan ben ik de koning te rijk.

Los van dit soort persoonlijke beschouwingen, blijft natuurlijk staan dat ik als werknemer in een bibliotheek moet bekijken in hoeverre bibliotheken in kunnen spelen op de bevindingen in dergelijke rapporten. Zo wordt benadrukt dat vele ingeklopte tags bij een url in feite terug te vinden zijn in de titel dan wel op de eerste bladzijde dan wel in het webdocument dat naar de desbetreffende url van de webpage verwijst(80% namelijk, zie 6.2 Tags. In de overige 20% zitten vaak, tikfouten, zelfde tags maar in andere taal en synoniemen, ergo, Google komt zo ook een heel eind in groeperen).

Is dat dan iets waar we rekening mee moeten houden als we gebruikers van bibliotheken vragen 'tags' of ' labels' aan boeken te hangen of preciezer geformuleerd aan titelbeschrijvingen in een catalogussysteem? Zijn er al bibliotheken die hier ervaring mee hebben? Of dat zelfs maar hebben onderzocht? En .. in hoeverre wordt de officiele onderwerpsontsluiting eigenlijk bepaald door woorden uit de titel of de eerste bladzijde van een boek? Of de achterflap?

In mijn bibliotheek wordt er dus niet getagged door gebruikers, zoals ik al eerder aanduidde. Gedurende de afgelopen 5 maanden konden mensen aan hun eigen titelselectie(s) tags toevoegen. Werd niet gedaan en wordt nog steeds niet gedaan. Waarom taggen mensen wel hun bookmarks in del.icio.us, maar niet hun titels op hun eigen virtuele plank(en)? Ook deze tags kunnen worden gedeeld met anderen! Is het omdat del.icio.us niet of veel minder wordt geassocieerd met een bibliotheek? (zie de rapportage Sharing etc. voor een indruk over hoe mensen tegen bibliotheken aankijken).

Hoe stimuleren wij onze gebruikers om eens een handje toe te steken? Tot meerdere eer en glorie van jezelf en anderen.

woensdag 21 november 2007

Ebook readers en PPL

In de bibliotheek van het Vredespaleis werken wij op dit moment aan een voorstel om doelgericht te onderzoeken wat de mogelijkheden en onmogelijkheden zijn met betrekking tot de inzet van ebook readers.

Natuurlijk hebben wij hier intern al de nodige ad hoc discussies gehad, maar nu wordt de structurele aanpak die ons voor ogen staat ingegeven door de -hier en daar wat opgeblazen- publiciteit rondom de introductie van de Kindle door Amazon. Duidelijk is in ieder geval dat we dat foeilijke ding in eerste instantie niet zullen meenemen in ons onderzoek, simpelweg omdat de reader in Europa niet geleverd wordt, maar natuurlijk ook omdat er nog geen communicatie via de europese telefoonnetwerken kan plaatsvinden. Schuiven we dus naar de achtergrond.

Onder doelgericht verstaan wij in ieder geval dat we zullen voorstellen twee readers aan te schaffen en dan vervolgens te kijken hoe wij die kunnen inzetten in onze eigen dienstverlening. Uiteraard onderzoeken wij de technische mogelijkheden (draadloos kunnen werken en hoe dan? via usb op de leeszaalcomputers?) conversie software (welke software waar aanbieden?) en natuurlijk de content (welke teksten kunnen wij inkopen en hoe mogen we die verspreiden?) en zo zullen er nog wel meer vragen opkomen, denken wij zo.

Even nog een illustratie: een ebook via Netlibrary aanbieden heeft zo zijn beperkingen, namelijk: "uitlenen" betekent dat het ebook vervolgens niet meer beschikbaar is voor anderen totdat het wordt " teruggebracht" is er een, en de ander is natuurlijk de prijs. Zouden wij niet een ebook reader (of meerdere) vol kunnen zetten met relevante teksten en die dan ter uitlening kunnen aanbieden? Zo weten wij dat een Netlibrary ebook gemiddeld 150 euro kost, sommige van die eboeken kosten bij Amazon 40 dollar!

Ik zou wel eens willen onderzoeken of een bij Amazon, of welke andere ebook provider dan ook gekocht eboek, mag worden opgeslagen op een eigen server en op afroep geplaatst mag worden op een ter uitlening beschikbare reader?

Stel je eens voor? In onze (juridische) bibliotheek komt een onderzoeker langs die aangeeft gedurende een bepaalde periode te willen werken aan een bepaalde kwestie. Onze vakinhoudelijke experts weten dat voor een dergelijk onderzoek een aantal handboeken beschikbaar is die ook elektronisch in ons bezit zijn. Voor een dergelijke gelegenheid zou je dus een specifieke reader kunnen opbouwen. Of je laat dat over aan de onderzoeker zelf, maar biedt je uiteraard terzake deskundige ondersteuning.

Een en ander lijkt mij wel een onderzoeksprojectje waard.

maandag 19 november 2007

Catalogiseren: doe het zelf of doe het niet?

Soms vraag ik wel eens af of het de taak van een bibliotheek is om het aangeschafte materiaal zelf te catalogiseren.

Onderstaande gedachtenexercitie werd in gang gezet door een artikeltje van Alan Danskin,
"Tomorrow Never Knows": the end of cataloguing? in: IFLA Journal 33(3): 205-209.

Natuurlijk, als meerdere bibliotheken gebruik maken van een gemeenschappelijke catalogus dan valt er al veel te delen en dus te besparen. Maar bijzondere bibliotheken profiteren daar natuurlijk veel minder van.

Bovendien doemt binnen afzienbare tijd het probleem op dat het moeilijk zal worden om nog vakbekwame catalogisanten te vinden. Als bibliotheken zelf willen of moeten blijven catalogiseren dan moeten die bibliotheken ook bereid zijn aan (bij)scholing te doen. Dat kost geld.

Er zit maar een ding op: titelbeschrijvingen inkopen. Ook dat kost geld. Maar het biedt natuurlijk ook ruimte in de vorm van besparingen in de personele sfeer. En de vraag is natuurlijk vervolgens waar de bibliotheek dan gaat winkelen?

Bij de bron zou ik willen voorstellen.

Waarom kunnen boeken en tijdschriften niet worden uitgerust met een RFID chip door de uitgever -tegen een geringe meerprijs- met daarop de titelbeschrijving van het werk in bijvoorbeeld MARC? Even scannen en hup de titel staat in MARC op je scherm. En als dat noodzakelijk is, valt dat natuurlijk te converteren naar welke opmaak dan ook. Of rechtstreeks in een database in te lezen.

Bibliotheken kunnen zich dan meer en meer richten op het werk waar zij goed in zijn, de onderwerpsontsluiting, de verrijking. Ik kan mij nog wel voorstellen dat de auteur van het desbetreffende werk zijn onderwerpsontsluiting meelevert op die RFIDchip. Die kan vervolgens door professionele bibliotheekmedewerkers, gebruikers en goed doorwrochte, slimme software worden aangevuld en gerubriceerd.

De aldus samengebrachte informatie, titelbeschrijving en onderwerpsontsluiting, moet natuurlijk ook nog worden aangeboden. En dan op een zodanig manier dat gebruikers eenvoudig, snel en op een intuitieve manier hun zoekresultaat kunnen verkrijgen. Met allerhande verwijzingen naar relevante auteurs, relevante literatuur, informatie over de beschikbaarheid, eventuele kosten en dergelijke zaken meer, ook buiten de eigen instelling. Bibliotheken spelen hier een belangrijke rol, want alleen zij kunnen samenbrengen zonder enige beperking of sturing. In de bibliotheek spelen immers geen zakelijke belangen, bij producenten en handelaren van de 'bibliotheekartikelen' wel.

Kortom: bibliotheken moeten zich meer toeleggen op gespecialiseerde, voortdurend in beweging zijnde kennis en kunde en minder investeren in het zelf catalogiseren, hetgeen in feite werk van algemene aard is, want volgens strikte, nauwelijk veranderende regels.

vrijdag 16 november 2007

Gratis tijdschriften zijn duurder!

De titel boven dit verhaal is een variant op de titel Gratis tijdschriften geven hogere kosten die te vinden is boven een bijdrage van Raymond Heemskerk in Cicero, nr 13 , p. 6, november 2007. Cicero is een driewekelijkse uitgave van het Leids Universitair Medisch Centrum en bestemd voor studenten.

In de bijdrage komt Han Belt, hoofd van de Walaeus Bibliotheek (gevestigd in het LUMC) aan het woord. Hij verhaalt over zijn aanvankelijke enthousiasme over open access tijdschriften (PLoS, Biomed Central) en zijn geleidelijke beweging naar twijfel over het nut van dergelijke open access initiatieven.

Hoe kwam dat? Belt geeft eigenlijk drie argumenten.

In de eerste plaats het kostenaspect. Open access tijdschriften zijn gratis te raadplegen, maar om een artikel te kunnen plaatsen in een dergelijk tijdschrift moet eerst worden betaald. De auteur moet dus betalen voor opname in een open access tijdschrift en de auteur declareert die kosten natuurlijk vervolgens bij zijn werkever. Als alle 1500 publicaties die jaarlijks in en om het LUMC worden geschreven in open access tijdschriften zouden verschijnen dan kost dat op jaarbasis miljoenen euro's. Dat is duurder dan het aanhouden van abonnementen op de reguliere e-tijdschriften!

In de tweede plaats was het de bedoeling dat open access meer gebruik, bijvoorbeeld in de derde wereld zou genereren. Dat blijkt niet het geval. Wel wordt eerder verwezen naar artikelen in open access tijdschriften, maar niet vaker. En voor de derde wereld geldt dat er minstens twee projecten zijn -onder de vlag van de Verenigde Naties, HINARI en AGORA bijvoorbeeld- die gratis toegang verzorgen tot (een deel van) de reguliere tijdschriften markt. De lezersmarkt is dus min of meer gelijk gebleven. Als hier geen gunstige beweging is, blijft het kostenaspect natuurlijk als een molensteen om de nek hangen.

In de derde plaats bestaat twijfel over de zogenaamde peer reviewing. Het idee is dat traditionele tijdschriften de kwaliteitscontrole veel beter aanpakken dan open access tijdschriften. Het grote geld zit hier immers aan de kop. Kwaliteit is niet belangrijk, als je maar betaalt. Dat is toch anders dan; hier heb je een waardeloos tijdschrift, koopt u het maar. Hier zit het geld in de staart.

Belt wijst wel nog op allerlei initiatieven. Sommige uitgeverijen kiezen voor hybride modellen, sommige artikelen zijn gratis te raadplegen andere niet. Sommige universiteiten, of verenigingen van vakgenoten (specialisten genaamd in de medische wereld) onderzoeken de mogelijkheden. En in Duitsland werkt de Deutsche Zentralbibliothek fuer Medizin mee aan een open-access tijdschrift: German Medical Science - an Interdisciplanary Journal.

Misschien dat de gespecialiseerde bibliotheek er dus wat bij moet gaan doen: uitgeven van wetenschappelijk verantwoord materiaal.

woensdag 14 november 2007

Worldcat Identities

Ik heb eens even zitten kijken in die Identities optie die sinds kort in Worldcat is geintegreerd. Ik kwam daartoe na signalering door Edwin in zijn blog. Ik had er over gehoord, maar er nooit naar gekeken, misschien omdat het, toen ik er over hoorde, nog erg experimenteel was.

Maar nu toch maar eens een kort onderzoekje. En hoe deed ik dat dan? Precies, ik toetste mijn eigen naam in! Uiteraard is dat geen ijdelheid mijnerzijds, dat begrijpt u, maar ik kan natuurlijk zo wel gemakkelijk controleren of er iets van de voorziening klopt. Afgezien van wat tijdschrift artikelen die nooit ergens zijn gecatlogiseerd, heb ik ooit bijgedragen als auteur aan twee boeken en ben ik ook ooit gepromoveerd, het derde boek dus.

Mijn eerste schrijfsel werd in 1985 gepubliceerd en was eigenlijk een gewone tentoonstellingscatalogus die ik schreef met mijn docent middeleeuws hebreeuws. In feite een obscuur werkje, mag eigenlijk de naam 'boek' niet hebben. Het tweede boek waaraan ik een bijdrage leverde was een vertaling van een vroegchristelijke bijbelcommentaar en dat boek verscheen -in een reeks- in 1993. Tot slot promoveerde ik -met een in eigen beheer uitgegeven boek- in 1998.

Wat vind ik daarvan terug in die Worldcat Identities? Welnu alleen de eerste twee werken. Mijn proefschrift is er niet! Zit zelfs niet in Worldcat en dat is precies waar Edwin op doelde toen hij opmerkte dat de GGC niet volledig is opgenomen. Jammer.

En wat is een 'audience level' (van kids tot special) nu eigenlijk? Is dat het veronderstelde gemiddelde niveau van je publicaties? Of het gemiddelde niveau van je lezers? Hoe meet je dat eigenlijk? Mijn level zit net een beetje boven het gemiddelde. Ik dacht altijd dat al mijn schrijfsels zeer specialistisch waren, gezien de onderwerpen. Maar misschien dat het niveau nog veranderd als mijn proefschrift wordt meegenomen!

Dan de 'related identities'. In mijn geval zijn dat de co-auteurs van de eerste twee boeken en de auteur van de bijbelcommentaar, Efrem de Syrier (306-373). Ik voel mij vereerd met dit gevarieerde gezelschap, maar Efrem een related identity noemen, ik weet het niet hoor.

So far so good, en nu eens testen met een echte wetenschapper. Steven Mithen, engels archaeoloog. Dat ziet er beter uit! Mithen heeft flink gepubliceerd de laatste jaren, waaronder uiteraard ook artikelen. Die artikelen zie je niet terug in de opsomming van publicaties, maar zijn wel op te roepen vanuit de timeline. Even zelf de publicaties optellen in de timeline en dat levert 33 publicaties op, waarvan er slechts 10 (de boeken) worden opgesomd. 10? Sommige titels staan er dubbel! Catalogiseer fouten? of ietsjes aangepaste titels ('origin' in de ene titel 'origins' in de andere) bij nieuwe oplagen dan wel edities? Wie zal het zeggen?

Tot slot zien we onderaan een tagcloud staan die overduidelijk betrekking heeft op het wetenschappelijke werk van S. Mithen. Ik vind het verwarrend als de cloud wordt aangeduid met 'associated subjects'. Ik denk dan dat de onderwerpen op de een of andere manier gekoppeld zijn aan zijn werk en niet een aanduiding van zijn onderwerp(en). Duidelijker is volgens mij de simpele aanduiding 'His subjects'.

Kortom, een geweldige voorziening, met hier en daar een klein beetje onduidelijkheid, hier en daar een klein beetje onvolledigheid. Worldcat Identities is dan ook nog in het beta-stadium en de er aan ten grondslag liggende data is niet compleet, maar dat laatste is eenvoudig op te lossen, lijkt mij. En over attenderen gesproken; ik zou net als Edwin erg gelukkig zijn als RSS op een identity kan worden gerealiseerd. Altijd op de hoogte blijven van wat Mithen nu weer heeft geschreven, wie wil dat nou niet?

dinsdag 13 november 2007

De top40

Ik zie de laatste tijd erg veel gerangschikte lijstjes langskomen. De top100 blogs, de top34 bibliotheken, de topweetikveel wat...

Ik kan maar niet begrijpen wat daar nu precies het nut van is. Dat komt misschien omdat ik de top40 van de radiopiraat Veronica (voor mij einde jaren 60, begin jaren 70) ook al niks vond. De meest interessante muziekjes stonden in de lagere regionen of zelfs in de tipparade. In tegenstelling tot veel leeftijdgenoten heb ik dus nooit top40s verzameld.

Ik vraag me af of het niet beter is te zoeken naar voor jou relevante blogs, ontwikkelingen, antwoorden op vragen en meningen dan te kijken naar de top 3 in ieder lijstje dat je voorbij ziet komen. Het is niet de rangorde die bepalend moet zijn, maar de inhoud.

maandag 12 november 2007

Bibliotheekbezoekers delen niets!

Maakte ik in Delen, privacy en vertrouwen al gewag van het verschijnsel dat bibliotheekgebruikers eigenlijk niks willen delen met andere gebruikers, binnen de context van de bibliotheek tenminste, dan moet ik nu helaas vertellen dat ik dat al eerder wist.

Wat is het geval? Zo'n beetje voor de zomer hebben wij hier in de bibliotheek van het Vredespaleis de voorziening 'MyPPL' geintroduceerd. Een keer even een kort berichtje op de homepage en verder geen poespas. Inmiddels hebben wij nu zo'n 100 gebruikers van deze voorziening. Niet erg veel, maar dat hadden wij ook niet verwacht. Het actieve werven van gebruikers moet nog beginnen. Wij beschouwen de afgelopen maanden eigenlijk als een testperiode.

In de 'MyPPL' hebben wij een paar typische -zeg- uitwisselingsopties gemaakt.
  1. een ikoontje dat aangeeft dat anderen de publicatie ook hebben geplaatst in 'MyPPL'
  2. een mogelijkheid om tags toe te kennen aan een publicatie
  3. een mogelijkheid om reviews te schrijven die dan door anderen gezien kunnen worden
Wordt niet gebruikt! In de review optie alleen meldingen als: 'moet geprint worden', 'moet gekopieerd worden', 'lezen!', etc. Niet bepaald informatie die je wilt delen met anderen, zou ik zeggen. Het kan heel goed zijn dat de gebruikersgroep van onze bibliotheek nog niet klaar is voor dit soort nieuwerwetsigheden. Daar ligt dus een taak! Maar hoe doe je dat op de beste manier?

Misschien dat we hier in de PPL maar moeten besluiten die drie mogelijkheden voorlopig te vervangen door een optie: virtueel 'geeltje'.

Delen, privacy en vertrouwen

Ik weet het nog als de dag van gisteren! Op 26 oktober jongstleden las ik in de blog van Wow!ter voor het eerst over het bestaan van: De Rosa, C. (2007). Introduction. Sharing, privacy and trust in our networked world : a report to the OCLC membership. De Rosa et al. Ed. Dublin, OH, OCLC. Een rapport van maar liefst 280 p. lang!

Afgezien van wat citaten heb ik bij Wouter eigenlijk geen gedegen bespreking gezien. En dat is begrijpelijk, want eigenlijk is het een onleesbare rapportage. Cijfers, cijfers en nog eens cijfers. Veelal ook nog eens uitgebeeld in prachtige grafieken en dat verklaard dan ook de omvang natuurlijk.

Als een rechtgeaard lezer en bibliotheekmedewerker heb ik dat rapport eerst uitgeprint en vervolgens _helemaal_ gelezen! Sufmakende lectuur moet ik zeggen, niet alleen vanwege de omvang en de opsommende wijze van schrijven, want dat kan in een dergelijke rapportage niet anders, maar vooral ook door de ontluisterende berichten over de bibliotheek en de visie van webgebruikers op bibliotheken. De bibliotheek moet tekst leveren, al dan niet in e-vorm, maar verder heeft de gebruiker er eigenlijk niets te zoeken. Een gemeenschap vorm je elders, niet in een bibliotheekcontext.

Dat is toch iets waar we als bibliotheekmedewerkers rekening mee moeten houden!