Wikisource incontra la BnF

L’annuncio è di qualche mese fa, ma ora si iniziano a raccogliere i primi frutti.

Wikimedia France, chapter francese della Wikimedia Foundation, ha sottoscritto ad aprile un accordo nientemeno che con la Bibliothèque nationale de France per l’inserimento , su Commons e poi sulla Wikisource francese, di un migliaio di libri digitalizzati.

Infatti da anni la BnF gestisce Gallica, biblioteca digitale francese che è da sempre la pioniera della digitalizzazione (e che da sola fornisce metà dei contenuti al meta-aggregatore Europeana (e anche la maggior parte dei contenuti in italiano…)).
L’accordo

consentirà a tutti gli utenti di Internet, attraverso Wikisource, l’accesso alle trascrizioni
di opere di pubblico dominio da Gallica. In ultima analisi, è di 1400 testi
francesi che saranno integrati in Wikisource. (comunicato)

Il gioco è infatti semplice. La BnF digitalizza le opere che rilascia tramite formato immagine in Gallica, e utilizza software OCR per avere una pur abbozzata trascrizione. I ragazzi di WMFrance trasformano le immagini digitalizzate in libri djvu (formato diventato oramai standard per Wikisource) che caricano poi su Commons, l’archivio multimediale a cui tutti i progetti Wikimedia (quindi Wikipedia, Wikisource, Wikiquote) fanno riferimento.

Da lì, vengono poi creati, semi-automanticamente, gli indici dei libri veri e propri su Wikisource, dove la comunità inizierà a trascriverli e rileggerli.

Cosa ci guadagna la BnF in tutto ciò? La cosa che costa di più (in scala) in un processo di digitalizzazione, il proofreading. Infatti, l’OCR dei libri offre spesso risultati a dir poco insoddisfacenti (andate a farvi un giro su Google Books e cliccate “Solo testo” su un libro che abbia più di cinquant’anni per verificare…) e quindi la correzione, formattazione e rilettura dev’essere effettuata da umani. Si, proprio quelli in carne e ossa, spesso provenienti da paesi con moneta debole  pagamento come India o Mozambico. Ma ovviamente i costi sono rimangono alti, non c’è economia di scala.

Wikisource, come già il Project Gutemberg e da noi Liber Liber, è una biblitoeca digitale interamente gestita da volontari, ma diversamente da questi è un wiki che offre un modo semplice e totalmente orizzontale per contribuire alla rilettura e trascrizione dei testi (il link è ai libri della versione italiana).

Dunque l’accordo fra la BnF e Wikisource tenta un approccio di crowdsourcing volontario, che risulti vincente per entrambe le organizzazioni: la Biblioteca avrà infatti distribuito cultura ottenendo trascrizioni e riletture a costo zero, mentre Wikisource avrà guadagnato ottimo materiale e si spera attenzione per aumentare l’esigua comunità di volontari.

Infatti, l’unico punto debole del progetto è forse proprio questo: mentre le varie Wikipedie hanno mediamente comunità ampie e differenziate, i progetti Wikisource (in tutte le lingue) vanno avanti per una esiguo gruppetto di utenti molto attivi. Nonostante da tempo si speri che si raggiunga una fantomatica massa critica di utenti, questo non è ancora avvenuto, neanche per le source maggiori (tedesca, inglese e francese). Si spera che progetti come questo attirino rilettori volenterosi, per dimostrare vincente una scommessa davvero lodevole per un’istituzione gloriosa come la BnF.

Ovviamente la Wikisource italiana è a disposizione per iniziative analoghe.

Data la lungimiranza nel campo delle biblioteche digitali da parte del panorama italiano, siamo certi che le proposte non si faranno certo attendere. Noi aspettiamo pazienti.

9 pensieri su “Wikisource incontra la BnF

  1. «Noi aspettiamo pazienti.»
    Be’, non è che siamo cosí passivi. :-p
    Io credo molto in Wikisource, anche se la strada è lunga. C’è già ora reCAPTCHA, una piccola Tobin tax sulle transazioni virtuali che ruba qualche istante all’utente di Internet dirottandolo sul miglioramento dell’OCR dei giornali; verrà il momento in cui trascrivere testi sarà un passatempo un po’ meccanico più popolare dell’enigmistica o del sudoku cui migliaia o centinaia di migliaia di persone si dedicheranno invece di stare davanti alla TV (c’è un sacco di energia umana là fuori da impiegare in modo migliore, come suggerisce Clay Shirky http://it.wikiquote.org/wiki/Clay_Shirky )…

    Mi piace

  2. Si, lo so, era una provocazione ;-).
    sai che condivido in pieno quello che dice, anche se sono un po’ meno ottimista: il surplus cognitivo di Shirky viene ora impiegato in qualcosa di creativo come Wikipedia, e non so se la trascrizione in sè diventerà il sudoku del domani. Certo reCAPTCHA è geniale e credo funzioni alla grande (e infatti Google se l’è magnato): peccato che come Wikisource non vi possiamo accedere…

    Mi piace

  3. Thank you for this article, Aubrey!

    It is never too late to talk about this agreement ;-) (which means that if we do not communicate *in English* to other chapters, nobody knows what we do ;-)

    You’re right to say that we still lack a great community to develop Wikisource. I’ll be trying to contact former professors to retire, but is difficult to work on Wikisource …

    Do you know what is the profile of italians contributors of Wikisource ?

    Adrienne

    Mi piace

    1. Hi Adrienne.
      The profile of contemporary Wikisource (very) active users is quite various; we have one professor of Greek and Latin in high school, one doctor with the passion of Python and equitation, one guy with the hobby of theatre and classics, one (which I do not know personally) who is in charge in oldwikisource and has a great knowledge in css, js and mediawiki. We are all men, right now, we had few women but lost them in the way. We had young very active users who for one reason or another stopped working on Source, and we had also few users who were contributing on personal and specific texts. We had also an anonymous user with the passion of Dante, who transcribed a lot of material and then disappeared. As you can see, a pretty diversificated piece of humanity. I think I wrote something about it, If I find it I’ll post it.

      Mi piace

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...