Wikisource incontra la BnF

di aubreymcfato

L’annuncio è di qualche mese fa, ma ora si iniziano a raccogliere i primi frutti.

Wikimedia France, chapter francese della Wikimedia Foundation, ha sottoscritto ad aprile un accordo nientemeno che con la Bibliothèque nationale de France per l’inserimento , su Commons e poi sulla Wikisource francese, di un migliaio di libri digitalizzati.

Infatti da anni la BnF gestisce Gallica, biblioteca digitale francese che è da sempre la pioniera della digitalizzazione (e che da sola fornisce metà dei contenuti al meta-aggregatore Europeana (e anche la maggior parte dei contenuti in italiano…)).
L’accordo

consentirà a tutti gli utenti di Internet, attraverso Wikisource, l’accesso alle trascrizioni
di opere di pubblico dominio da Gallica. In ultima analisi, è di 1400 testi
francesi che saranno integrati in Wikisource. (comunicato)

Il gioco è infatti semplice. La BnF digitalizza le opere che rilascia tramite formato immagine in Gallica, e utilizza software OCR per avere una pur abbozzata trascrizione. I ragazzi di WMFrance trasformano le immagini digitalizzate in libri djvu (formato diventato oramai standard per Wikisource) che caricano poi su Commons, l’archivio multimediale a cui tutti i progetti Wikimedia (quindi Wikipedia, Wikisource, Wikiquote) fanno riferimento.

Da lì, vengono poi creati, semi-automanticamente, gli indici dei libri veri e propri su Wikisource, dove la comunità inizierà a trascriverli e rileggerli.

Cosa ci guadagna la BnF in tutto ciò? La cosa che costa di più (in scala) in un processo di digitalizzazione, il proofreading. Infatti, l’OCR dei libri offre spesso risultati a dir poco insoddisfacenti (andate a farvi un giro su Google Books e cliccate “Solo testo” su un libro che abbia più di cinquant’anni per verificare…) e quindi la correzione, formattazione e rilettura dev’essere effettuata da umani. Si, proprio quelli in carne e ossa, spesso provenienti da paesi con moneta debole  pagamento come India o Mozambico. Ma ovviamente i costi sono rimangono alti, non c’è economia di scala.

Wikisource, come già il Project Gutemberg e da noi Liber Liber, è una biblitoeca digitale interamente gestita da volontari, ma diversamente da questi è un wiki che offre un modo semplice e totalmente orizzontale per contribuire alla rilettura e trascrizione dei testi (il link è ai libri della versione italiana).

Dunque l’accordo fra la BnF e Wikisource tenta un approccio di crowdsourcing volontario, che risulti vincente per entrambe le organizzazioni: la Biblioteca avrà infatti distribuito cultura ottenendo trascrizioni e riletture a costo zero, mentre Wikisource avrà guadagnato ottimo materiale e si spera attenzione per aumentare l’esigua comunità di volontari.

Infatti, l’unico punto debole del progetto è forse proprio questo: mentre le varie Wikipedie hanno mediamente comunità ampie e differenziate, i progetti Wikisource (in tutte le lingue) vanno avanti per una esiguo gruppetto di utenti molto attivi. Nonostante da tempo si speri che si raggiunga una fantomatica massa critica di utenti, questo non è ancora avvenuto, neanche per le source maggiori (tedesca, inglese e francese). Si spera che progetti come questo attirino rilettori volenterosi, per dimostrare vincente una scommessa davvero lodevole per un’istituzione gloriosa come la BnF.

Ovviamente la Wikisource italiana è a disposizione per iniziative analoghe.

Data la lungimiranza nel campo delle biblioteche digitali da parte del panorama italiano, siamo certi che le proposte non si faranno certo attendere. Noi aspettiamo pazienti.

About these ads