De Bibliotheca digitale, Google Book Search et Settlement/2

Figurati che si servivano di biblioteche
dove i libri non parlavano l’uno con l’altro

Marvin Minsky

Google, come già accennato, vuole dunque riportare sul Web la totalità dei libri pubblicati.
E’ dietro a questo progetto dal 2004, e per questo ha affrontato 4 anni di processo, di cui questo Settlement è il provvisorio (dato che potrebbe avere modifiche) risultato. Ma come mai tanta determinazione? Non è strano affrontare un progetto così ambizioso, e soprattutto un processo del genere, da parte un’azienda pur colossale ma che ha solo 10 anni?
No, se ci si riflette un attimo.

Google rimane, soprattutto, un motore di ricerca, il cui nucleo profondo è un algoritmo che ci aiuta a trovare le informazioni che cerchiamo sul Web.
Ma il Web è storicamente nato ieri, ha un utilizzo di massa solo da pochissimi anni, mentre la conoscenza dell’uomo affonda nei tempi più remoti, è la dote di migliaia di anni di evoluzione. E qual’è la tecnologia che l’uomo, nei secoli, ha sviluppato per conservare questa conoscenza e trasportarla nello spazio e nel tempo? I libri. E prima di loro le pergamene, gli incunabola, i codici e i papiri.
I libri sono la tecnologia che trasporta la nostra memoria da secoli e secoli. Conservano fra le loro pagine quella che possiamo chiamare la conoscenza dell’umanità.
Riportare tutta questa conoscenza sul Web allargherebbe esponenzialmente il bacino di Google, la materia prima su cui lavora e che è il suo core business: l’informazione. Dunque ha tutto l’interesse a essere il pesce più grosso non nello stagno dell’informazione del Web come lo conosciamo, ma nel mare magnum del Web che sarà, pieno anche dell’informazione ora sepolta nei libri e testi depositati nelle biblioteche di tutto il mondo.

Pensate di entrare nella vostra biblioteca, digitare due o tre parole sull’iPhone e avere all’istante la lista dei libri che parlano di ciò che cercate.
Pensate a quelle citazioni mozze che avete nella memoria, a quegli autori sconosciuti che leggeste su un manuale anni fa, alla possibilità di avere informazione attendibile dai libri per le stesse cose che cercate sul Web.
Pensate di leggere una frase accattivante, di cercarne l’autore e di avere la possibilità di leggere i suoi testi all’istante.
Pensate di incrociare i dati fra vari testi e seguire l’evoluzione di un’idea millenaria riportata nei libri come strati nella roccia.
Il web, che non si chiamerà più così, avrà tesori tutti da scoprire.
In un’epoca non lontana (in realtà, già lo facciamo (male) da anni su Wikisource) i libri parleranno fra di loro, la biblioteca totale sarà ipertestuale.
Navigheremo nelle biblioteche digitali fra testi entrando in ogni libro, avendo per porte citazioni e autori, testi, idee citati. Le biblioteche saranno inesauribili ragnatele di letteratura e saggistica, poesia e documentazione.

Ecco cosa saranno (forse) le biblioteche digitali.

Per un sogno del genere, ed il sogno di fare probabilmente tanti di quei soldi da non riuscire a contarli, Google ha affrontato un processo durato metà della sua esistenza e iniziato a digitalizzare a testa bassa libri da ogni dove, dalla Boodleian Library di Oxford allla biblioteca della Cornell University. E oggi si è comprato anche reCAPTCHA, software geniale che sfrutta le masse internettiane per trascrivere i libri.

Data l’utopia, bisogna attuarla.
Ovviamente, la mela della discordia è il ancora una volta il copyright.

Bibliografia

  • Kevin Kelly, Scan This Book!, The New York Times, 14 maggio 2006.
  • Riccardo Ridi, La biblioteca ipertestuale, Editrice bibliografica, 2007.

5 pensieri su “De Bibliotheca digitale, Google Book Search et Settlement/2

  1. You’re right, Matthias, in fact one of the main problems are preservation, metadata and privacy.
    I think that a change of the settlement could avoid this issue easily (it’s a problem of policies, not technology).
    Preservation and metadata are more complicated. But I guess that all the presidents of National Libraries that signed an agreement with Google know well this issues, and ask for good quality and resolution of digitized pages.
    Probably metadata problem is even more messy, but libraries will figure it out, and Google could use more user generated content in this way (wiki-style?).

    Mi piace

  2. I get your point. Who knows, hopefully Google will be forced to slow down: right now the Settlement is frozen, the Department of Justice stopped it due to these privacy and antitrust issues. Google is not in a nice position now, they’ll probably need to accept some modifications.

    Mi piace

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...