De Bibliotheca digitale, Google Book Search et Settlement/4

Nelle settimane scorse, durante il processo, Google aveva richiesto ed ottenuto per domani 7 ottobre lo slittamento dell’udienza per stabilire la correttezza dell’Accordo.
Anche se il Settlement originale è ormai morto, domani sarà una giornata importante. Le parti in carica forniranno un aggiornamento sulle loro discussioni.
Vari enti del mondo profit e non, in primis Opent Content Alliance, continuano a spingere per una risoluzione trasparente che corregga le pecche catipali del precedente accordo, che possono essere riassunte in 3 principali critiche:

1. Il settlement originale donava a Google una esclusività de facto nell’accordo con autori ed editori, non permettendo ad altri attori di sfruttare le condizioni imposte da Google. L’ “anyone can do this” di Google non è risulta quindi veritiero.

“[T]he parties have represented to the United States that they believe the Registry would lack the power and ability to license copyrighted books without the consent of the copyright owner – which consent cannot be obtained from the owners of orphan works. If the parties are correct, the Registry will lack the ability to provide competitors with licenses that will allow them to offer to the public anything like the full set of books Google can offer if the Settlement Proposal is approved.” (p. 23)

“This de facto exclusivity (at least as to orphan works) appears to create a dangerous probability that only Google would have the ability to market to libraries and other institutions a comprehensive digital-book subscription.” (p. 24)

“This risk of market foreclosure would be substantially ameliorated if the Proposed Settlement could be amended to provide some mechanism by which Google’s competitors’ could gain comparable access to orphan works (whatever such access turns out to be assuming the parties negotiate modifications to the settlement).” (p.25)

“Nor is it reasonable to think that a competitor could enter the market by copying books en masse without permission in the hope of prompting a class action suit that could then be settled on terms comparable to the Proposed Settlement. Even if there were reason to think history could repeat itself in this unlikely fashion, it would scarcely be sound policy to encourage deliberate copyright violations and additional litigation as a means of obtaining approval for licensing provisions that could not otherwise be negotiated lawfully.” (p. 23-24)

2. Il settlement originale avrebbe potuto permettere un cartello dei prezzi gestito da Google.

“In at least three respects, the collectively negotiated provisions of the Proposed Settlement appear to restrict price competition among authors and publishers: (1) the creation of an industrywide revenue-sharing formula at the wholesale level applicable to all works; (2) the setting of default prices and the effective prohibition on discounting by Google at the retail level; and (3) the control of prices for orphan books by known publishers and authors with whose books the orphan books likely compete. Although they arise in a unique context, these features of the Proposed Settlement bear an uncomfortably close resemblance to the kinds of horizontal agreements found to be quintessential per se violations of the Sherman Act.” (p. 17)

3. Data la la portata dell’accordo, e il fatto che avrebbe riguardato tutti gli autori ed editori, ed il fatto che non si è assolutamente certi che questi abbiano potuto ricevere notifica del settlement, non vi sarebbe stata equità nell’applicare i termini dell’accordo per tutti quanti gli stakeholders. Sarà necessario riproporre in maniera più pervasiva il nuovo accordo, mettendo più persone possibili in grado di accettare o meno.

“Although the United States is not in a position to opine on whether the notice provided by Google has met the strictures of Rule 23, it believes the Court should undertake a searching inquiry to ensure both that a sufficient number of class members will be reached and that the notice provided gives a complete picture of the broad scope of the Proposed Settlement. The Court should not hesitate to require the parties to undertake further efforts to notify the class.” (p.13)

(liberamente tradotto ed adattato dal blog di OCA)

UPDATE: il giudice ha spostato il tutto al 9 Novembre.

Piergiorgio Odifreddi, “Ministro Gelmini, le spiego perché il problema è lei”

Signor ministro,

leggo (o meglio, mi hanno segnalato di leggere) su Il Giornale di famiglia del presidente del Consiglio che sabato scorso, alla sedicente Festa della Libertà organizzata dall’altrettanto sedicente Popolo della Libertà al Palalido di Milano, moderata (si fa per dire) dal condirettore dello stesso giornale, lei ha tuonato contro «l’intolleranza antisemita del superfluo matematico Piergiorgio Odifreddi, ex docente baby pensionato», che ha osato restituire il Premio Peano «quest’anno assegnato a Giorgio Israel, ai suoi occhi colpevole di sionismo, ma soprattutto di essere consulente del ministro».

Lei ha poi continuato, con stile e in punta di fioretto, dicendo che «gli imbecilli non mancano mai», e che «le parole di Odifreddi denotano razzismo, incapacità al confronto e stupidità». E ha terminato allargando il discorso, assimilando il mio gesto alla «modalità tipica della nostra sinistra, quella di combattere il governo e Silvio Berlusconi a qualunque prezzo, a costo di insultare allo stesso tempo la maggioranza dei cittadini che lo votano». Mi permetta di rispondere nel merito alle accuse che mi rivolge, fingendo che esse siano in buona fede e dettate dall’ignoranza dei fatti. Naturalmente non posso dir nulla sulla mia imbecillità e stupidità, e mi fido del suo giudizio: in fondo, lei è un valente avvocato che ha superato una difficile abilitazione a Reggio Calabria, dopo una laurea nella vicina Brescia e un precedente passaggio da un liceo pubblico a uno privato, mentre io sono soltanto un modesto docente universitario che ha vinto facili concorsi da assistente, associato e ordinario nell’Università pre-Gelmini, ed è poi andato in pensione dopo 38 anni e mezzo di servizio (e non dopo una sola legislatura in Parlamento).

Ma non sono questi i motivi per cui io ritengo che la collaborazione con lei si configuri come una colpa, nè penso affatto che il governo di cui lei fa parte sia da combattere a qualunque prezzo: riconosco anzi, benchè dispiaciuto e vergognato, che Silvio Berlusconi abbia ricevuto una forte maggioranza e sia dunque democraticamente in diritto di governare il paese. Addirittura, pensi un po’, vorrei che a farlo cadere fosse un giudizio elettorale sul suo operato politico, e non una campagna giornalistica sulle sue scopate con le escort: soprattutto quando questa campagna è spalleggiata dall’Avvenire, che ha usato ben altri pesi e misure per la pedofilia ecclesiastica e per la sua copertura da parte dell’allora cardinal Ratzinger. Il mio problema è proprio lei, signor ministro. E non tanto, o non solo, perchè ricopre una carica per la quale non ha la minima competenza, ma anzitutto e soprattutto per le innominabili motivazioni che hanno portato lei e la sua collega Mara Carfagna alla carica che ricoprite. Come vede, gli elettori che votano il suo partito o la sua coalizione non c’entrano proprio nulla, perchè non hanno eletto i ministri: c’entra invece la necessità etica di non collaborare con chi costituisce, nella Roma di oggi, l’analogo dei cavalli-senatori di Caligola nella Roma di ieri. Il professor Israel è naturalmente liberissimo di pensarla diversamente, ma lo sono anch’io di dissentire, e di non voler condividere con lui l’albo d’oro di un premio.

Se questa mia dissociazione vi turba, è perchè non conoscete nè la democrazia nè la storia, anche scientifica. Ad esempio, quando negli anni del maccartismo Edward Teller collaborò con la commissione governativa che revocò l’autorizzazione di sicurezza nucleare a Robert Oppenheimer, la quasi totalità dei colleghi si dissociò da lui e gli tolse il saluto, ostracizzandolo della comunità dei fisici: in quell’occasione avreste attaccato pure loro, come ora attaccate me? La domanda è retorica, ma l’esempio non è campato in aria: Teller era infatti uno scienziato guerrafondaio e iperconservatore, della stessa pasta del Von Neumann al quale Israel ha dedicato la compiacente biografia che ha appunto ricevuto il Premio Peano.

Ma ci sono altri motivi per dissociarsi da lui, oltre a quelli già accennati. Perchè, come ho detto espressamente nella mia lettera di rinuncia al premio, «le posizioni espresse da Israel in ambito politico, culturale e accademico sul suo blog, sul sito Informazione Corretta e in ripetuti interventi su Il Foglio e Il Giornale trascendono i limiti della normale dialettica, e si configurano come un pensiero fondamentalista col quale non intendo essere associato intellettualmente».

Capisco ovviamente che quei due giornali, insieme a Libero e all’ala destra del Corriere, si siano sentiti chiamati in causa e abbiano immediatamente fatto quadrato intorno a Israel e contro di me. Ma mi sembra singolare che proprio da loro, e da lei, vengano accuse di razzismo e di intolleranza: non siete forse voi, la vostra coalizione e il vostro governo, a fomentare l’odio nei confronti degli immigrati in generale, e degli islamici in particolare, con parole e azioni ben più violente della democratica e innocua restituzione di un premio al mittente?

Capisco anche, ma non accetto di giocarlo con voi, il subdolo gioco dell’equiparazione della critica a un ebreo come Israel, a un sito sionista come Informazione corretta, o a un governo israeliano come quello di Netanyau, con l’antisemitismo. E non lo accetto proprio perchè non sono razzista, e dunque non giudico a priori in base alla «razza» (ammesso che la parola abbia senso), ma a posteriori in base ai fatti: i razzisti veri sono altri, e cioè coloro per i quali tutti gli ebrei sono democratici, e tutti gli islamici fondamentalisti.

E invece ci sono ebrei fondamentalisti e islamici democratici : negarlo significa fare di ogni erba un fascio, e a me i fasci non piacciono, di qualunque «razza» siano. Mi piacciono invece molti ebrei democratici, da Amos Luzzatto a Moni Ovadia a Noam Chomsky, dei quali sono amico, e sto benissimo anche con ebrei ortodossi come il premio Nobel per l’economia Robert Aumann. Sono i fondamentalisti che non mi piacciono, e se questo significa non essere simpatico a certa gente, compresa lei, sopravviverò bene ugualmente. Anzi, molto meglio che se fossi simpatico a loro e a lei. di

Piergiorgio Odifreddi, da Il Fatto Quotidiano, 1 ottobre 2009.

(io e Odifreddi abbiamo ben poco da spartirci, ma la lettera va letta. Grazie a Mario per la segnalazione)

Minute Madness aka Twitter Madness. #ECDL 2009

This was the “Minute Madness” session, ran on Monday. Everyone had 1 minute to present his poster. I tweeted everything. 1 poster, 1 tweet.
#ecdl2009 Ok, Minute Madness. Everyone has 1 minute to speak. Here we go. I’ll try 1 tweet per each ;-).

#ecdl2009 Gateway to knowledge in DL. Knowledge building. Taggin tool.

#ecdl2009 Conceptual Discovery of Educational Resources through Learning Objectives. Semantic Web. Knowledge maps. Personal.

#ecdl2009 Data Recovery from Distributed Archives. Recovery after disaster, Provide means to organise files. Utilising context of objects.

#ecdl2009 Swedish school of LIS. Developing a DL master program (?? Like DILL ;-))

#ecdl2009 Digital preservation and Audio Heritage. Case study. photos of Ghosts + Alignment.

#ecdl2009 Gaining Access to decentralised something. Using Mobile phones. search for docs and get bus schedules. Integration of services.

#ecdl2009 Improving Annotations in Digital Documents. Wherea re annotations positioned?

#ecdl2009 Improving IR algorithm. Dynamic History Algorithm. Ultra-peer.

#ecdl2009 JSTOR. Data for Research. Discover. Visualize. Download. API. Completely free (really?!?)

#ecdl2009 Organizing learning objects for personalizing eLearning services. Problem of “one-size-fits-all”. Visual, kinesthetic, auditory.

#ecdl2009 Library of Congress. Digital preservation. Software platform. Born digital content. Acccess. Connecting. Creating. Community.

#ecdl2009 Searching archival finding aids: retrieval in Original Order? IR in DL. System evaluation.

#ecdl2009 Searching in a book. Book interface, but the content is digital.

#ecdl2009 Security iRODS Metadata Catalog for Digital Preservation. He speaks Portoguese!!

#ecdl2009 SyGAR Synthetic Data Generator for Evaluating Name Disambiguation Methods. Don’t understand.

#ecdl2009 iSCmap. Don’t understand.

#ecdl2009 Planets. Infrastructure for Digital preservation Acts. Interoperability. Formats. Migration. Preservation tools.

#ecdl2009 Thematic DL at University of Porto. Food & Nutrition. Fine Arts DL. Archive. Pics.

#ecdl2009 Workflow of a Digital mathematical Library. (coool!) math OCR. Migration. Coordination of librarians, tekkies, mathematicians.

#ecdl2009 Workspace narrative exploration. Problem of interruptions during digital workflow. Solution. History.

#ecdl2009 Visualization. Cool presentation. Feedback mechanism. To see!

#ecdl2009 Web-based Demo to Interactive something. Interactive Multimodal Transcription. Manuscript. User and system collaborate.

#ecdl2009 Tessella. Archive preservation. Safety Deposity Box: Active preservation.

#ecdl2009 ResCarta Foundation. Creating software for DL. For free. Coool!

#ecdl2009 DL of ancient manuscripts of Federico De Roberto. Data grid. iTunes.

#ecdl2009 InfoLitGlobal DL – New landscapes for Lifelong learning? New Information Literacy resource directory

#ecdl2009 Digital Mechanism and Gear Library. Mutimedia collection of texts, pics, physical models.

#ecdl2009 Geographic Information Retrieval. Google Earth. Map. ISTC database.

#ecdl2009 GROBID. Scholar articles. BibTeX. Term extraction. Controlled Terminology.

#ecdl2009 Hoppla – Digital preservation support for small institutions. Preservation solution. Archiving.

#ecdl2009 Metadata Schema Registry. (IEMSR). Schema (??)

#ecdl2009 User Interfaces for Querying in 3D architectural content. PROBADO3D. User interfaces. Repository.

#ecdl2009 REPOX framework for metadata interchange. XML. Metadata. OAI-PMH-

#ecdl2009 User interface for a geo-temporal search service. (???????!!??!)

#ecdl2009 Minute madness finished. Sorry for flooding ;-)

Digital Libraries as Phenotypes for Digital Societies, Gary Marchionini. #ECDL 2009

NOTE: Live-blogging. Getting things wrong. Missing points. Omitting key information. Introducing artificial choppiness. Over-emphasizing small matters. Paraphrasing badly. Not running a spellpchecker. Mangling other people’s ideas and words. Posted without re-reading. You are warned, people. (thanks for this, Dave!)

Gary Marchionini is professor in the School of Information ad Library Science.
His interests are related in Interfaces taht support seeking and IR.
What is most remarkable is his capacity to anticipate what the users need in the information seeking activities and his ability to face in advance most relevant scientific open problems, solving them in a timely and elegant way.

DL reflects who we are and what we value. Physical libraries are cathedral of knowledge,
learning and thus power. DLs give us a lens on what are we becoming in the digital age.
(Everything is recorded for Second Life as well. :-))

Digital Societies are determined by topic/interest rather than geography.
Depending on electronic infrastructure.
* Shared information resources
* Mass distribution and propagation of primary objects.
DS are driven by weak ties (ie blogs, fb, twitter VS families and friendship)
Extreme diversity.

Genotype: genetic constitution of an organism.
Phenotype: expression of genetic and environmental factors in observable charateristics.

Libraries are social organisms.
They have foundational missions and policies that reflect their institutional genetics.
Influenced by environmental conditions that affect their collections and services (phonotypes)
DL offer broader kinds of collections and services (different phenotypes)

DL responds to digital environment.

DL are active workspaces in which many stakeholders participate
* Multimedia streams rather than files/objects
* Systems exhibit behaviour (dinamic and interactive; computational, memorial)
* End user interactions: contributions; annotation/tags; crowd sourcing — these become part of the collection and must also be managed
People comment, react, react to commet and comment to reactions… and this too have to be managed.

Sharium workspace. DL are more like laboratories, rather than static libraries/archives.
Contribution: metadata or annotation or tag. DL is a platform to express yourself.
Various examples: http://valley.lib.virginia.edu — contributions solicited physically
http://arxiv.org — registered users, contributor responsability. Huge success.

http://ibiblio.org/index.htmlhttp://europeana.eu/portal/ — member established libraries, end user feedback (only), not active contribution from users.
Wikipedia: evolving policies (:-D) Example of the future, ina a way. Anybody can edit, total openness. Extremely rich resource, enormous amount of quality. Wikipedia has to adjust and evolve its policies.

Key challenges to DLs
Content and Context: Selection and Management
Preservation
Managing participation and Services

Content collection Genetics
– Born digital VS hybrids that evolved from traditional libraries
– Highly specialized colletions

Born digital variants: curated by expertise (Perseus), by expertise+opportunity (ICDL), user contributed with no curation (ibiblio), user contributed with community curation (Wikipedia), computed (CiteSeer).

Context
Not only the DL objets evolve, but also many layers of contexts evolve
Context is manifested through USE that is made harvestable by Cyberinfrastructure

Content, Metadata & Context: Boundaries?
Probably less than before. In real world, we have a content package, and inside the file/video. Not in the digital world.
As time goes on, the “packages” acquire lot of things (annotations, history, comments, usage, links).
Boundaries are more and more fuzzy.

Preservation is hot.
What is worth preserving?
Genes (genotypes) VS expressions (phenotypes)
Expertise VS long tail of inputs coming from the world. Those are really changing the world (Hail to Marchionini!! :-))
Example of metos and diet coke video. Why that is important? Worth preserving? Of course, is a media phenomenon, it’s important.
What context to include? This is the challenge. Future scholars will have to understand us.
Who decides?
Who pays?
Storage model (replication, migration, emulation). Interoperability issues, format issues, obsolescence.
Storage policies

Preservation challenges
In physics, there are petabytes per day.
Hollywood film: 2-10 pb, at least one per day created. The archival desiderata are 100 years. It cost 500$ per terabyte per year. Uh.
It’s mind-blowing.
New verification methods and cost (it’s impossible to read and verify exobytes…)
What about ephemera? Second Life, interactions, World of Worcrafts??

What about services?
Reference is the search engine and UI.
Question answering systems (Yahoo answers, Naver)
Patrons are no longer socially grounded in the library. They have multiple identities.
The digital tie is intrensically weak. In real life people hare linked with their physical libraries, in the net that DL is the same as every other DL.

Global reach of DLs also means full diversity of human experience (phenotypes). It’s not just language. the problems is not knowing your patrons (in a DL).

DL expertise

Subject expertise
canon
trends/opportunities

Technology expertise
storage model and trends, network models, costs and trends
upgrade, security

Policy expertise
license negotiation
open publishing standard trends
imprimatur management

DLibrarians are not just psycilogist, bibliophiles, tekkis. They have a broader sight and expertise.

DL Model Clash
Inside out: core is curated by expert stakeholders, content added with deliberation

Managing the Clash
parallel services
Distinct services qith referral
Integrated services with levels of Blessedness (expert and/or community curated, no curated at all)

Human-Machine Relationships
Symbiotic relationships with machines and extant data that no individual can collect alone.
Genomic databases
Gamma ray burst, cyclotron output
dance performance recordings
massivley parallel online games

We ALREADY trust machines with our lives (eg trasportation), why no on cultural heritage?

Personal and cultural Identituy

We are creating our identities also wit our bit streams (sensor streams, click streams, and personal histories), we are someone, maybe more than one,
also on the web. Therefore, a DL could have the problem to own and store our data. It recapitulates our personal networks. DLs can become trusted personal repositories.
– Implications for privacy
– Implications for identity

Projections+Reflections=Proflections. We don’t know about those. So many of them are below the surface.
Pros and cons of digital life on our real life. We feel good or birthday messages on Facebook, feel really bad for a message we sent to a list that was supposed to be intimate and for one person only. Real and virtual are really much blurred now.

Centralization is a traditional way to look at digital libraries. (but actually not…)

De Bibliotheca digitale, Google Book Search et Settlement/3

Non faccio neanche in tempo a scrivere un pezzo decente sul Google Books Settlement, che questi me lo bocciano subito  (se riesco, lo spiego lo stesso, anche perchè ancora non si sa cosa cambierà).

Grimmelmann commenta a caldo, ed è contento, pare che le cose vadano per il verso giusto (e il Department of Justice la pensa come lui su molti punti).

Perchè il GBS rimane un’opportunità enorme per il genere umano, ma con qualche modifica.
Il pericolo di un monopolio da parte di Google era serio, e sappiamo bene che quando si parla di Big G c’è poco da scherzare e molto da stare attenti.

In pratica, sembra che il DoJ statunitense abbia riconosciuto come legittime

  • le critiche antitrust mosse a Google dagli acerrimi competitori in questione, ovvero Amazon, Microsoft, Yahoo e Internet Archive.
  • le critiche delle associazioni di autori ed editori americani.

Il DoJ vuole infatti proteggere la competizione e garantire equità nei confronti dei detentori dei copyright. Allo stesso tempo, riconosce con forza i benefici pubblici del rendere accessibili milioni di libri ora irreperibili (perchè confinati in biblioteche e non più disponibili in libreria), del creare versioni accessibili per i disabili, dell’espandere le opzioni di distribuzioni dei libri.

Dunque, non si butta via tutto, ma si cerca di migliorare quello che non può essere tenuto.

Dettagli tecnici a parte (di cui io capisco pochissimo), la notizia sembra dunque buona: il Settlement così è scorretto ma sembra migliorabile.

C’è da sperare che Google continui a puntare con la stessa forza di prima sul progetto, ma accetti di contrattare per renderlo più libero e liberale, in modo da lasciare spazio ad altri nel di là da venire mercato dei libri digitali.

Speriamo.

PS: anche a voi fa un po’ specie il silenzio della blogosfera italica su argomenti come questo?