Questo blog non esiste

Esperimenti autoreferenziali di pensiero ortogonale

Tag: WMF

E’ vero che molti utenti rendono Wikipedia più neutrale?

Una cosa divertente che si dice di Wikipedia è che funziona in pratica ma non in teoria. E scoprire perchè funziona, scientificamente (do per assunto che sì, funziona, quindi se non siete d’accordo smettete pure qui) non è affatto semplice.
Di ricerche su Wikipedia se ne fanno tante, e l’oggetto di studio è oltremodo complesso (cosa guardiamo? il formarsi di una comunità? come interagisce? la distribuzione sessuale? l’obiettività degli articoli? come la misuriamo? ecc.). Il gruppo di ricerca della Wikimedia Foundation è ovviamente uno dei più attivi in materia, ma fa troppe cose per seguirle tutte (qui c’è l’archivio, se volete spulciare).

La questione della neutralità degli articoli, però, fa parte delle domande più importanti, perchè va al nocciolo della questione, che è capire perchè Wikipedia funziona, e come e quando scatta quella del crowdsourcing che chiamiamo “saggezza delle massa” (wisdom of the crowds)(PS: a proposito, leggete Reinventing Discovery, che è bellissimo e parla di tutto questo, però applicato alla scienza (e lì si chiama citizen science)).

Copioincollo un paragrafo dell’ultima newsletter, il resto lo trovate qui. Poi, se mi viene voglia e mi aiutate, magari recuperiamo anche ricerche pregresse sullo stesso argomento.

Given enough eyeballs, do articles become neutral?

Building on their previously reviewed research, Greenstein and Zhu ask[14] “will enough eyeballs eliminate or decrease the amount of bias when information is controversial, subjective, and unverifiable?” Their research calls this into question, by taking a statistical approach to measuring bias in Wikipedia articles about US political topics, which uses Linus’ Law (“Given enough eyeballs, all bugs are shallow”) as a null hypothesis.

They rely on a slant index previously developed for studying news media bias, which specifies certain code words as indicating Republican or Democratic bias. Within their sample of 28,382 articles relating to American politics, they find that the category and vintage of an article are most predictive of bias. “Topics of articles with the most Democrat words are civil rights, gun control, and homeland security. Those with the most Republican words are abortion, foreign policy, trade, tax reform, and taxation. … [T]he slant and bias are most pronounced for articles born in 2002 and 2003″. While they do not find a neutral point of view within each article or topic, across articles, Wikipedia balances Democratic and Republican points of view.

Yet answering “Why did Wikipedia become less biased over time?” is more challenging. They classify explanatory variables into three groups: attention and editing; dispersion of contributions; and article features. The narrow interpretation of Linus’ Law would make attention and editing the only relevant feature (not supported by their data), while a broader interpretation would also take dispersion into account (weak support from their data). While both the number of revisions and the number of editor usernames are statistically significant, they work in opposite directions. Pageviews, while also statistically significant, are unavailable before February 2007. They also suggest questions for further work, including improvements to their revision sampling (they “divide [each article's] revisions into ten revisions of equal length”) and overall sampling method (which uses the same techniques as their earlier work).

Wikiroba

Scrivo poco, ma diciamo che essere nel direttivo di Wikimedia Italia si ciuccia tutto il tempo che dedicavo al blog (il resto se lo piglia Wikisource e ahimè Misfits, The West Wing e pure Fringe).

In ordine sparso, dal wikimondo:

  • continua la raccolta fondi. Le cose vanno bene, pure troppo (le iscrizioni le devo gestire io assieme a Xaura e Dinwath (Dio li abbia in gloria) e ne abbiamo ricevute quasi 200)
  • se comunque volete donare, ricordate che lo donazioni sono deducibili. Le vostre donazioni saranno suddivise al 50% fra Wikimedia Italia e la Wikimedia Foundation
  • per l’occasione, Wikimedia Italia ha comprato uno spazio pubblicitario su Internazionale, e da domani gireranno a Milano vari autobus con un banner “fisico”

Ma basta parlare di soldi:

  • sono stato a Parigi, ad una conferenza su GLAM (Galleries, Libraries, Archives, Museums)  e mondo wiki. Vi avevo già detto qualcosa a riguardo, appena posso pubblico qualche appunto.
  • il 15 gennaio sarà il compleanno di Wikipedia, il decimo. Per l’occasione, volevamo fare qualcosa di carino. Dettagli appena possibile, voi iniziate a rimembrare com’era la vostra vita prima di Wikipedia.

E last but not least,

  • Wikileaks non c’entra nulla con Wikipedia (a prescindere da ogni opinione personale del sottoscritto).

Se va tutto bene, ci sentiamo presto.

Wikisource incontra la BnF

L’annuncio è di qualche mese fa, ma ora si iniziano a raccogliere i primi frutti.

Wikimedia France, chapter francese della Wikimedia Foundation, ha sottoscritto ad aprile un accordo nientemeno che con la Bibliothèque nationale de France per l’inserimento , su Commons e poi sulla Wikisource francese, di un migliaio di libri digitalizzati.

Infatti da anni la BnF gestisce Gallica, biblioteca digitale francese che è da sempre la pioniera della digitalizzazione (e che da sola fornisce metà dei contenuti al meta-aggregatore Europeana (e anche la maggior parte dei contenuti in italiano…)).
L’accordo

consentirà a tutti gli utenti di Internet, attraverso Wikisource, l’accesso alle trascrizioni
di opere di pubblico dominio da Gallica. In ultima analisi, è di 1400 testi
francesi che saranno integrati in Wikisource. (comunicato)

Il gioco è infatti semplice. La BnF digitalizza le opere che rilascia tramite formato immagine in Gallica, e utilizza software OCR per avere una pur abbozzata trascrizione. I ragazzi di WMFrance trasformano le immagini digitalizzate in libri djvu (formato diventato oramai standard per Wikisource) che caricano poi su Commons, l’archivio multimediale a cui tutti i progetti Wikimedia (quindi Wikipedia, Wikisource, Wikiquote) fanno riferimento.

Da lì, vengono poi creati, semi-automanticamente, gli indici dei libri veri e propri su Wikisource, dove la comunità inizierà a trascriverli e rileggerli.

Cosa ci guadagna la BnF in tutto ciò? La cosa che costa di più (in scala) in un processo di digitalizzazione, il proofreading. Infatti, l’OCR dei libri offre spesso risultati a dir poco insoddisfacenti (andate a farvi un giro su Google Books e cliccate “Solo testo” su un libro che abbia più di cinquant’anni per verificare…) e quindi la correzione, formattazione e rilettura dev’essere effettuata da umani. Si, proprio quelli in carne e ossa, spesso provenienti da paesi con moneta debole  pagamento come India o Mozambico. Ma ovviamente i costi sono rimangono alti, non c’è economia di scala.

Wikisource, come già il Project Gutemberg e da noi Liber Liber, è una biblitoeca digitale interamente gestita da volontari, ma diversamente da questi è un wiki che offre un modo semplice e totalmente orizzontale per contribuire alla rilettura e trascrizione dei testi (il link è ai libri della versione italiana).

Dunque l’accordo fra la BnF e Wikisource tenta un approccio di crowdsourcing volontario, che risulti vincente per entrambe le organizzazioni: la Biblioteca avrà infatti distribuito cultura ottenendo trascrizioni e riletture a costo zero, mentre Wikisource avrà guadagnato ottimo materiale e si spera attenzione per aumentare l’esigua comunità di volontari.

Infatti, l’unico punto debole del progetto è forse proprio questo: mentre le varie Wikipedie hanno mediamente comunità ampie e differenziate, i progetti Wikisource (in tutte le lingue) vanno avanti per una esiguo gruppetto di utenti molto attivi. Nonostante da tempo si speri che si raggiunga una fantomatica massa critica di utenti, questo non è ancora avvenuto, neanche per le source maggiori (tedesca, inglese e francese). Si spera che progetti come questo attirino rilettori volenterosi, per dimostrare vincente una scommessa davvero lodevole per un’istituzione gloriosa come la BnF.

Ovviamente la Wikisource italiana è a disposizione per iniziative analoghe.

Data la lungimiranza nel campo delle biblioteche digitali da parte del panorama italiano, siamo certi che le proposte non si faranno certo attendere. Noi aspettiamo pazienti.

Wikimedia wants you…

…per sapere cosa pensi/sai/te ne frega di Wikimedia Italia, Foundation e altre cosette.

Il brevissimo questionario qui.

Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.

Unisciti agli altri 1.103 follower

%d blogger cliccano Mi Piace per questo: