skip to Main Content
LETTURE LENTE - rubrica mensile di approfondimento
Nei futuri piani di intervento del governo sulle imprese culturali, sarà opportuno incentivare l’innovazione nella gestione dei dati, per rendere accessibili i benefici che possono derivare da applicazioni dell’intelligenza artificiale

Piero Attanasio

 

© Photo by Perfecto Capucine on Unsplash

DATI E METADATI NELL’INDUSTRIA LIBRARIA

Un lettore entra in una libreria indipendente di una cittadina siciliana e acquista tre libri editi da tre diversi editori. Entro una settimana ciascuno dei tre editori riceverà la notizia che quel suo libro è stato acquistato in quella libreria, il che gli consentirà di sapere che non sarà reso e – se lo stesso titolo sta vendendo molte copie – di anticipare una ristampa. Accade grazie a un sistema che ha compiuto 20 anni nel 2020 (Arianna di Informazioni Editoriali), ma lo stesso accade nella gran parte dei paesi sviluppati. La raccolta di così tanti dati (ogni anno sono circa 250 milioni di ordini, bolle di consegna, risposte agli ordini, dati di sell-out) può esistere perché il mondo del libro gestisce accuratamente in digitale i metadati bibliografici e commerciali sulla base di standard internazionali.

Questa infrastruttura digitale di informazioni ha fatto sì, prima negli USA poi nel resto del mondo, che il commercio elettronico partisse proprio dal libro. Non esistevano altri settori, a metà degli anni Novanta, nelle stesse condizioni.

Sono quindi decenni che l’editoria libraria utilizza metadati per ottimizzare la filiera distributiva e per produrre dati che consentono di migliorare la comprensione del mercato e, per questa via, accrescerne l’efficienza. Ma cosa si intende per metadati? È utile la definizione che li descrive come “la relazione che una persona asserisce esistere tra due entità” [1], il che pone l’accento su due elementi: la relazione e la persona che la qualifica in modo standardizzato.

I metadati sono a loro volta generati da eventi: la creazione, l’edizione, la traduzione, l’illustrazione, la soggettazione, ecc. Torniamo allora all’evento da cui siamo partiti: “un lettore compra tre libri”. Esso è significativo della soluzione di continuità indotta dall’accresciuta capacità di calcolo che fa diventare small le quantità sopra citate a fronte dei big-data tipici dell’economia attuale. L’evento, in sé semplice nell’ottica tradizionale, può generare una serie di ulteriori relazioni:

  • tra il lettore e ciascuno dei libri acquistati;
  • tra i tre libri acquistati nel medesimo evento;
  • tra la libreria e ciascuno dei tre libri venduti;
  • tra la libreria e il lettore che la frequenta…

A loro volta, il lettore, la libreria e i tre libri sono (o possono essere) descritti da metadati che moltiplicano le relazioni. Ad esempio, se sappiamo che il lettore è un ventottenne maschio laureato, cittadino italiano, residente a Roma, ecc., l’evento genera relazioni tra ciascuna delle sue caratteristiche e i tre libri, e con le caratteristiche di ciascuno dei libri (es.: il primo è un giallo tradotto dallo svedese, dell’autore X, edito dall’editore Y, di 208 pagine…).

Poiché ciascuna di queste relazioni rappresenta un dato utile per analizzare il mercato, la quantità di informazioni da gestire è superiore di diversi ordini di grandezza a quanto consideravamo enorme pochi anni fa. Le tecnologie oggi consentono di gestire queste quantità. È quanto sta accadendo, producendo una doppia cesura qualitativa. La prima riguarda il passaggio da uno schema in cui la gestione dei metadati, compilati da persone, è la base per generare dati utili alla comprensione del mercato, a una situazione in cui i dati sono generati da eventi di mercato, tramite algoritmi. Il caso più noto è quello dei sistemi di raccomandazione dei negozi online. Abbiamo assistito negli ultimi anni alla sostituzione della funzione di “ricerca avanzata”, dove l’utente ha un ruolo attivo, con i consigli basati su “Chi ha acquistato questo articolo ha acquistato anche…” [2], il che implica il rischio di conformismo simile alle filter bubbles denunciate per i social media e i motori di ricerca [3]. La seconda cesura è nella possibilità di creare metadati direttamente da analisi computazionali di testi o comportamenti d’uso, cosicché la “persona” che “asserisce” esistere una relazione tra due entità, di cui alla citata definizione, può essere un algoritmo, ad esempio per la generazione di parole chiave di un testo.

OPPORTUNITÀ E MINACCE

Le tecnologie non sono mai neutrali, offrono opportunità, nascondono minacce. Le opportunità sono tutte nell’occasione di fare un passo ulteriore nell’utilizzo dei dati per comprendere meglio la lettura, rendere più efficiente il mercato – e quindi anche più eco-sostenibile [4] – e servire più efficacemente i lettori. Quanto ciò sarebbe prezioso per il libraio e i tre editori della nostra storia! E quanto aumenterebbe il valore per ciascuno degli attori coinvolti se fossero disponibili analoghi dati sui libri presi in prestito in biblioteca o le recensioni pubblicate sui social dallo stesso lettore e così via.

Le minacce dipendono dalla distribuzione dei dati tra gli operatori. La letteratura economica sul tema è ampia. Le grandi piattaforme web hanno un punto di forza nella capacità di fare previsioni di vario genere, e i dati sono la benzina di queste previsioni [5]. Le piattaforme utilizzano questa asimmetria informativa per migliorare la qualità dei propri servizi, interagire meglio con i propri utenti, e quindi attrarne un maggior numero [6], instaurando un circolo vizioso che produce posizioni monopolistiche utilizzabili per massimizzare i profitti, nel lungo periodo a spese degli utenti [7].

Il ruolo della politica è esattamente nel mezzo tra le opportunità e le minacce. Il Regolamento UE noto come DMA – Digital Markets Act [8], approvato di recente e in vigore dal 2023, mostra una piena consapevolezza del tema. Nel descrivere le sue basi, in introduzione si sottolinea che il controllo dei dati è una delle caratteristiche delle grandi piattaforme web (Cons. 2), che possono “sfruttare i vantaggi acquisiti in un settore di attività […] in un altro settore” (Cons. 3) e allo stesso tempo limitare “la contendibilità di tali servizi e dei relativi ecosistemi” (Cons. 32).

Il DMA interviene in modo innovativo con una politica attiva per favorire la concorrenza, nella consapevolezza che i rimedi ex post dell’antitrust arrivano spesso quando il danno è divenuto irreversibile. Le piattaforme che devono sottostare alle nuove regole sono quelle identificate come “gatekeeper” in uno o più mercati [9]. Questi hanno il divieto di sfruttare i dati generati dalle attività dei propri partner commerciali sulla piattaforma per ottenerne vantaggi a favore dei propri servizi e, dall’altro lato, devono fornire “a titolo gratuito agli utenti commerciali […], su richiesta, un accesso efficace, di elevata qualità, continuo e in tempo reale a dati aggregati e non aggregati, compresi i dati personali, e garantire alle stesse condizioni l’uso di tali dati” (art. 6, par. 10).

Si tratta di una “democratizzazione” dell’economia dei dati finalizzata a un impatto sui futuri equilibri competitivi del settore del libro (e non solo) e sulla cultura della concorrenza e della condivisione dei dati. Sarà opportuno, nei futuri piani di intervento del governo sulle imprese culturali, incentivare l’innovazione nella gestione dei dati, giacché limitare il potere di mercato dei gatekeeper può risultare vano se i big data che diverranno disponibili nei settori culturali resteranno in tanti piccoli silos così da rendere non accessibili i benefici che possono derivare da applicazioni dell’intelligenza artificiale.

Nel mercato del libro italiano il gatekeeper Amazon ha raggiunto una quota stimabile solo in modo approssimativo (il mercato è opaco per l’assenza dei dati del maggiore operatore) attorno al 35% e quasi nulla si sa di cosa stia accadendo nei mercati e-book e audiolibri, dove Amazon ha posizioni ancor più rilevanti. Un esempio chiaro di quanto fosse necessaria l’innovazione in questo ambito.

L’attuazione del Regolamento è affidata alla Commissione europea. Tuttavia, gli Stati membri hanno importanti funzioni consultive, possono segnalare situazioni critiche, fornire dati, richiedere indagini di mercato. Alla vigilia di una nuova legislatura, il rapporto tra economia dei dati e industrie culturali è un ambito non secondario su cui si potrà valutare l’efficacia dell’azione di governo nel difendere la pluralità di offerta e gli interessi delle imprese culturali del Paese.

NOTE E RIFERIMENTI BIBLIOGRAFICI

[1] Cfr. Rust G., Bide M. (2000). The indecs Framework – Principles, Model and Data Dictionary. https://www.doi.org/factsheets/indecs_factsheet.html.

[2] Copio la formula dal sito Amazon, da cui l’uso del termine “articolo”, invece che “libro”.

[3] L’idea che ciò possa creare una “bolla di libri” fa venire in mente, per contrasto, una domanda / slogan di Alessandra Berardi Arrigoni: “Quanta energia c’è in una pila di libri?”©. Energia di certo assente in una bolla.

[4] La possibilità per i librai di rendere i libri che restano invenduti è un fattore importante dell’economia del settore ma anche un danno per l’ambiente ogni volta che i libri viaggiano dai magazzini editoriali alle librerie solo per intraprendere in seguito il percorso inverso.

[5] Calvano E. and Polo M. (2020) Market Power, Competition and Innovation in Digital Markets: A Survey, Information Economics and Policy, Vol. 54, 100853, https://doi.org/10.1016/j.infoecopol.2020.100853.

[6] Fast V., Schnurr D. and Wohlfarth M. (2021), Regulation of Data-driven Market Power in the Digital Economy: Business Value Creation and Competitive Advantages from Big Data (January 31, 2021). Available at SSRN: http://dx.doi.org/10.2139/ssrn.3759664.

[7] Cfr. Ad esempio l’analisi di B. Martens (2020), An Economic Perspective on Data and Platform Market Power, JRC Digital Economy Working Paper 2020-09. Le origini e gli effetti di lungo periodo delle asimmetrie informative sono ben illustrate in A. Nicita, Il mercato delle verità, Il Mulino 2021.

[8] Regolamento 2022/1925 del 14 settembre 2022 relativo a mercati equi e contendibili nel settore digitale e che modifica le direttive (UE) 2019/1937 e (UE) 2020/1828 (regolamento sui mercati digitali).

[9] Secondo la definizione dell’art. 3 un gatekeeper (termine utilizzato anche nel testo italiano) è tale se ha “(a) un impatto significativo sul mercato interno; (b) fornisce un servizio di piattaforma di base che costituisce un punto di accesso (gateway) importante affinché gli utenti commerciali raggiungano gli utenti finali; e (c) detiene una posizione consolidata e duratura, nell’ambito delle proprie attività, o è prevedibile che acquisisca siffatta posizione nel prossimo futuro”. Si tiene conto quindi di elementi quantitativi (la dimensione economica e per numero di utilizzatori della piattaforma) e qualitativi (la capacità di fungere da punto d’accesso privilegiato nel rapporto tra imprese e consumatori).

 

Piero Attanasio, economista, lavora in editoria dal 1986. Nel 1996 è entrato in AIE – Associazione Italiana Editori, dove è oggi responsabile per i rapporti istituzionali, la R&S e l’editoria universitaria. Ha ricoperto cariche nei board dei principali enti internazionali di gestione degli standard internazionali, quali Editeur, IDF e ISBN International, che ha presieduto dal 2006 al 2012. È consigliere d’amministrazione della Fondazione LIA e membro del Copyright Policy Working Group dell’International Publishers Association. È docente nel master per l’editoria dell’Università di Milano e autore di numerose pubblicazioni sull’impatto delle tecnologie sul settore librario e sulla gestione dei diritti d’autore in ambienti digitali.

ABSTRACT

Book publishing is featured by an excellent infrastructure to deal with product information, which in mid 90ies resulted in e-commerce being born in the book industry. Moving this infrastructure towards big-data is today a core challenge for the industry. Technologies open new opportunities for publishers, booksellers, and librarians to use data to better understand readers’ needs, but also bring threats, due to the concentration in the control of data, typical of the network economy of the web. Public policy acts in the space between threats and opportunities. The regulation known as Digital Markets Act, issued by the European Union in 2022, provides innovative rules that oblige “gatekeepers” to share data with their business users. The effective applications of these rules, coupled by measures to support SMEs in the creative industries to fully seize the new opportunities, will be crucial for building a level playing field in the European cultural industry.

 

Clicca qui e leggi gli altri articoli della sezione “ERA DIGITALE” di LETTURE LENTE

Piero Attanasio

Piero Attanasio

Piero Attanasio, economista, lavora in editoria dal 1986. Nel 1996 è entrato in AIE - Associazione Italiana Editori, dove è oggi responsabile per i rapporti istituzionali, la R&S e l’editoria universitaria. Ha ricoperto cariche nei board dei principali enti internazionali di gestione degli standard internazionali, quali Editeur, IDF e ISBN International, che ha presieduto dal 2006 al 2012. È consigliere d’amministrazione della Fondazione LIA e membro del Copyright Policy Working Group dell’International Publishers Association. È docente nel master per l’editoria dell’Università di Milano e autore di numerose pubblicazioni sull’impatto delle tecnologie sul settore librario e sulla gestione dei diritti d’autore in ambienti digitali.

Back To Top