Contea Principesca di Gorizia e Gradisca, 1873-1914: creazione e analisi di un corpus digitale di periodici nel loro contesto storico
DOI:
https://doi.org/10.6092/issn.2283-9364/10365Parole chiave:
biblioteche digitali, giornali, periodici, digitalizzazioneAbstract
Le biblioteche digitali consentono non soltanto di migliorare la conservazione dei documenti e di facilitarne l’accesso da parte degli utenti, ma anche di sperimentare nuovi metodi; ad esempio è possibile esaminare in tempi ridotti le relazioni statistiche tra i contenuti di migliaia di documenti, operazione pressoché inaccessibile ai metodi tradizionali. Il passaggio chiave resta quello della conversione dal supporto analogico, carta o microfilm, a quello digitale, includendo la trasformazione delle immagini del testo stampato in testo digitale: solo così è possibile analizzare statisticamente quei testi, analisi che del resto non può prescindere dal contesto storico della loro produzione e da altre fonti. In questo articolo, descriviamo in dettaglio il processo di creazione di un corpus digitale formato dai giornali italiani pubblicati a Gorizia tra il 1873 e il 1914. Questo include la digitalizzazione, l’estrazione del testo editabile, il processo di annotazione e l’analisi statistica delle risultanti serie temporali. I dati così ottenuti vengono comparati con un corpus di giornali sloveni stampati nella stessa città e nello stesso periodo, già digitalizzati dalla Biblioteca Nazionale Slovena. L’analisi delle 47.466 pagine di giornali italiani ci consente di dimostrare il tipo di informazioni che possono essere estratte da un corpus digitale, evidenziando l’importanza di operare all’interno di un contesto storico e comparativo. Questo esempio di umanistica digitale plurilinguistica ci consente di individuare le tracce statistiche di profonde transizioni culturali che hanno avuto luogo in un’area geografica e un periodo storico molto complessi, il cui studio non può prescindere da una particolare attenzione alle trasformazioni culturali, tecnologiche e sociali.
Riferimenti bibliografici
Aiden - Michel 2013 = Erez Aiden - Jean-Baptiste Michel, Uncharted: big data as a lens on human culture, New York, Riverhead Books, 2013.
Agostinetti 1981 = Nino Agostinetti, L’attività dei cattolici isontini nel primo ventennio del Novecento, in I cattolici isontini nel XX Secolo, v. 1, Dalla Fine dell’800 al 1918, Gorizia, Le Casse Rurali e Artigiane della Contea di Gorizia, 1981.
Busa 1980 = Roberto Busa, The annals of humanities computing: the index thomisiticus, «Computers and the Humanities», 14 (1980).
Busa 1992 = Roberto Busa, Half a century of literary computing: towards a “new” philology, «Historical Social Research / Historische Sozialforschung », vol. 17 (1992), n. 2, p. 124-133.
Cavazza 2001 = Silvano Cavazza, Gorizia e il territorio: considerazioni intorno al millenario goriziano, «Il Territorio», 16 (2001), 2, p. 3-12.
De Claricini 1873 = Alessandro de Claricini, Gorizia nelle sue istituzioni e nella sua azienda comunale durante il triennio 1869-1871: ricordo del podestà Alessandro nob. de Claricini ai diletti suoi concittadini, Gorizia, Tip. Seitz, 1873.
De Grassi 1982 = Marino de Grassi, Catalogo dei periodici stampati o editi nella Contea di Gorizia e Gradisca conservati nelle biblioteche pubbliche isontine 1774-1918, «Studi Goriziani», 55-56 (1982), p. 51-104.
De Simone 1996 = Giuliana de Simone, Catalogo dei periodici posseduti in microfilm dalla Biblioteca statale isontina, «Studi Goriziani», 84 (1986), p. 131-144.
De Simone 2019 = Giuliana De Simone, Il Progetto Google Books alla BSI, «Studi Goriziani», 112 (2019), p. 52-56.
Dzogang et al. 2017 = Fabon Dzogang - Thomas Lansdall-Welfare - FMPN Team - Nello Cristianini, Discovering periodic patterns in historical news, «PloS one», 11 (2017) <https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0165736>.
Dzogang et al. 2018 = Fabon Dzogang - Stafford Lightman - Nello Cristianini, Diurnal variations of psychometric indicators in Twitter content, «PloS one», 13 (2018) <https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0197002>.
Fabi 1991 = Lucio Fabi, Storia di Gorizia, Padova, Il Poligrafo, 1991.
Feresin 2007-2008 = Vanni Feresin, Fra Settecento e Novecento : la stampa a Gorizia, «Isonzo Soča», 75-76, (2007-08), p. 14-21.
Ferrari 2002 = Liliana Ferrari, Gorizia Ottocentesca, fallimento del progetto della Nizza Austriaca, in Storia d’Italia. Le regioni dall’Unità ad oggi, v. 1, Il Friuli Venezia Giulia, a cura di Roberto Finzi, Claudio Magris, Giovanni Miccoli, Torino, Einaudi, 2002, pp. 313-375.
Filipi 2010 = Igor Filipi, Stepišnik in Sveta Brata Ciril in Metod, «Bogoslovni vestnik», 70, n. 1 (2010), p. 83-93.
Flaounas et al. 2010 = Ilias Flaounas - Marco Turchi - Omar Ali - Nick Fyson - Tijl De Bie - Nick Mosdell - Justin Lewis - Nello Cristianini, The Structure of EU Mediasphere, «PloS one», 12 (2010) <https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0014243>.
Flaounas et al. 2012 = Ilias Flaounas - Omar Ali - Thomas Lansdall-Welfare - Tijl De Bie - Nick Mosdell - Justin Lewis - Nello Cristianini, Research methods in the age of digital journalism, «Digital Journalism», 1 (2012-2013) <https://www.tandfonline.com/doi/full/10.1080/21670811.2012.
>.
Fogel Elton 1984 = Robert Fogel - Geoffrey Elton, Which road to the past? Two views of history, New Haven, Yale University Press, 1984.
Franzosi 2010 = Roberto Franzosi, Quantitative narrative analysis, Thousand Oaks, SAGE, 2010.
Franzosi 2011 = Roberto Franzosi, On quantitative narrative analysis, in James A. Holstein - Jaber F. Gubrium, Varieties of narrative analysis, Thousand Oaks, SAGE, 2011.
Franzosi et al. 2012 = Roberto Franzosi - Gianluca De Fazio - Stefania Vicari, Ways of measuring agency: an application of quantitative narrative analysis to lynchings in Georgia (1875-1930), «Sociological Methodology», 42, n. 1 (2012) <https://journals.sagepub.com/doi/abs/10.1177/0081175012462370?journalCode=smxa>.
Franzosi 2017 = Roberto Franzosi, A third road to the past? Historical scholarship in the age of big data, «Historical Methods: A Journal of Quantitative and Interdisciplinary History», 50, n. 4 (2017) <https://www.tandfonline.com/doi/abs/10.1080/01615440.2017.1361879>.
Gorian 2010 = Rudj Gorian, Gazzetta Goriziana Editoria e informazione a Gorizia nel Settecento, Trieste, Deputazione di storia patria per la Venezia Giulia, 2010.
Graham Milligan Weingart 2015 = Shawn Graham - Ian Milligan - Scott Weingart, Exploring Big Historical Data: The Historian’s Macroscope, London, Imperial College Press, 2015.
Horel 2015 = Catherine Horel, Austria-Hungary 1867-1914, in Robert Justin Goldstein - Andrew M. Nedd, Political Censorship of the Visual Arts in Nineteenth-Century Europe, Basingstoke, Palgrave Macmillan, 2015.
Jerele et al. 2011 = Ines Jerele - Tomaž Erjavec - Daša Pokorn - Alenka Kavčič-Čolić, Optical character recognition of historical texts: end-user focused research for Slovenian books and newspapers from the 18th and 19th century, in 6th SEEDI Conference: Proceedings 16-20 May 2011, Zagreb, Croatia.
Jia et al. 2016 = Sen Jia - Thomas Lansdall-Welfare - Saatviga Sudhahar - Cynthia Carter - Nello Cristianini, Women are seen more than heard in online newspapers, «PloS one», 11 (2016) <https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0148434>.
Kacin-Wohinz - Troha 2000 = Milica Kacin-Wohinz - Nevenka Troha (a cura di), Slovensko-italijanski odnosi 1880-1956. Poročilo slovensko-italijanske zgodovinsko-kulturne komisije / Rapporti italo-sloveni 1880-1956. Relazione della commissione storico-culturale italo-slovena / Slovene-Italian relations 1880-1956. Report of the Slovenian-Italian historical and cultural commission, Lubiana, Nova revija, 2000.
Kalc 2013 = Alks Kalc, Vidiki razvoja prebivalstva Goriške-Gradiške v 19. stoletju in do prve svetovne vojne / Some aspects of the demographic development in Goriška-Gradiška from early 19th century to WWI, «Acta Histriae», 421 (2013) <https://www.dlib.si/details/URN:NBN:SI:-DOC-F2SZUWYI>.
Kirsch 2014 = Adam Kirsch, Technology Is Taking Over English Departments, 2014 <https://newrepublic.com/article/117428/limits-digital-humanities-
adam-kirsch>.
Lansdall-Welfare et al. 2014 = Thomas Lansdall-Welfare - Saatviga Sudhahar - Giuseppe Veltri - Nello Cristianini, On the Coverage of Science in the Media: A Big Data Study on the Impact of the Fukushima Disaster, in Proceedings of the 2014 IEEE International Conference on Big Data, New York, 2014. p. 60-66.
Lansdall-Welfare et al. 2017a = Thomas Lansdall-Welfare - Saatviga Sudhahar - James Thompson - Justin Lewis - FindMyPast Newspaper
Team - Nello Cristianini, Content analysis of 150 years of British periodicals, «Proceedings of the National Academy of Sciences», 114-4, 2017 <https://www.pnas.org/content/114/4/E457>.
Lansdall-Welfare et al. 2017b = Thomas Lansdall-Welfare - Saatviga Sudhahar - James Thompson - Nello Cristianini, The Actors of History: Narrative Network Analysis Reveals the Institutions of Power in British Society Between 1800-1950, International Symposium on Intelligent Data Analysis, Cham, Springer, p. 186-197.
Lansdall-Welfare - Cristianini 2017 = Thomas Lansdall-Welfare - Nello Cristianini, History Playground: A Tool for Discovering Temporal Trends in Massive Textual Corpora, arXiv preprint, 04-06 (2017).
Marušič, B. 2005 = Pregled politične zgodovine Slovencev na Goriškem (1848-1899), Nova Gorica, Goriški Muzej, 2005.
Medeot 1981 = Camillo Medeot, Panorama Politico, in I Cattolici Isontini nel XX Secolo, v. 1, Dalla Fine dell’800 al 1918, Gorizia, Le Casse Rurali e Artigiane della Contea di Gorizia, 1981.
Michel et al. 2011 = Jean-Baptiste Michel - Yuan Kui Shen - Aviva Presser Aiden - Adrian Veres - Matthew K. Gray - The Google Books Team - Joseph P. Pickett - Dale Hoiberg - Dan Clancy - Peter Norvig - Jon Orwant - Steven Pinker - Martin A. Nowak - Erez Lieberman Aiden, Quantitative analysis of culture using millions of digitized books, «Science», 331-6014 (2011), p. 176-182.
Mlakar - Turel 2010 = Liliana Mlakar - Annalisa Turel, Storia di Gorizia, Pordenone, Biblioteca dell’immagine, 2010.
Moretti 2013 = Franco Moretti, Distant Reading, London,Verso, 2013.
Nicholson 2012 = Bob Nicholson, Counting culture; or, how to read Victorian newspapers from a distance, «Journal of Victorian Culture», 172 (2012), p. 238-246.
Petzholdt 1853 = Julius Petzholdt, Handbuch deutscher Bibliotheken, Halle, H. W. Schmidt, 1853.
Redivo 2005 = Diego Redivo, Le trincee della Nazione: cultura e politica della Lega Nazionale 1891-2004, Trieste, Edizioni degli Ignoranti Saggi, 2005.
Spampinato 2018 = Daria Spampinato, Prefazione in Settimo Convegno Annuale AIUCD 2018 Bari, 31 gennaio-2 febbraio 2018 Book of Abstracts, Bari-Bologna, Associazione per l’Informatica Umanistica e la Cultura Digitale, 2018.
Sudhahar et al. 2015 = Saatviga Sudhahar - Gianluca de Fazio - Roberto Franzosi - Nello Cristianini, Network analysis of narrative content in large corpora, «Natural Language Engineering», 32, n. 1 (2013) <https://www.cambridge.org/core/journals/natural-language-engineering/article/network-analysis-of-narrative-content-in-large-corpora/7B1FFB891E8B
B2AE46FCF76C1>.
Sudhahar - Cristianini 2018 = Saatviga Sudhahar - Nello Cristianini, Detecting Shifts in Public Opinion: A Big Data Study of Global News Content, in Advances in Intelligent Data Analysis XVII. IDA 2018. Lecture Notes in Computer Science, vol 11191, edited by Wouter Duivesteijn, Arno Siebes, Antti Ukkonen, Springer, 2018.
Von Czoernig 1987 = Carl von Czoernig, Gorizia, la Nizza austriaca, Cassa di risparmio di Gorizia, 1987, (tit. orig.: Görz: Oesterreich’s Nizza: nebst einer Darstellung des Landes Görz und Gradisca, Braumüller, 1873-74).
Downloads
Pubblicato
Come citare
Fascicolo
Sezione
Licenza
Copyright (c) 2019 Nello Cristianini, Thomas Lansdall-Welfare, Gaetano Dato, Marco Menato
A partire dal V. 10 n. 2 (2021) la rivista è rilasciata sotto una licenza Creative Commons Attribuzione 4.0 Internazionale (codice legale completo).
I precedenti fascicoli, dal V. 1 n. 1-2 (2012) al V. 10 n. 1 (2021), sono rilasciati sotto una licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0 Unported (codice legale completo).