Paolo Monella Post-doc scholarship in Digital Humanities Accademia dei Lincei, Rome 2012

Some previous outlines of the talk

These are some tentative outlines of a talk that I delivered at the round table on Digital Philology L'Informatica Umanistica e i suoi problemi: l'edizione critica digitale dei testi. Speakers: Tito Orlandi, Raul Mordenti and Paolo Monella. Accademia dei Lincei, 20 June 2012, Rome (programme).

Further materials on my talk (slides etc.) are here.

During the talk (and in the related slides) I only covered sections A and B of version 2.3eng below).

Index:


Version 2.3eng

Where are the Digital Humanities today?

A. How much

Melissa Terras' infographic
	Mostly UK/US/CA

Displaying "The moment of DH"
	quantity
	mainstream
	institutionalisation

Issues
	where
	what
	how

B. Where

Big picture. Sources:
	M. Terras
	centerNet list
	centerNet big map

Focus on nations (both research and teaching). Sources:
	UK
		centerNet
		2 centres in LON
		terras
	USA
		centerNet
		survey http://www.clir.org/pubs/reports/pub143/contents.html
	Canada
		Rockwell (see link in Fiormonte/proposta)
		http://tapor.ualberta.ca/taporwiki/index.php/
		The_Academic_Capacity_of_the_Di-gital_Humanities_in_Canada

	France
		Aurélien Berra's post
		map 'DH francophone'

	Germany 
		DHd blog
		Cologne Center for eHumanities http://www.cceh.uni-koeln.de/node/11

	Italy
		centerNet
		Orlandi/Montevarchi (for centres)
		Fiormonte/appendice (n. 9 for teaching - check updates)
		Fiormonte/digitalvariants?
		myself?
		

Centres and infrastructures. Sources:
	Fiormonte/appendice (paragraph 2)
	my own list

C. What & how

C1. Orlandi's periodisation of DH history
1. pioneers (late '40s and '50s)
2. pioneer applications ('60s)
3. experimenting ('70s and '80s)
	Computing in the Humanities
	US, UK, EU
4. triumph of technology ('90s and 2000s)
	Digital Humanities
	US & UK; EU
	a. tools
		SGML, XML, TEI
		Unicode
		WWW and HTML
		Databases
		GIS
	b. products
		textual corpora
		Wikipedia
	c. institutions
		centres
		programmes
	d. discussion groups and conferences
C2. Methods, tools or products?
Context:
	Microsoft approach (digital tools to anyone)
	2000 digital bubble

Focus switch
	phase 3: Computing in the Humanities (focus on methods)
	phase 4: Digital Humanities (focus on application)

Job profiles: tension between 'digital' and 'humanities'
	analysts vs. developers
	best: humanists who can programme and produce tools
C3. The 'Microsoft approach': a computer to anyone (tools); or: the disappeareance of DH
The 'Microsoft' approach
	a. humanists who can programme create tools
		DH research through building
	b. these tools are given to unaware 'traditional'
	   humanists, 'users'
		application (testing)

Argument 1:
	all humanists will use DH tools
	when they'll become easier

Argument 2:
	DH will eventually disappear
	and coincide with the Humanities
	when all humanists will use digital tools prepared today
C4. [Is it DH or just digitally-assisted Humanities?]
[I might omit this section in my talk]

We all use MS Word
But we are not all DHers
	because MS World does not add up 
	any computational process to our research methods
	(only presentational features)
C5. [Why the 'Microsoft' approach can't work (today and tomorrow) or: what is DH]
[I probably should shorten up this section in my talk]

Fact: humanists don't use the DH tools today ('Microsoft' approach's failure).  Why?

1) Today, DH models are still under development.
   Some examples from a relatively well-developed field,
   digital philology:

	- simple multi-testimonial textual traditions
	  (Uncle Tom's Cabin edition)
	  	- XML-TEI Apparatus Criticus module
		- few additional technologies needed (Oxygen, web)
	
	- complex multi-testimonial textual traditions
	  (Medieval MSS, e. g. The Canterbury Tales Project)
	  	- XML-TEI Transcription of Primary Sources
		- but:
			- TEI limits (see Peter Robinson's
			  criticism of TEI)
			- additional technologies needed
			  (collate, DBs)
			- often DBs are used for internal use
			- Desmond Schmidt: models alternative to XML
			  for textual variance
			- TEI evolution (MSS interest group)

	- genetic editions
	  (Digital Variants, Proust, Faust, Baroness)
	  	- XML-TEI and Versioning Machine
		- but:
			- new models needed (Fiormonte and Schmidt)
			- TEI evolution (Elena Pierazzo,
			  genetic editions interest group)

	- Homer Multitext
		- importance of data architecture
		- CTS (Canonical Text Reference): the issue
		  of text alignment

	- edition of single manuscript
		- digital facsimiles
		- standard technology for text-image linking
		- XML-TEI Transcription of Primary Sources
		- but:
			- specific problems (es.: Malte Rehbein: an
			  evolving Medieval MS)

	- epigraphy
		- EpiDoc (XML-TEI)
		- but:
			- alternative models (EpiDoc vs.
			  EAGLE-Database)

	- papyrology
		- SoSOL
		- evolution of EpiDoc (XML-TEI)
		- but:
			- complex data architecture for
			  crowdsourcing
		
2) Tomorrow

	a. For some text categories (e. g. epigraphy above)
	   there will be standard models, therefore 'tools'
	   of the kind of the 'Microsoft' approach.
	   In those cases, I agree with argument 2: the mere
	   application won't be DH, but just digitally-assisted
	   Humanities

	b. But every textual category
	   and, in a way, every single textual tradition
	   requires the scholarly editor
	   (even in the print environment)
	   to create a specific model for it:
	   	- a model of the textual tradition
		- a model of the text that (s)he wants to publish
		- a model for his/her edition.
	  Thus the scholarly editor in the digital environment
	  must be able to 'tweak' the engine of the digital 'tool'
	  (s)he's adopting to adapt it.

	Two examples:
		- genetic edition: what if there is an author's
		  prose summary to align to the versions of a poem?
		- epigraphy: what if a text is both on stone and in
		  some MSS?

	Father Busa:
		DH is not making old things with new tools,
		nor making old things in a new way,
		but making new things.

	This is DH to me, and there will always be research to
	do in this field (as opposed to argument 2 above).
C6. Centres and peripheries
[Some graphics needed here]

Anglo-centrism
	UK & USA
	EU

Texto-centrism
	Text and Language
		Philology & Literature
			Editions
				One example per typology (see above)?
		Linguistics
			Academic
				Computational linguistics
					Ex.: Perseus (English)
				Corpus linguistics
					Ex.: ? (Pisa?)
			Corporate
				Data mining
					Ex.: Facebook
				Semantic Web
					Ex.: RDF vs. Microdata, or Pleiades
					     (Linked Open Data)
				Computer translation
					Ex.: Google Translate
	Other humanistic disciplines
		History
			Ex.: Monumenta Germaniae (or see Patrick's Sahle)
		Philosophy
			Ex.: ?
		Art History
			Ex.: digital museums?
		Archaeology
			Ex.: Silchester
		Jura (and Social Sciences)
			Ex.: Palazzolo's DB on ancient Jura

Neighbours
	Digital Humanities and Digital Social Sciences
	Digital Humanities and Media Studies
		differences:
			DH: active, little scale
				(creation of research methods)
			MS: passive, big scale
				(observation of social phenomena)
				Ex.: http://lexicalist.com/
		shared areas:
			the Digital Revolution
			"Hacking Academia" (active)

Project fever

	S. Ramsay: "On building"
	A. Prescott: "Project fever"
		project vs. process
		application vs. research
		centres vs. departments

	DH in the Anglo-American area:
		research ↑
			project ↑
				product ↑
				innovation ↓
			theory ↓
		teaching ↓

	Centres vs. departments
		project/product	→ centres
		theory/teaching	→ departments

Version 1.0eng

Where are the Digital Humanities today?

Version 1.0ita

L'informatica Umanistica nel mondo: esperienze in corso

I temi (ovviamente tutti collegati tra di loro) di cui mi sono occupato finora durante la mia borsa sono:

  1. "L'Informatica umanistica oggi": a che punto è la disciplina.
  2. "Rassegna": uno spoglio critico dei progetti di filologia digitale esistenti.
  3. "L'edizione critica digitale": questioni metodologiche.
  4. "Perché non ci sono edizioni critiche digitali di testi classici?": una provocazione e insieme una riflessione 'spassionata' su (se e) come l'edizione digitale possa effettivamente rispondere ai bisogni dei filologi che si occupano di tradizioni testuali pluritestimoniali.
  5. "Prototipo": il progetto, ancora in fase aurorale, di allestire effettivamente un'edizione critica digitale di un testo (latino classico) pluritestimoniale.

Il seguente schema della mia relazione riprende i punti principali del mio lavoro elencati sopra:

1. L'informatica umanistica oggi

- maggiore visibilità negli studi umanistici
	- MLA 2012: molti pannelli sulle "Digital Humanities"
- istituzionalizzazione
	- la fase attuale (2010-2012) come momento di
	  "istituzionalizzazione" della disciplina (nascono i
	  dipartimenti etc.)
	- enti finanziatori (vari in USA e UK; l'Unione Europea e i
	  singoli governi in Europa)
- disciplinarizzazione
	- dibattito sullo statuto della disciplina (volumi come "Debates
	  in the Digital Humanities", blog, conferenze etc.)
	- modi diversi di concepire la disciplina (strumenti da
	  applicare?
	  programmazione? teorizzazione?)
- questioni aperte
	- mondo anglosassone vs. approccio europeo
	- sperimentare tramite progetti o teorizzare? (vd. in parte la
	  dicotomia precedente)
	- le questioni messe in evidenza (in modo volutamente
	  'problematico', dicotomico) da Manfred Thaller nel programma
	  del suo "Cologne Dialoque on Digital Humanities" in
	  http://www.cceh.uni-koeln.de/events/CologneDialogue)

2. Rassegna

- (mi limiterò alla sola filologia/studi letterari digitali,
   escludendo archeologia, storia etc.)
- grandi infrastrutture (DARIAH, Europeana, associazioni,
  federazioni etc.)
- digitalizzazione 'di massa' (quantità): in crescita
	- libri (Google books etc.)
	- manoscritti (molti progetti)
	- testi (enormi archivi testuali online, spesso in TEI/XML)
- livelli più sofisticati di analisi testuale: non altrettanto
  maturi e diffusi
	- algoritmi (ad es. "topic analysis" per l'analisi del testo,
	  o le applicazioni della statistica alla distribuzione delle
	  varianti nei MSS)
	- markup testuale (markup dichiarativo sulla struttura del
	  testo, markup grammaticale, semantico etc.)
- valori veicolati dall'Informatica umanistica nel mondo della
  ricerca umanistica
	- Open Source e Open Access
	- standard, collaborazione, riuso dei materiali
	- "crowdsourcing": il modello "wiki"

N.B.: non parlerò dei punti 3. e 4. seguenti.

3. L'edizione (critica) digitale

- l'informatizzazione 'di massa' è semplice (bastano le tecnologie)
	- ma ci troviamo di fronte a moltissimi materiali con cui
	  possiamo fare poco
- la grande speranza degli anni '90 sulla diffusione
  dell'Informatica umanistica:
	- dare degli strumenti semplificati in mano a _tutti_ gli umanisti
		- un giorno tutti gli umanisti useranno strumenti digitali
			- e tutte le edizioni critiche saranno
			  digitali
		- ad es. la TEI (lite), o alcuni software
		- nessuna abilità tecnico-informatica 'hard core'
			  richiesta (ad es. saper programmare)
		- nessuna competenza sui _principi_ della
		  formalizzazione (vd. Orlandi) che servirebbero
		  per modellizzare in modo complesso prima di sperimentare
- questa speranza è fallita, in quanto:
	- non è vero, quindici anni dopo, che tutte le edizioni
	  critiche sono digitali
		- e lo stesso vale per altri ambiti di applicazione
	- molti progetti realizzati in passato senza una
	  modellizzazione adeguata sono ora inutili perché
		- l'implementazione originaria è decaduta (software,
		  sito web etc.)
		- il 'sorgente' è sotto licenza proprietaria
		- modellizzazione e codifica non erano adeguate
- cosa deve saper fare uno studioso di Informatica umanistica?
	- non programmare
	- ma modellizzare
		- cioè evidenziare le questioni _umanistiche_
		- porre quelle questioni in modo formale
		- vedere se sono formalizzabili/informatizzabili:
			- se è possibile
			- se risponde meglio a domande della
			  ricerca umanistica
			- se è più conveniente (costi/benefici)
- esempio: la rappresentazione digitale del testo di un manoscritto
	- grafemi, diasistemi, etc.
- chi può fare questo?
	- un umanista consapevole dei principi dell'informatica
		- non un programmatore
		- né un umanista che affidi tutta la 'parte
		  informatica' ad un 'tecnico'
- il concetto di 'engineering'
	- tra il fisico, che ricerca i principi
	- e il muratore, che costruisce
	- c'è l'ingegnere (vd. A. Liu in http://lenz.unl.edu/papers
	  /2011/01/11/on-building.html#comment-223113606)
	- l'ingegnere non costruisce case, ma crea il modello sulla
	base dei principi

4. "Perché non ci sono edizioni critiche digitali di testi classici?" (secondo esempio)

- la tecnologia per creare tali edizioni esiste dagli anni '90
	- ma non si sono fatte
- la questione è: perché farle? A quale questione umanistica
  rispondono (meglio delle altre)?
	- vd. i campi in cui vengono fatte (epigrafia, testi medievali
	  con varie versioni, varianti d'autore della letteratura
	  contemporanea etc.)
- tradizioni pluritestimoniali: vale la pena di farne edizioni
  critiche _digitali_?
	- vd. il mio post su
	  http://www.unipa.it/paolo.monella/lincei/why.html
- conclusione: cosa resta da fare al filologo digitale?
	- individuare questioni filologiche specifiche formalizzabili
	  (ad es. l'edizione in preparazione di Ateneo di Aurelien
	  Bérra: citazioni di altri testi)
	- chiedersi se c'è un problema nella modellizzazione (ad es.
	  TEI/XML) delle fonti primarie (MSS etc.)
		- dato che abbiamo edizioni o riproduzioni di MSS
		- e grandi corpora testuali
		- ma non abbiamo il collegamento tra di essi
		  (edizioni critiche digitali di tradizioni
		  pluritestimoniali)