Lezione 11/12 - Linguistic Profiling

0.0(0)
Studied by 0 people
call kaiCall Kai
Locked
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/18

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 1:29 PM on 7/2/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai
Chat

No analytics yet

Send a link to your students to track their progress

19 Terms

1
New cards

Che cos’è il monitoraggio linguistico?

Un framework metodologico per l’indagine della variazione linguistica

2
New cards

Che cos’è Profiling-UD?

Uno strumento multilingue per il monitoraggio linguistico

3
New cards

Che cos’è l’MDA?

Introdotto da Douglas Biber, è un quadro di analisi multidimensionale. Si tratta di un approccio linguistico testuale per caratterizzare l’uso della lingua in contesti sociali e comunicativi attraverso l’analisi quantitativa e funzionale di modellli di co-occorrenza di caratteristiche linguistiche e dimensioni sottostanti del linguaggio

4
New cards

Come avviene la ricostruzione del profilo linguistico di un testo?

Mediante un ampio insieme di caratteristiche linguistiche che vengono estratte dall’output dei diversi livelli di annotazione automatica (tokenizzazione e sentence splitting, lemmatizzazione, analisi morfosintattica, analisi sintattica a dipendenze)

5
New cards

Che cos’è il type/token ratio?

Rapporto tra il numero delle occorrenze delle unità del vocabolario di un testo (al denominatore) con il numero di parole tipo (al numeratore)

6
New cards

Densità lessicale

Rapporto tra parole piene (ovvero portatrici di significato) e parole funzionali all’interno del testo. Calcolata come la proporzione delle parole sematicamente piene rispetto al totale delle occorrenze di parola all’interno del testo

7
New cards

Profondità dell’albero sintattico

Calcolata come la massima distanza che intercorre tra una foglia (rappresentata da parole del testo senza dipendenti) e la radice dell’albero. È espressa come numero di archi (ovvero relazioni di dipendenza) attraversati nel cammino foglia-radice

8
New cards

Profondità media delle “catene” di subordinazione

La ricorrenza di proposizioni subordinate ricorsivamente incassate

9
New cards

Lunghezza delle relazioni di dipendenza

Calcolata come la distanza in tokens tra la testa e il dipendente

10
New cards

Analisi Computazionale dei Registri (Argamon, 2019)

Caratterizzare generi e varietà di lingua dal punto di vista funzionale

11
New cards

Sociolinguistica Computazionale

Linea di ricerca emergente che integra metodi di sociolinguistica, linguistica computazionale e informatica per studiare la dimensione sociale del linguaggio e la variazione diastratica. Focus su comunicazione mediata dal computer a partire da testi generati da utenti su piattaforme online

12
New cards

Stilometria Computazionale

Analisi dello stile legata a compiti di authorship attribution/verificcation (Daelemans, 2013)

13
New cards

Studio e modellazione computazionale della complessità delle lingue naturali

Scenari applicativi quali la valutazione automatica della leggibilità dei testi, la semplificazione automatica (Collins-Thompson, 2014)

14
New cards

Quali sono i vantaggi della metodologia di linguistic profiling?

  • Annotazione del testo multi-livello

  • Condotta in relazione a corpora di vaste dimensioni

  • Basata su un’ampia gamma di tratti linguistici

15
New cards

Quali sono i limiti del linguistic profiling?

L’annotazione linguistica automatica include inevitabilmente un margine di errore, che varia a seconda del tipo di testo analizzato e del tipo di informazione linguistica considerata

16
New cards

Chi fonda il concetto di leggibilità?

Edgar Dale e Jeanne S. Chall nel 1949

17
New cards

Come si configuravano gli indici di leggibillità di prima generazione?

Come formule matematiche che calcolano la leggibilità di un testo sulla base di parametri “quantificabili” e facilmente trattabili computazionalmente, che fanno affidamento unicamente su caratteristiche generali e formali del testo (es. la lunghezza della parola in termini di sillabe, la lunghezza della frase in termini di token)

18
New cards

Che cos’è il GULP?

Gruppo Universitario Linguistico Pedagogico

19
New cards

In che cosa consiste l’AI readability paradigm?

  • Impiego di metodi all’avanguardia di NLP permettono di tenere conto di una vasta gamma di parametri linguistici

  • Impiego di modelli statistici del linguaggio acquisiti a partire da ampie quantità di dati permette di trovare interzione tra diversi parametri linguistici, connettere i parametri linguistici con diversi livelli di leggibilità e rintracciare nei dati parametri di complessità più avanzati

  • Sviluppo di modelli predittivi della complessità linguistica che permettono di misurare il livello di leggibilità di un testo