Lezione 11/12 - Linguistic Profiling

0.0(0)

Studied by 0 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/18

There's no tags or description

Looks like no tags are added yet.

Last updated 1:29 PM on 7/2/26

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai	Chat

No analytics yet

Send a link to your students to track their progress

19 Terms

New cards

Che cos’è il monitoraggio linguistico?

Un framework metodologico per l’indagine della variazione linguistica

New cards

Che cos’è Profiling-UD?

Uno strumento multilingue per il monitoraggio linguistico

New cards

Che cos’è l’MDA?

Introdotto da Douglas Biber, è un quadro di analisi multidimensionale. Si tratta di un approccio linguistico testuale per caratterizzare l’uso della lingua in contesti sociali e comunicativi attraverso l’analisi quantitativa e funzionale di modellli di co-occorrenza di caratteristiche linguistiche e dimensioni sottostanti del linguaggio

New cards

Come avviene la ricostruzione del profilo linguistico di un testo?

Mediante un ampio insieme di caratteristiche linguistiche che vengono estratte dall’output dei diversi livelli di annotazione automatica (tokenizzazione e sentence splitting, lemmatizzazione, analisi morfosintattica, analisi sintattica a dipendenze)

New cards

Che cos’è il type/token ratio?

Rapporto tra il numero delle occorrenze delle unità del vocabolario di un testo (al denominatore) con il numero di parole tipo (al numeratore)

New cards

Densità lessicale

Rapporto tra parole piene (ovvero portatrici di significato) e parole funzionali all’interno del testo. Calcolata come la proporzione delle parole sematicamente piene rispetto al totale delle occorrenze di parola all’interno del testo

New cards

Profondità dell’albero sintattico

Calcolata come la massima distanza che intercorre tra una foglia (rappresentata da parole del testo senza dipendenti) e la radice dell’albero. È espressa come numero di archi (ovvero relazioni di dipendenza) attraversati nel cammino foglia-radice

New cards

Profondità media delle “catene” di subordinazione

La ricorrenza di proposizioni subordinate ricorsivamente incassate

New cards

Lunghezza delle relazioni di dipendenza

Calcolata come la distanza in tokens tra la testa e il dipendente

New cards

Analisi Computazionale dei Registri (Argamon, 2019)

Caratterizzare generi e varietà di lingua dal punto di vista funzionale

New cards

Sociolinguistica Computazionale

Linea di ricerca emergente che integra metodi di sociolinguistica, linguistica computazionale e informatica per studiare la dimensione sociale del linguaggio e la variazione diastratica. Focus su comunicazione mediata dal computer a partire da testi generati da utenti su piattaforme online

New cards

Stilometria Computazionale

Analisi dello stile legata a compiti di authorship attribution/verificcation (Daelemans, 2013)

New cards

Studio e modellazione computazionale della complessità delle lingue naturali

Scenari applicativi quali la valutazione automatica della leggibilità dei testi, la semplificazione automatica (Collins-Thompson, 2014)

New cards

Quali sono i vantaggi della metodologia di linguistic profiling?

Annotazione del testo multi-livello
Condotta in relazione a corpora di vaste dimensioni
Basata su un’ampia gamma di tratti linguistici

New cards

Quali sono i limiti del linguistic profiling?

L’annotazione linguistica automatica include inevitabilmente un margine di errore, che varia a seconda del tipo di testo analizzato e del tipo di informazione linguistica considerata

New cards

Chi fonda il concetto di leggibilità?

Edgar Dale e Jeanne S. Chall nel 1949

New cards

Come si configuravano gli indici di leggibillità di prima generazione?

Come formule matematiche che calcolano la leggibilità di un testo sulla base di parametri “quantificabili” e facilmente trattabili computazionalmente, che fanno affidamento unicamente su caratteristiche generali e formali del testo (es. la lunghezza della parola in termini di sillabe, la lunghezza della frase in termini di token)

New cards

Che cos’è il GULP?

Gruppo Universitario Linguistico Pedagogico

New cards

In che cosa consiste l’AI readability paradigm?

Impiego di metodi all’avanguardia di NLP permettono di tenere conto di una vasta gamma di parametri linguistici
Impiego di modelli statistici del linguaggio acquisiti a partire da ampie quantità di dati permette di trovare interzione tra diversi parametri linguistici, connettere i parametri linguistici con diversi livelli di leggibilità e rintracciare nei dati parametri di complessità più avanzati
Sviluppo di modelli predittivi della complessità linguistica che permettono di misurare il livello di leggibilità di un testo