Flashcards di Machine Learning

0.0(0)
Studied by 0 people
call kaiCall Kai
Locked
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/55

flashcard set

Earn XP

Description and Tags

Flashcard di ripasso basate sugli appunti del corso di Machine Learning riguardanti tipi di apprendimento, statistiche, architetture neurali e algoritmi di ottimizzazione.

Last updated 8:46 AM on 7/3/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai
Chat

No analytics yet

Send a link to your students to track their progress

56 Terms

1
New cards

Intelligenza Artificiale

Sistemi in grado di imitare il comportamento umano attraverso calcoli e algoritmi.

2
New cards

Machine Learning

Algoritmi capaci di apprendere dagli esempi senza la necessità di essere programmati specificamente per determinati compiti.

3
New cards

Deep Learning

Sottoinsieme del Machine Learning in cui le macchine apprendono la rappresentazione dei dati attraverso la composizione di funzioni.

4
New cards

Generative models

Modelli capaci di generare nuovi dati correlati a esempi passati.

5
New cards

Supervised Learning (Induttivo)

Tipo di apprendimento in cui i dati di addestramento contengono sia input che output desiderati.

6
New cards

Unsupervised Learning

Tipo di apprendimento in cui i dati di addestramento contengono solo input e il modello deve dedurre relazioni o raggruppamenti.

7
New cards

Semi-supervised Learning

Apprendimento in cui il training set include solo alcuni output desiderati tra i dati di input.

8
New cards

Reinforcement Learning

Modello che cerca di massimizzare una ricompensa PP derivante da una sequenza di azioni in risposta a determinati stati XX.

9
New cards

Regressione

Compito di apprendimento supervisionato in cui l'obiettivo è predire una funzione F(X)×in cui F(X)×appartiene a ×RF(X) \times \text{in cui } F(X) \times \text{appartiene a } \times \text{ℝ}.

10
New cards

Classificazione

Compito di apprendimento supervisionato in cui ogni campione appartiene a una ed una sola classe in un insieme finito H=h1,h2,×hnH = {h_1, h_2, \times \text{…, } h_n}.

11
New cards

Clustering

Obiettivo principale dell'Unsupervised Learning, che consiste nello scoprire relazioni intrinseche e raggruppamenti all'interno dei dati.

12
New cards

Variabile casuale discreta

Variabile associata a una Funzione di Massa di Probabilità (PMF) P:XRP: X \rightarrow \text{ℝ} in cui \times \text{∑} \times P(x_i) = 1.

13
New cards

Variabile casuale continua

Variabile che assume valori in un insieme continuo, associata a una Funzione di Densità di Probabilità (PDF) p(x)p(x) tale che \times \text{∫} \times p(x)dx = 1.

14
New cards

Valore atteso (discreto)

Somma pesata dei valori per la loro probabilità: \times \text{⌒}_x[f(x)] = \text{∑} P(x)f(x).

15
New cards

Valore atteso (continuo)

Integrale della funzione per la sua densità: \times \text{⌒}_x[f(x)] = \times \text{∫} \times p(x)f(x)dx.

16
New cards

Legge dei Grandi Numeri

Afferma che è possibile approssimare il valore atteso di una funzione mediante la media aritmetica su un numero elevato di campioni indipendenti: \times \text{lim}_{n \rightarrow \text{∞}} \frac{1}{n} \times \text{∑} \times f(x_i) = \text{⌒}_x[f(x)].

17
New cards

Batch Learning

Tecnica in cui l'algoritmo riceve in anticipo tutti i dati di addestramento e apprende in un'unica fase prima di quella operativa.

18
New cards

Incremental Learning

Evoluzione del Batch Learning in cui nuovi dati vengono periodicamente utilizzati per migliorare le prestazioni del modello già addestrato.

19
New cards

Natural / Lifelong Learning

Tipo di addestramento in cui il sistema riceve feedback in tempo reale durante la fase operativa per migliorare le prestazioni.

20
New cards

Dati categorici

Dati che rappresentano caratteristiche qualitative o appartenenza a insiemi finiti, spesso codificati tramite One-Hot Encoding.

21
New cards

One-Hot Encoding

Codifica per dati categorici in cui una scelta con kk valori distinti diventa un vettore con kk componenti, dove solo 1 bit è impostato a 1.

22
New cards

Spazio delle ipotesi

La famiglia di tutte le funzioni ottenibili variando i parametri θ\theta all'interno di un particolare algoritmo di Machine Learning.

23
New cards

Funzione di perdita (Loss function)

Misura ×L(θ,Train)×che quantifica quanto le previsioni del modello differiscono dai dati reali\times L(\theta, \text{Train}) \times \text{che quantifica quanto le previsioni del modello differiscono dai dati reali}.

24
New cards

Overfitting

Fenomeno in cui un modello troppo complesso si adatta eccessivamente ai dati di addestramento (compreso il rumore), perdendo capacità di generalizzazione.

25
New cards

Errore di Bias

Errore causato da assunzioni errate nell'algoritmo, come l'incapacità dello spazio delle ipotesi di contenere la funzione target.

26
New cards

Errore di Varianza

Errore dovuto alla sensibilità del modello alle piccole fluttuazioni nel set di addestramento.

27
New cards

Teorema No Free Lunch

Teorema che afferma che, a priori, nessun algoritmo di apprendimento è migliore di un altro se valutato su tutte le possibili distribuzioni di dati.

28
New cards

Generalizzazione

La capacità di un algoritmo di mantenere prestazioni simili sia sul training set che su dati nuovi e mai visti in precedenza.

29
New cards

K-fold cross validation

Tecnica che divide i dati in kk sottoinsiemi, usando alternativamente ogni parte come test set per ottenere una stima stabile della performance.

30
New cards

Dataset Augmentation

Pratica di espandere il training set applicando trasformazioni casuali (come riflesso, ridimensionamento, rotazione) che non alterano il significato dell'input.

31
New cards

Regolarizzazione di Tikhonov (L2)

Aggiunta alla funzione di perdita di un termine proporzionale alla somma dei quadrati dei parametri: R(\theta) = \text{∑} a_i^2.

32
New cards

Accuracy

Rapporto tra il numero di campioni correttamente classificati e il totale dei campioni: NcorrectNtotal\frac{N_{correct}}{N_{total}}.

33
New cards

Confusion Matrix (Matrice di classificazione)

Tabella che mostra il numero effettivo di campioni per ogni combinazione di classe vera e classe assegnata dal sistema.

34
New cards

Precisione

Rapporto tra veri positivi e il totale dei campioni classificati come positivi: TPTP+FP\frac{TP}{TP + FP}.

35
New cards

Recall (Recupero)

Rapporto tra veri positivi e il totale dei campioni effettivamente positivi: TPTP+FN\frac{TP}{TP + FN}.

36
New cards

F1-score

Media armonica tra precisione e recall, utile per bilanciare le due metriche in un unico valore: 2×Precision×RecallPrecision+Recall2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}.

37
New cards

Curva ROC (Receiver Operating Characteristic)

Grafico che rappresenta la relazione tra il tasso dei veri positivi (TP rate) e quello dei falsi positivi (FP rate) al variare della soglia τ\tau.

38
New cards

Neurone di McCulloch & Pitts (1943)

Primo modello di neurone artificiale composto da ingressi pesati, bias e una funzione di attivazione a gradino (step function).

39
New cards

Percettrone di Rosenblatt (1956)

Evoluzione del neurone artificiale che introduce un algoritmo di addestramento supervisionato per aggiornare i pesi in base agli errori.

40
New cards

Regola di aggiornamento del percettrone

Formula per modificare i pesi: wiwi+r×(tjyj)×xjiw_i \rightarrow w_i + r \times (t_j - y_j) \times x_{ji}.

41
New cards

Problema XOR

Famoso limite del singolo percettrone, che non è in grado di risolvere problemi non linearmente separabili.

42
New cards

Architettura Feed-forward

Configurazione di rete neurale in cui i neuroni sono organizzati in strati (input, hidden, output) e i collegamenti vanno solo in avanti.

43
New cards

MLP (Multi-Layer Perceptron)

Rete neurale feed-forward con almeno uno strato nascosto e funzioni di attivazione non lineari.

44
New cards

Teorema dell'Approssimazione Universale

Afferma che una MLP con un solo hidden layer può approssimare qualsiasi funzione continua con precisione arbitraria.

45
New cards

Gradient Descent (Discesa del gradiente)

Algoritmo iterativo per minimizzare la Loss seguendo la direzione opposta del gradiente: wwη×L(w)w \rightarrow w - \text{η} \times \nabla L(w).

46
New cards

Backpropagation

Algoritmo introdotto nel 1986 che permette di addestrare reti profonde propagando l'errore dall'output all'input tramite la regola della catena (chain rule).

47
New cards

Stochastic Gradient Descent (SGD)

Metodo che approssima il gradiente totale calcolandolo su un singolo campione o su un piccolo gruppo di esempi chiamato mini-batch.

48
New cards

Epoca (Epoch)

Un passaggio completo dell'algoritmo di addestramento su tutti gli esempi presenti nel dataset di training.

49
New cards

Early stopping

Tecnica di regolarizzazione che consiste nell'interrompere l'addestramento quando l'errore sul set di validazione inizia ad aumentare per evitare l'overfitting.

50
New cards

Momentum

Tecnica che accelera la discesa del gradiente e riduce le oscillazioni accumulando una parte della direzione del passo precedente.

51
New cards

Funzione Sigmoide (σ)

Funzione di attivazione a curva ad S che restituisce valori in (0,1)(0, 1): σ(net)=11+enet\text{σ}(net) = \frac{1}{1 + e^{-net}}.

52
New cards

Derivata della Sigmoide

Espressione matematica cruciale per il backpropagation: σ(net)×(1σ(net))\text{σ}(net) \times (1 - \text{σ}(net)) con valore massimo pari a 0.25.

53
New cards

Tangente iperbolica (tanh)

Funzione di attivazione centrata in 0 che restituisce valori in (1,1)(-1, 1), permettendo un apprendimento spesso più veloce rispetto alla sigmoide.

54
New cards

MSE (Mean Square Error)

Funzione di perdita per la regressione che calcola la media dei quadrati delle differenze tra target e output.

55
New cards

Binary Cross-Entropy (BCE)

Funzione di perdita ideale per la classificazione binaria: L=[t×log(y)+(1t)×log(1y)]L = -[t \times \text{log}(y) + (1 - t) \times \text{log}(1 - y)].

56
New cards

Saturazione del gradiente

Problema che si verifica con la sigmoide quando l'input è molto grande o molto piccolo, rendendo la derivata prossima allo zero e bloccando l'apprendimento.