Scarica il pdf
1) Cos'è l'apprendimento automatico?
L'apprendimento automatico è una branca dell'informatica che si occupa di programmazione di sistema al fine di apprendere e migliorare automaticamente con l'esperienza. Ad esempio: i robot sono programmati in modo da poter eseguire l'attività in base ai dati raccolti dai sensori. Apprende automaticamente i programmi dai dati.
2) Citi la differenza tra data mining e machine learning?
L'apprendimento automatico si riferisce allo studio, alla progettazione e allo sviluppo degli algoritmi che danno ai computer la capacità di apprendere senza essere programmati esplicitamente. Mentre, il data mining può essere definito come il processo in cui i dati non strutturati cercano di estrarre conoscenza o modelli interessanti sconosciuti. Durante questa macchina di processo, vengono utilizzati algoritmi di apprendimento.
3) Che cos'è l'overfitting nel machine learning?
Nell'apprendimento automatico, quando un modello statistico descrive errori o rumori casuali invece della relazione sottostante, si verifica un "overfitting". Quando un modello è eccessivamente complesso, normalmente si osserva overfitting, a causa di troppi parametri rispetto al numero di tipi di dati di addestramento. Il modello mostra scarse prestazioni che sono state sovradimensionate.
4) Perché si verifica l'overfitting?
Esiste la possibilità di overfitting in quanto i criteri utilizzati per la formazione del modello non coincidono con i criteri utilizzati per giudicare l'efficacia di un modello.
5) Come evitare l'overfitting?
Utilizzando molti dati, l'overfitting può essere evitato, l'overfitting avviene relativamente poiché si dispone di un piccolo set di dati e si cerca di imparare da esso. Ma se hai un piccolo database e sei costretto a venire con un modello basato su quello. In tale situazione, è possibile utilizzare una tecnica nota come convalida incrociata . In questo metodo il set di dati si divide in due sezioni, set di dati di test e di addestramento, il set di dati di test testerà solo il modello mentre, nel set di dati di addestramento, i punti di dati verranno con il modello.
In questa tecnica, a un modello viene solitamente assegnato un set di dati di dati noti su cui viene eseguito l'addestramento (set di dati di addestramento) e un set di dati di dati sconosciuti rispetto al quale viene testato il modello. L'idea della validazione incrociata è quella di definire un dataset per “testare” il modello in fase di training.
6) Cos'è l'apprendimento automatico induttivo?
L'apprendimento automatico induttivo coinvolge il processo di apprendimento per esempi, in cui un sistema, da un insieme di istanze osservate, cerca di indurre una regola generale.
7) Quali sono i cinque algoritmi popolari di Machine Learning?
- Alberi decisionali
- Reti neurali (propagazione posteriore)
- Reti probabilistiche
- Il vicino più prossimo
- Supporta macchine vettoriali
8) Quali sono le diverse tecniche di algoritmo nell'apprendimento automatico?
I diversi tipi di tecniche in Machine Learning sono
- Apprendimento supervisionato
- Apprendimento senza supervisione
- Apprendimento semi-supervisionato
- Insegnamento rafforzativo
- Trasduzione
- Imparare a imparare
9) Quali sono le tre fasi per costruire le ipotesi o il modello in machine learning?
- Modellismo
- Test del modello
- Applicare il modello
10) Qual è l'approccio standard all'apprendimento supervisionato?
L'approccio standard all'apprendimento supervisionato consiste nel dividere l'insieme di esempi in insieme di formazione e test.
11) Che cosa sono "Set di allenamento" e "Set di prova"?
In varie aree della scienza dell'informazione come l'apprendimento automatico, viene utilizzato un set di dati per scoprire la relazione potenzialmente predittiva nota come "Training Set". Il set di formazione è un esempio fornito allo studente, mentre il set di test viene utilizzato per testare l'accuratezza delle ipotesi generate dallo studente ed è l'insieme di esempi trattenuto dallo studente. Il set di addestramento è diverso dal set di test.
12) Elencare i vari approcci per l'apprendimento automatico?
I diversi approcci all'apprendimento automatico sono
- Apprendimento del concetto e della classificazione
- Apprendimento simbolico vs statistico
- Apprendimento induttivo e analitico
13) Cosa non è il machine learning?
- Intelligenza artificiale
- Inferenza basata su regole
14) Spiegare qual è la funzione dell '"apprendimento senza supervisione"?
- Trova cluster di dati
- Trova rappresentazioni a bassa dimensione dei dati
- Trova indicazioni interessanti nei dati
- Coordinate e correlazioni interessanti
- Trova nuove osservazioni / pulizia del database
15) Spiegare qual è la funzione dell '"apprendimento supervisionato"?
- Classificazioni
- Riconoscimento vocale
- Regressione
- Prevedere le serie temporali
- Annota le stringhe
16) Cos'è l'apprendimento automatico indipendente dall'algoritmo?
L'apprendimento automatico in cui i fondamenti matematici è indipendente da un particolare classificatore o algoritmo di apprendimento viene indicato come apprendimento automatico indipendente dall'algoritmo?
17) Qual è la differenza tra apprendimento artificiale e apprendimento automatico?
La progettazione e lo sviluppo di algoritmi in base ai comportamenti basati su dati empirici sono noti come Machine Learning. Sebbene l'intelligenza artificiale oltre all'apprendimento automatico, copre anche altri aspetti come la rappresentazione della conoscenza, l'elaborazione del linguaggio naturale, la pianificazione, la robotica, ecc.
18) Cos'è il classificatore nell'apprendimento automatico?
Un classificatore in un Machine Learning è un sistema che immette un vettore di valori di elementi discreti o continui e restituisce un singolo valore discreto, la classe.
19) Quali sono i vantaggi di Naive Bayes?
In Naïve Bayes il classificatore converge più rapidamente dei modelli discriminatori come la regressione logistica, quindi hai bisogno di meno dati di addestramento. Il vantaggio principale è che non può apprendere le interazioni tra le funzionalità.
20) In quali aree viene utilizzato il Pattern Recognition?
Pattern Recognition può essere utilizzato in
- Visione computerizzata
- Riconoscimento vocale
- Estrazione dei dati
- Statistiche
- Recupero informale
- Bioinformatica
21) Cos'è la programmazione genetica?
La programmazione genetica è una delle due tecniche utilizzate nell'apprendimento automatico. Il modello si basa sul test e sulla selezione della scelta migliore tra una serie di risultati.
22) Che cos'è la programmazione logica induttiva nell'apprendimento automatico?
La programmazione logica induttiva (ILP) è un sottocampo dell'apprendimento automatico che utilizza la programmazione logica che rappresenta la conoscenza di base e gli esempi.
23) Che cos'è la selezione del modello nel machine learning?
Il processo di selezione dei modelli tra diversi modelli matematici, che vengono utilizzati per descrivere lo stesso set di dati, è noto come selezione del modello. La selezione del modello viene applicata ai campi della statistica, dell'apprendimento automatico e del data mining.
24) Quali sono i due metodi utilizzati per la calibrazione in Apprendimento supervisionato?
I due metodi utilizzati per prevedere buone probabilità nell'apprendimento supervisionato sono
- Platt Calibration
- Regressione isotonica
Questi metodi sono progettati per la classificazione binaria e non è banale.
25) Quale metodo viene utilizzato di frequente per prevenire l'overfitting?
Quando sono disponibili dati sufficienti, viene utilizzata la "regressione isotonica" per prevenire un problema di overfitting.
26) Qual è la differenza tra l'euristica per l'apprendimento delle regole e l'euristica per gli alberi decisionali?
La differenza è che l'euristica per gli alberi decisionali valuta la qualità media di un numero di insiemi disgiunti mentre gli apprendenti di regole valutano solo la qualità dell'insieme di istanze che è coperto dalla regola candidata.
27) Cos'è Perceptron nell'apprendimento automatico?
In Machine Learning, Perceptron è un algoritmo per la classificazione supervisionata dell'input in uno dei numerosi possibili output non binari.
28) Spiegare le due componenti del programma di logica bayesiana?
Il programma di logica bayesiana è costituito da due componenti. Il primo componente è logico; consiste in un insieme di clausole bayesiane, che cattura la struttura qualitativa del dominio. Il secondo componente è quantitativo, codifica le informazioni quantitative sul dominio.
29) Cosa sono le reti bayesiane (BN)?
La rete bayesiana viene utilizzata per rappresentare il modello grafico per la relazione di probabilità tra un insieme di variabili.
30) Perché l'algoritmo di apprendimento basato sull'istanza a volte indicato come algoritmo di apprendimento pigro?
L'algoritmo di apprendimento basato sull'istanza viene anche definito algoritmo di apprendimento pigro poiché ritarda il processo di induzione o generalizzazione fino all'esecuzione della classificazione.
31) Quali sono i due metodi di classificazione che SVM (Support Vector Machine) può gestire?
- Combinazione di classificatori binari
- Modifica binario per incorporare l'apprendimento multiclasse
32) Cos'è l'apprendimento d'insieme?
Per risolvere un particolare programma di calcolo, più modelli come classificatori o esperti vengono generati e combinati strategicamente. Questo processo è noto come apprendimento dell'insieme.
33) Perché viene utilizzato l'apprendimento d'insieme?
L'apprendimento dell'insieme viene utilizzato per migliorare la classificazione, la previsione, l'approssimazione di funzioni, ecc. Di un modello.
34) Quando utilizzare l'apprendimento d'insieme?
L'apprendimento dell'insieme viene utilizzato quando si creano classificatori di componenti più accurati e indipendenti l'uno dall'altro.
35) Quali sono i due paradigmi dei metodi d'insieme?
I due paradigmi dei metodi d'insieme sono
- Metodi sequenziali dell'insieme
- Metodi di ensemble paralleli
36) Qual è il principio generale di un metodo ensemble e cosa significa insaccare e potenziare nel metodo ensemble?
Il principio generale di un metodo di insieme è quello di combinare le previsioni di diversi modelli costruiti con un dato algoritmo di apprendimento al fine di migliorare la robustezza su un singolo modello. L'insacco è un metodo in insieme per migliorare la stima instabile o gli schemi di classificazione. Mentre il metodo boosting viene utilizzato in sequenza per ridurre il bias del modello combinato. Il potenziamento e l'insacco possono entrambi ridurre gli errori riducendo il termine di varianza.
37) Che cos'è la scomposizione bias-varianza dell'errore di classificazione nel metodo dell'insieme?
L'errore atteso di un algoritmo di apprendimento può essere scomposto in bias e varianza. Un termine bias misura quanto il classificatore medio prodotto dall'algoritmo di apprendimento corrisponde alla funzione di destinazione. Il termine varianza misura la fluttuazione della previsione dell'algoritmo di apprendimento per i diversi set di addestramento.
38) Che cos'è un algoritmo di apprendimento incrementale in ensemble?
Il metodo di apprendimento incrementale è la capacità di un algoritmo di apprendere da nuovi dati che potrebbero essere disponibili dopo che il classificatore è già stato generato da un set di dati già disponibile.
39) A cosa servono PCA, KPCA e ICA?
PCA (Principal Components Analysis), KPCA (Kernel based Principal Component Analysis) e ICA (Independent Component Analysis) sono importanti tecniche di estrazione delle caratteristiche utilizzate per la riduzione della dimensionalità.
40) Che cos'è la riduzione delle dimensioni nel Machine Learning?
Nell'apprendimento automatico e nelle statistiche, la riduzione delle dimensioni è il processo di riduzione del numero di variabili casuali in considerazione e può essere suddiviso in selezione di caratteristiche ed estrazione di caratteristiche.
41) Cosa sono le macchine a vettori di supporto?
Le macchine vettoriali di supporto sono algoritmi di apprendimento supervisionato utilizzati per la classificazione e l'analisi di regressione.
42) Quali sono i componenti delle tecniche di valutazione relazionale?
Le componenti importanti delle tecniche di valutazione relazionale sono
- Acquisizione dei dati
- Acquisizione della verità fondamentale
- Tecnica di convalida incrociata
- Tipo di query
- Metrica del punteggio
- Test di significatività
43) Quali sono i diversi metodi per l'apprendimento sequenziale supervisionato?
I diversi metodi per risolvere i problemi di apprendimento supervisionato sequenziale sono
- Metodi a finestra scorrevole
- Finestre scorrevoli ricorrenti
- Modelli di Markow nascosti
- Modelli di Markow con entropia massima
- Campi casuali condizionali
- Reti di trasformatori a grafo
44) Quali sono le aree della robotica e dell'elaborazione delle informazioni in cui si pone il problema della previsione sequenziale?
Le aree della robotica e dell'elaborazione delle informazioni in cui si pone il problema della previsione sequenziale sono
- Apprendimento dell'imitazione
- Previsione strutturata
- Apprendimento per rinforzo basato su modelli
45) Cos'è l'apprendimento statistico in batch?
Le tecniche di apprendimento statistico consentono di apprendere una funzione o un predittore da un insieme di dati osservati che possono fare previsioni su dati invisibili o futuri. Queste tecniche forniscono garanzie sulle prestazioni del predittore appreso sui dati futuri invisibili sulla base di un'ipotesi statistica sul processo di generazione dei dati.
46) Che cos'è l'apprendimento PAC?
L'apprendimento PAC (Probably Approximately Correct) è un framework di apprendimento che è stato introdotto per analizzare gli algoritmi di apprendimento e la loro efficienza statistica.
47) Quali sono le diverse categorie che puoi classificare nel processo di apprendimento in sequenza?
- Previsione della sequenza
- Generazione di sequenze
- Riconoscimento delle sequenze
- Decisione sequenziale
48) Cos'è l'apprendimento in sequenza?
L'apprendimento in sequenza è un metodo di insegnamento e apprendimento in modo logico.
49) Quali sono due tecniche di Machine Learning?
Le due tecniche di Machine Learning sono
- Programmazione genetica
- Apprendimento induttivo
Il motore di raccomandazione implementato dai principali siti di e-commerce utilizza l'apprendimento automatico.