Apprendimento supervisionato e non supervisionato: differenze chiave

Sommario:

Anonim

Cos'è l'apprendimento automatico supervisionato?

In Apprendimento supervisionato, addestrate la macchina utilizzando dati che sono ben "etichettati ". Significa che alcuni dati sono già contrassegnati con la risposta corretta. Può essere paragonato all'apprendimento che avviene in presenza di un supervisore o di un insegnante.

Un algoritmo di apprendimento supervisionato apprende dai dati di addestramento etichettati, aiuta a prevedere i risultati per i dati imprevisti. Creare, scalare e distribuire con successo un accurato modello di data science per l'apprendimento automatico supervisionato richiede tempo e competenze tecniche da parte di un team di data scientist altamente qualificati. Inoltre, il data scientist deve ricostruire i modelli per assicurarsi che le informazioni fornite rimangano vere fino a quando i dati non cambiano.

In questo tutorial imparerai

  • Cos'è l'apprendimento automatico supervisionato?
  • Cos'è l'apprendimento senza supervisione?
  • Perché l'apprendimento supervisionato?
  • Perché l'apprendimento senza supervisione?
  • Come funziona l'apprendimento supervisionato?
  • Come funziona l'apprendimento senza supervisione?
  • Tipi di tecniche di machine learning con supervisione
  • Tipi di tecniche di apprendimento automatico senza supervisione
  • Apprendimento supervisionato e non supervisionato

Cos'è l'apprendimento senza supervisione?

L'apprendimento senza supervisione è una tecnica di apprendimento automatico, in cui non è necessario supervisionare il modello. Invece, è necessario consentire al modello di lavorare da solo per scoprire le informazioni. Si occupa principalmente dei dati non etichettati.

Gli algoritmi di apprendimento senza supervisione consentono di eseguire attività di elaborazione più complesse rispetto all'apprendimento supervisionato. Tuttavia, l'apprendimento senza supervisione può essere più imprevedibile rispetto ad altri metodi di apprendimento profondo e di rinforzo dell'apprendimento naturale.

Perché l'apprendimento supervisionato?

  • L'apprendimento supervisionato consente di raccogliere dati o produrre un output di dati dall'esperienza precedente.
  • Ti aiuta a ottimizzare i criteri di prestazione utilizzando l'esperienza
  • L'apprendimento automatico supervisionato ti aiuta a risolvere vari tipi di problemi di calcolo del mondo reale.

Perché l'apprendimento senza supervisione?

Ecco i motivi principali per utilizzare l'apprendimento non supervisionato:

  • L'apprendimento automatico senza supervisione rileva tutti i tipi di pattern sconosciuti nei dati.
  • I metodi non supervisionati aiutano a trovare le caratteristiche che possono essere utili per la categorizzazione.
  • Si svolge in tempo reale, quindi tutti i dati di input devono essere analizzati ed etichettati in presenza dei discenti.
  • È più facile ottenere dati senza etichetta da un computer che dati etichettati, che richiedono un intervento manuale.

Come funziona l'apprendimento supervisionato?

Ad esempio, vuoi addestrare una macchina per aiutarti a prevedere quanto tempo ti ci vorrà per tornare a casa dal tuo posto di lavoro. Qui, inizi creando un insieme di dati etichettati. Questi dati includono

  • Condizioni meteo
  • Ora del giorno
  • Vacanze

Tutti questi dettagli sono i tuoi input. L'output è la quantità di tempo necessaria per tornare a casa in quel giorno specifico.

Istintivamente sai che se fuori piove, ti ci vorrà più tempo per tornare a casa. Ma la macchina ha bisogno di dati e statistiche.

Vediamo ora come sviluppare un modello di apprendimento supervisionato di questo esempio che aiuti l'utente a determinare il tempo di percorrenza. La prima cosa che devi creare è un set di dati di addestramento. Questo set di allenamento conterrà il tempo totale del tragitto giornaliero e fattori corrispondenti come meteo, tempo, ecc. In base a questo set di allenamento, la tua macchina potrebbe vedere che c'è una relazione diretta tra la quantità di pioggia e il tempo che impiegherai per tornare a casa.

Quindi, accerta che più piove, più tempo dovrai guidare per tornare a casa tua. Potrebbe anche vedere la connessione tra il tempo in cui lasci il lavoro e il tempo in cui sarai in viaggio.

Più ti avvicini alle 18:00, più tempo impieghi per tornare a casa. La tua macchina potrebbe trovare alcune delle relazioni con i tuoi dati etichettati.

Questo è l'inizio del tuo modello di dati. Inizia a influenzare il modo in cui la pioggia influisce sul modo in cui le persone guidano. Comincia anche a vedere che più persone viaggiano in un particolare momento della giornata.

Come funziona l'apprendimento senza supervisione?

Prendiamo il caso di un bambino e del suo cane di famiglia.

Conosce e identifica questo cane. Poche settimane dopo un amico di famiglia porta con sé un cane e cerca di giocare con il bambino.

Il bambino non ha visto questo cane prima. Ma riconosce molte caratteristiche (2 orecchie, occhi, camminare su 4 zampe) sono come il suo cane da compagnia. Identifica un nuovo animale come un cane. Questo è un apprendimento non supervisionato, in cui non ti viene insegnato ma impari dai dati (in questo caso i dati su un cane). Se fosse stato un apprendimento supervisionato, l'amico di famiglia avrebbe detto al bambino che è un cane.

Tipi di tecniche di machine learning con supervisione

Regressione:

La tecnica di regressione prevede un singolo valore di output utilizzando i dati di addestramento.

Esempio: è possibile utilizzare la regressione per prevedere il prezzo della casa dai dati di addestramento. Le variabili di input saranno località, dimensione di una casa, ecc.

Classificazione:

Classificazione significa raggruppare l'output all'interno di una classe. Se l'algoritmo cerca di etichettare l'input in due classi distinte, si parla di classificazione binaria. La selezione tra più di due classi viene definita classificazione multiclasse.

Esempio : determinare se qualcuno sarà o meno un inadempiente del prestito.

Punti di forza : gli output hanno sempre un'interpretazione probabilistica e l'algoritmo può essere regolarizzato per evitare l'overfitting.

Punti deboli : la regressione logistica può sottoperformare quando ci sono confini decisionali multipli o non lineari. Questo metodo non è flessibile, quindi non cattura relazioni più complesse.

Tipi di tecniche di apprendimento automatico senza supervisione

Problemi di apprendimento senza supervisione ulteriormente raggruppati in problemi di raggruppamento e associazione.

Clustering

Il clustering è un concetto importante quando si tratta di apprendimento senza supervisione. Si occupa principalmente di trovare una struttura o un modello in una raccolta di dati non categorizzati. Gli algoritmi di clustering elaboreranno i dati e troveranno cluster (gruppi) naturali, se presenti nei dati. Puoi anche modificare il numero di cluster che i tuoi algoritmi devono identificare. Ti consente di regolare la granularità di questi gruppi.

Associazione

Le regole di associazione consentono di stabilire associazioni tra oggetti di dati all'interno di database di grandi dimensioni. Questa tecnica senza supervisione riguarda la scoperta di interessanti relazioni tra variabili in database di grandi dimensioni. Ad esempio, le persone che acquistano una nuova casa molto probabilmente acquisteranno nuovi mobili.

Altri esempi:

  • Un sottogruppo di malati di cancro raggruppati in base alle misurazioni dell'espressione genica
  • Gruppi di acquirenti in base alla loro cronologia di navigazione e acquisto
  • Gruppo di film in base alla valutazione data dagli spettatori di film

Apprendimento supervisionato e non supervisionato

Parametri Tecnica di apprendimento automatico supervisionato Tecnica di apprendimento automatico senza supervisione
Processi In un modello di apprendimento supervisionato, verranno fornite le variabili di input e output. Nel modello di apprendimento senza supervisione, verranno forniti solo i dati di input
Dati in ingresso Gli algoritmi vengono addestrati utilizzando dati etichettati. Gli algoritmi vengono utilizzati su dati non etichettati
Algoritmi utilizzati Supporta macchina vettoriale, rete neurale, regressione lineare e logistica, foresta casuale e alberi di classificazione. Gli algoritmi non supervisionati possono essere suddivisi in diverse categorie: come algoritmi di cluster, K-means, clustering gerarchico, ecc.
Complessità computazionale L'apprendimento supervisionato è un metodo più semplice. L'apprendimento senza supervisione è complesso dal punto di vista computazionale
Utilizzo dei dati Il modello di apprendimento supervisionato utilizza i dati di addestramento per apprendere un collegamento tra l'input e gli output. L'apprendimento senza supervisione non utilizza i dati di output.
Precisione dei risultati Metodo altamente accurato e affidabile. Metodo meno accurato e affidabile.
Apprendimento in tempo reale Il metodo di apprendimento avviene offline. Il metodo di apprendimento avviene in tempo reale.
Numero di classi Il numero di classi è noto. Il numero di classi non è noto.
Inconveniente principale La classificazione dei big data può essere una vera sfida nell'apprendimento supervisionato. Non è possibile ottenere informazioni precise sull'ordinamento dei dati e l'output come dati utilizzati nell'apprendimento non supervisionato è etichettato e non noto.

Sommario

  • In Apprendimento supervisionato, addestrate la macchina utilizzando dati che sono ben "etichettati".
  • L'apprendimento senza supervisione è una tecnica di apprendimento automatico, in cui non è necessario supervisionare il modello.
  • L'apprendimento supervisionato consente di raccogliere dati o produrre un output di dati dall'esperienza precedente.
  • L'apprendimento automatico senza supervisione ti aiuta a trovare tutti i tipi di schemi sconosciuti nei dati.
  • Ad esempio, sarai in grado di determinare il tempo impiegato per tornare in base alle condizioni meteorologiche, agli orari della giornata e alle vacanze.
  • Ad esempio, Baby può identificare altri cani in base all'apprendimento supervisionato passato.
  • La regressione e la classificazione sono due tipi di tecniche di apprendimento automatico con supervisione.
  • Il clustering e l'associazione sono due tipi di apprendimento senza supervisione.
  • In un modello di apprendimento supervisionato, verranno fornite le variabili di input e output mentre con il modello di apprendimento non supervisionato verranno forniti solo i dati di input