Cosa sono i BIG DATA? Introduzione, tipi, caratteristiche, esempio

Sommario:

Anonim

Prima di passare all'introduzione ai Big Data, devi prima sapere

Cosa sono i dati?

Le quantità, i caratteri o i simboli su cui vengono eseguite le operazioni da un computer, che possono essere memorizzati e trasmessi sotto forma di segnali elettrici e registrati su supporti di registrazione magnetici, ottici o meccanici.

Ora impariamo l'introduzione ai Big Data

Cosa sono i Big Data?

I Big Data sono una raccolta di dati che ha un volume enorme, ma cresce in modo esponenziale nel tempo. Si tratta di un dato con dimensioni e complessità così grandi che nessuno dei tradizionali strumenti di gestione dei dati può archiviarlo o elaborarlo in modo efficiente. Anche i big data sono dati ma di dimensioni enormi.

In questo tutorial imparerai,

  • Cosa sono i dati?
  • Cosa sono i Big Data?
  • Esempi di Big Data
  • Tipi di Big Data
  • Caratteristiche dei Big Data
  • Vantaggi dell'elaborazione di Big Data

Esempi di Big Data

Di seguito sono riportati alcuni esempi di Big Data:

La Borsa di New York genera circa un terabyte di nuovi dati commerciali al giorno.

Social media

La statistica mostra che oltre 500 terabyte di nuovi dati vengono ingeriti nei database del sito di social media Facebook , ogni giorno. Questi dati vengono generati principalmente in termini di caricamento di foto e video, scambio di messaggi, inserimento di commenti, ecc.

Un singolo motore Jet può generare più di 10 terabyte di dati in 30 minuti di volo. Con molte migliaia di voli al giorno, la generazione di dati arriva fino a molti Petabyte.

Tipi di Big Data

Di seguito sono riportati i tipi di Big Data:

  1. Strutturato
  2. Non strutturato
  3. Semistrutturato

Strutturato

Tutti i dati che possono essere archiviati, accessibili ed elaborati sotto forma di formato fisso sono definiti dati "strutturati". Nel corso del tempo, il talento in informatica ha ottenuto un maggiore successo nello sviluppo di tecniche per lavorare con questo tipo di dati (dove il formato è ben noto in anticipo) e anche traendone valore. Tuttavia, al giorno d'oggi, prevediamo problemi quando una dimensione di tali dati cresce in misura enorme, le dimensioni tipiche sono nella rabbia di più zettabyte.

Lo sai? 10 21 byte pari a 1 zettabyte o un miliardo di terabyte formano uno zettabyte .

Guardando queste cifre si può facilmente capire perché viene dato il nome Big Data e immaginare le sfide legate alla sua archiviazione ed elaborazione.

Lo sai? I dati archiviati in un sistema di gestione di database relazionali sono un esempio di dati "strutturati" .

Esempi di dati strutturati

Una tabella "Employee" in un database è un esempio di dati strutturati

ID Dipendente Nome dipendente Genere Dipartimento Salary_In_lacs
2365 Rajesh Kulkarni Maschio Finanza 650000
3398 Pratibha Joshi Femmina Admin 650000
7465 Shushil Roy Maschio Admin 500000
7500 Shubhojit Das Maschio Finanza 500000
7699 Priya Sane Femmina Finanza 550000

Non strutturato

Tutti i dati con forma o struttura sconosciuta sono classificati come dati non strutturati. Oltre alle dimensioni enormi, i dati non strutturati pongono molteplici sfide in termini di elaborazione per ricavarne valore. Un tipico esempio di dati non strutturati è un'origine dati eterogenea contenente una combinazione di semplici file di testo, immagini, video, ecc. Oggigiorno le organizzazioni hanno a disposizione una grande quantità di dati, ma sfortunatamente non sanno come ricavarne valore da allora questi dati sono nella loro forma grezza o in formato non strutturato.

Esempi di dati non strutturati

L'output restituito da "Ricerca Google"

Semistrutturato

I dati semistrutturati possono contenere entrambe le forme di dati. Possiamo vedere i dati semi-strutturati come una forma strutturata ma in realtà non è definita, ad esempio, con una definizione di tabella nel DBMS relazionale. Un esempio di dati semistrutturati è un dato rappresentato in un file XML.

Esempi di dati semistrutturati

Dati personali memorizzati in un file XML

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Crescita dei dati negli anni

Si noti che i dati dell'applicazione Web, che non sono strutturati, sono costituiti da file di registro, file di cronologia delle transazioni, ecc. I sistemi OLTP sono progettati per funzionare con dati strutturati in cui i dati sono memorizzati in relazioni (tabelle).

Caratteristiche dei Big Data

I big data possono essere descritti dalle seguenti caratteristiche:

  • Volume
  • Varietà
  • Velocità
  • Variabilità

(i) Volume - Il nome stesso Big Data è correlato a una dimensione enorme. La dimensione dei dati gioca un ruolo cruciale nel determinare il valore dei dati. Inoltre, se un dato dato può effettivamente essere considerato come un Big Data o meno, dipende dal volume dei dati. Quindi, il 'Volume' è una caratteristica che deve essere considerata quando si ha a che fare con i Big Data.

(ii) Varietà - L'aspetto successivo dei Big Data è la sua varietà .

La varietà si riferisce a fonti eterogenee e alla natura dei dati, sia strutturati che non strutturati. In passato, fogli di calcolo e database erano le uniche fonti di dati considerate dalla maggior parte delle applicazioni. Oggigiorno, nelle applicazioni di analisi vengono presi in considerazione anche dati sotto forma di e-mail, foto, video, dispositivi di monitoraggio, PDF, audio, ecc. Questa varietà di dati non strutturati pone alcuni problemi per l'archiviazione, l'estrazione e l'analisi dei dati.

(iii) Velocità - Il termine "velocità" si riferisce alla velocità di generazione dei dati. La velocità con cui i dati vengono generati ed elaborati per soddisfare le richieste determina il potenziale reale nei dati.

Big Data Velocity si occupa della velocità con cui i dati fluiscono da fonti come processi aziendali, registri delle applicazioni, reti e siti di social media, sensori, dispositivi mobili, ecc.

(iv) Variabilità - Si riferisce all'incoerenza che a volte può essere mostrata dai dati, ostacolando così il processo di essere in grado di gestire e gestire i dati in modo efficace.

Vantaggi dell'elaborazione di Big Data

La capacità di elaborare i Big Data offre molteplici vantaggi, come:

    • Le aziende possono utilizzare l'intelligenza esterna mentre prendono decisioni

L'accesso ai dati sociali da motori di ricerca e siti come Facebook e Twitter consente alle organizzazioni di mettere a punto le proprie strategie di business.

    • Servizio clienti migliorato

I tradizionali sistemi di feedback dei clienti vengono sostituiti da nuovi sistemi progettati con tecnologie Big Data. In questi nuovi sistemi, vengono utilizzati Big Data e tecnologie di elaborazione del linguaggio naturale per leggere e valutare le risposte dei consumatori.

    • Identificazione precoce del rischio per il prodotto / servizio, se presente
    • Migliore efficienza operativa

Le tecnologie Big Data possono essere utilizzate per creare un'area di staging o landing zone per nuovi dati prima di identificare quali dati devono essere spostati nel data warehouse. Inoltre, tale integrazione delle tecnologie Big Data e del data warehouse aiuta un'organizzazione a scaricare i dati a cui si accede raramente.

Sommario

  • Definizione di Big Data: i Big Data sono definiti come dati di dimensioni enormi. Bigdata è un termine usato per descrivere una raccolta di dati di dimensioni enormi e tuttavia in crescita esponenziale nel tempo.
  • Esempi di analisi dei Big Data includono borse, siti di social media, motori a reazione, ecc.
  • I Big Data potrebbero essere 1) Strutturati, 2) Non strutturati, 3) Semi-strutturati
  • Volume, varietà, velocità e variabilità sono alcune delle caratteristiche dei Big Data
  • Un servizio clienti migliorato, una migliore efficienza operativa, un processo decisionale migliore sono alcuni dei vantaggi di Bigdata