Prima di passare all'introduzione ai Big Data, devi prima sapere
Cosa sono i dati?
Le quantità, i caratteri o i simboli su cui vengono eseguite le operazioni da un computer, che possono essere memorizzati e trasmessi sotto forma di segnali elettrici e registrati su supporti di registrazione magnetici, ottici o meccanici.
Ora impariamo l'introduzione ai Big Data
Cosa sono i Big Data?
I Big Data sono una raccolta di dati che ha un volume enorme, ma cresce in modo esponenziale nel tempo. Si tratta di un dato con dimensioni e complessità così grandi che nessuno dei tradizionali strumenti di gestione dei dati può archiviarlo o elaborarlo in modo efficiente. Anche i big data sono dati ma di dimensioni enormi.
In questo tutorial imparerai,
- Cosa sono i dati?
- Cosa sono i Big Data?
- Esempi di Big Data
- Tipi di Big Data
- Caratteristiche dei Big Data
- Vantaggi dell'elaborazione di Big Data
Esempi di Big Data
Di seguito sono riportati alcuni esempi di Big Data:
La Borsa di New York genera circa un terabyte di nuovi dati commerciali al giorno.
Social media
La statistica mostra che oltre 500 terabyte di nuovi dati vengono ingeriti nei database del sito di social media Facebook , ogni giorno. Questi dati vengono generati principalmente in termini di caricamento di foto e video, scambio di messaggi, inserimento di commenti, ecc.
Un singolo motore Jet può generare più di 10 terabyte di dati in 30 minuti di volo. Con molte migliaia di voli al giorno, la generazione di dati arriva fino a molti Petabyte.
Tipi di Big Data
Di seguito sono riportati i tipi di Big Data:
- Strutturato
- Non strutturato
- Semistrutturato
Strutturato
Tutti i dati che possono essere archiviati, accessibili ed elaborati sotto forma di formato fisso sono definiti dati "strutturati". Nel corso del tempo, il talento in informatica ha ottenuto un maggiore successo nello sviluppo di tecniche per lavorare con questo tipo di dati (dove il formato è ben noto in anticipo) e anche traendone valore. Tuttavia, al giorno d'oggi, prevediamo problemi quando una dimensione di tali dati cresce in misura enorme, le dimensioni tipiche sono nella rabbia di più zettabyte.
Lo sai? 10 21 byte pari a 1 zettabyte o un miliardo di terabyte formano uno zettabyte .
Guardando queste cifre si può facilmente capire perché viene dato il nome Big Data e immaginare le sfide legate alla sua archiviazione ed elaborazione.
Lo sai? I dati archiviati in un sistema di gestione di database relazionali sono un esempio di dati "strutturati" .
Esempi di dati strutturati
Una tabella "Employee" in un database è un esempio di dati strutturati
ID Dipendente | Nome dipendente | Genere | Dipartimento | Salary_In_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Maschio | Finanza | 650000 |
3398 | Pratibha Joshi | Femmina | Admin | 650000 |
7465 | Shushil Roy | Maschio | Admin | 500000 |
7500 | Shubhojit Das | Maschio | Finanza | 500000 |
7699 | Priya Sane | Femmina | Finanza | 550000 |
Non strutturato
Tutti i dati con forma o struttura sconosciuta sono classificati come dati non strutturati. Oltre alle dimensioni enormi, i dati non strutturati pongono molteplici sfide in termini di elaborazione per ricavarne valore. Un tipico esempio di dati non strutturati è un'origine dati eterogenea contenente una combinazione di semplici file di testo, immagini, video, ecc. Oggigiorno le organizzazioni hanno a disposizione una grande quantità di dati, ma sfortunatamente non sanno come ricavarne valore da allora questi dati sono nella loro forma grezza o in formato non strutturato.
Esempi di dati non strutturati
L'output restituito da "Ricerca Google"
Semistrutturato
I dati semistrutturati possono contenere entrambe le forme di dati. Possiamo vedere i dati semi-strutturati come una forma strutturata ma in realtà non è definita, ad esempio, con una definizione di tabella nel DBMS relazionale. Un esempio di dati semistrutturati è un dato rappresentato in un file XML.
Esempi di dati semistrutturati
Dati personali memorizzati in un file XML
Prashant Rao Male 35 Seema R. Female 41 Satish Mane Male 29 Subrato Roy Male 26 Jeremiah J. Male 35
Crescita dei dati negli anni
Si noti che i dati dell'applicazione Web, che non sono strutturati, sono costituiti da file di registro, file di cronologia delle transazioni, ecc. I sistemi OLTP sono progettati per funzionare con dati strutturati in cui i dati sono memorizzati in relazioni (tabelle).
Caratteristiche dei Big Data
I big data possono essere descritti dalle seguenti caratteristiche:
- Volume
- Varietà
- Velocità
- Variabilità
(i) Volume - Il nome stesso Big Data è correlato a una dimensione enorme. La dimensione dei dati gioca un ruolo cruciale nel determinare il valore dei dati. Inoltre, se un dato dato può effettivamente essere considerato come un Big Data o meno, dipende dal volume dei dati. Quindi, il 'Volume' è una caratteristica che deve essere considerata quando si ha a che fare con i Big Data.
(ii) Varietà - L'aspetto successivo dei Big Data è la sua varietà .
La varietà si riferisce a fonti eterogenee e alla natura dei dati, sia strutturati che non strutturati. In passato, fogli di calcolo e database erano le uniche fonti di dati considerate dalla maggior parte delle applicazioni. Oggigiorno, nelle applicazioni di analisi vengono presi in considerazione anche dati sotto forma di e-mail, foto, video, dispositivi di monitoraggio, PDF, audio, ecc. Questa varietà di dati non strutturati pone alcuni problemi per l'archiviazione, l'estrazione e l'analisi dei dati.
(iii) Velocità - Il termine "velocità" si riferisce alla velocità di generazione dei dati. La velocità con cui i dati vengono generati ed elaborati per soddisfare le richieste determina il potenziale reale nei dati.
Big Data Velocity si occupa della velocità con cui i dati fluiscono da fonti come processi aziendali, registri delle applicazioni, reti e siti di social media, sensori, dispositivi mobili, ecc.
(iv) Variabilità - Si riferisce all'incoerenza che a volte può essere mostrata dai dati, ostacolando così il processo di essere in grado di gestire e gestire i dati in modo efficace.
Vantaggi dell'elaborazione di Big Data
La capacità di elaborare i Big Data offre molteplici vantaggi, come:
- Le aziende possono utilizzare l'intelligenza esterna mentre prendono decisioni
L'accesso ai dati sociali da motori di ricerca e siti come Facebook e Twitter consente alle organizzazioni di mettere a punto le proprie strategie di business.
- Servizio clienti migliorato
I tradizionali sistemi di feedback dei clienti vengono sostituiti da nuovi sistemi progettati con tecnologie Big Data. In questi nuovi sistemi, vengono utilizzati Big Data e tecnologie di elaborazione del linguaggio naturale per leggere e valutare le risposte dei consumatori.
- Identificazione precoce del rischio per il prodotto / servizio, se presente
- Migliore efficienza operativa
Le tecnologie Big Data possono essere utilizzate per creare un'area di staging o landing zone per nuovi dati prima di identificare quali dati devono essere spostati nel data warehouse. Inoltre, tale integrazione delle tecnologie Big Data e del data warehouse aiuta un'organizzazione a scaricare i dati a cui si accede raramente.
Sommario
- Definizione di Big Data: i Big Data sono definiti come dati di dimensioni enormi. Bigdata è un termine usato per descrivere una raccolta di dati di dimensioni enormi e tuttavia in crescita esponenziale nel tempo.
- Esempi di analisi dei Big Data includono borse, siti di social media, motori a reazione, ecc.
- I Big Data potrebbero essere 1) Strutturati, 2) Non strutturati, 3) Semi-strutturati
- Volume, varietà, velocità e variabilità sono alcune delle caratteristiche dei Big Data
- Un servizio clienti migliorato, una migliore efficienza operativa, un processo decisionale migliore sono alcuni dei vantaggi di Bigdata