Il data mining è alla ricerca di modelli nascosti, validi e tutti i possibili modelli utili in set di dati di grandi dimensioni. Il data mining è una tecnica che ti aiuta a scoprire relazioni insospettate / non scoperte tra i dati per guadagni aziendali.
Sono disponibili molti strumenti utili per il data mining. Di seguito è riportato un elenco curato dei 25 migliori software di data mining selezionati con funzionalità popolari e collegamenti per il download più recenti. Questa lista di confronto contiene sia open source che strumenti commerciali.
1) Data mining SAS:
Il sistema di analisi statistica è un prodotto di SAS. È stato sviluppato per l'analisi e la gestione dei dati. Offre un'interfaccia utente grafica per utenti non tecnici.
Caratteristiche:
- Gli strumenti di data mining di SAS ti aiutano ad analizzare i Big Data
- È uno strumento ideale per il data mining, il text mining e l'ottimizzazione.
- SAS offre un'architettura di elaborazione della memoria distribuita che è altamente scalabile
Link per il download: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradata:
Teradata è un sistema di elaborazione aperto massicciamente parallelo per lo sviluppo di applicazioni di data warehousing su larga scala. Teradata può essere eseguito su piattaforma server Unix / Linux / Windows.
Caratteristiche:
- Teradata Optimizer può gestire fino a 64 join in una query.
- I dati Tera hanno un basso costo totale di proprietà. È facile da configurare, mantenere e amministrare.
- Supporta SQL per interagire con i dati archiviati nelle tabelle. Fornisce la sua estensione.
- Ti aiuta a distribuire automaticamente i dati sui dischi senza alcun intervento manuale.
- Teradata fornisce utilità di caricamento e scaricamento per spostare i dati nel / dal sistema Teradata.
Link per il download: https://www.teradata.in/Products/Cloud/IntelliCloud
3) R-Programming
R è un linguaggio per il calcolo statistico e la grafica. Viene utilizzato anche per l'analisi dei big data. Fornisce un'ampia varietà di test statistici.
Caratteristiche:
- Gestione efficace dei dati e struttura di archiviazione,
- Fornisce una suite di operatori per calcoli su array, in particolare matrici,
- Fornisce una raccolta coerente e integrata di strumenti per big data per l'analisi dei dati
- Fornisce servizi grafici per l'analisi dei dati che vengono visualizzati sullo schermo o su supporto cartaceo.
Link per scaricare; https://www.r-project.org/
4) PENSIONE
Board è un Management Intelligence Toolkit. Combina funzionalità di business intelligence e gestione delle prestazioni aziendali. È progettato per fornire business intelligence e business analytics in un unico pacchetto.
Caratteristiche:
- Consente di analizzare, simulare, pianificare e prevedere utilizzando un'unica piattaforma
- Per costruire applicazioni analitiche e di pianificazione personalizzate.
- Board All-In-One combina BI, Corporate Performance Management e Business Analytics.
- Consente alle aziende di sviluppare e mantenere sofisticate applicazioni analitiche e di pianificazione.
- La piattaforma proprietaria aiuta a generare rapporti accedendo a più origini dati.
Link per il download: https://www.board.com/en
5) Dundas
Dundas è uno strumento di data mining pronto per l'azienda che può essere utilizzato per creare e visualizzare dashboard interattivi, report, ecc. È possibile distribuire Dundas BI come portale dati centrale per l'organizzazione.
Caratteristiche:
- Applicazione server con funzionalità complete del prodotto
- Integra e accedi a tutti i tipi di origini dati
- Visualizzazioni dei dati personalizzabili
- Strumenti intelligenti di trascinamento della selezione
- Visualizza i dati attraverso le mappe
- Analisi dei dati predittiva e avanzata
Link per il download: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Lo stile Intelligence dello strumento di data mining di Inetsoft è un'utile piattaforma di data mining e intelligence. Consente la trasformazione rapida e flessibile dei dati da varie fonti.
Caratteristiche:
- Ti aiuta ad accedere a fonti strutturate e semi-strutturate, applicazioni in sede
- Consente di ottimizzare le app per il consumo e l'aggiornamento dei dati
- Offri livelli sicuri e personalizzati di esplorazione e reportistica dei dati.
- Scalabilità per set di dati di grandi dimensioni di utenti che utilizzano la piattaforma Spark incorporata
- Genera report impaginati con logica aziendale e parametrizzazione incorporate
Link per il download: https://www.inetsoft.com/products/StyleIntelligence/
7) H3O
H3O è un altro eccellente strumento di data mining software open source. Viene utilizzato per eseguire analisi dei dati sui dati contenuti nei sistemi applicativi di cloud computing.
Caratteristiche:
- H3O ti consente di sfruttare la potenza di calcolo dei sistemi distribuiti e dell'elaborazione in memoria
- Consente una distribuzione rapida e semplice in produzione con Java e formato binario.
- Ti aiuta a usare i linguaggi di programmazione come R,
- Python e altri per creare un modello in H3O
- Elaborazione distribuita in memoria
Link per il download: https://www.h3o.ai/
8) Qlik
Qlik è uno strumento di data mining e visualizzazione. Offre anche dashboard e supporta più origini dati e tipi di file.
Caratteristiche:
- Interfacce drag-and-drop per creare visualizzazioni di dati flessibili e interattive
- Rispondi istantaneamente alle interazioni e ai cambiamenti.
- Supporta più origini dati e tipi di file
- Consente una facile protezione per dati e contenuti su tutti i dispositivi.
- Ti consente di condividere analisi pertinenti, comprese app e storie, utilizzando un hub centralizzato.
Link per il download: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner è uno strumento di data mining gratuito. Viene utilizzato per la preparazione dei dati, l'apprendimento automatico e la distribuzione dei modelli. Offre una gamma di prodotti per creare nuovi processi di data mining e analisi predittiva della configurazione.
Caratteristiche:
- Consenti più metodi di gestione dei dati
- GUI o elaborazione in batch
- Si integra con i database interni
- Dashboard interattivi e condivisibili
- Analisi predittiva dei Big Data
- Elaborazione dell'analisi remota
- Filtraggio, unione, unione e aggregazione dei dati
- Crea, addestra e convalida modelli predittivi
- Rapporti e notifiche attivate
Link per il download: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI è un machine learning open source e visualizzazione dei dati per principianti ed esperti. Flussi di lavoro interattivi di analisi dei dati con una grande cassetta degli attrezzi.
Caratteristiche:
- Visualizzazione interattiva dei dati.
- Offre l'esplorazione interattiva dei dati per una rapida analisi qualitativa con visualizzazioni pulite.
- Orange supporta corsi di formazione pratica e illustrazioni visive di concetti tratti dalla scienza dei dati.
- Offre una vasta gamma di componenti aggiuntivi per il data mining da fonti di dati esterne.
Link per il download: https://orange.biolab.si/
11) KNIME
KNIME è un software open source per la creazione di applicazioni e servizi di data science. Questo strumento di data mining ti aiuta a comprendere i dati e a progettare flussi di lavoro di data science.
Caratteristiche:
- Ti aiuta a creare un end-to-end nei flussi di lavoro di data science
- Unisci i dati da qualsiasi fonte
- Consente di aggregare, ordinare, filtrare e unire i dati sulla macchina locale, nel database o in ambienti di big data distribuiti.
- Crea modelli di machine learning per la classificazione, la regressione e la riduzione delle dimensioni
Link per il download: https://www.knime.com/software-overview
12) Tanagra
Tangra è uno strumento di data mining gratuito per scopi di studio e ricerca. Offre vari metodi di data mining dall'apprendimento statistico, all'analisi dei dati e all'apprendimento automatico.
Caratteristiche:
- Offre un software di data mining facile da usare per ricercatori e studenti
- Consente all'utente di aggiungere i propri metodi di data mining.
Link per il download: https://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
13) Risolutore:
XLminer di Solver è uno strumento di data mining di livello professionale facile da usare per la visualizzazione dei dati, la previsione e il data mining in Excel. Offre un set completo di funzioni di preparazione dei dati per importare e pulire i dati.
Caratteristiche:
- XLMiner offre un set completo di funzionalità di analisi basate su metodi statistici e di apprendimento automatico.
- Lo strumento ti consente di lavorare con set di dati di grandi dimensioni che possono superare i limiti in Excel.
- Offre funzionalità integrate per l'esplorazione e la visualizzazione dei dati.
- L'esplorazione dei dati offre rapide informazioni sulle relazioni nascoste nei dati.
Link per il download: https://www.solver.com/xlminer-data-mining
14) Sisense
Sisense è un altro efficace strumento di data mining. Analizza e visualizza istantaneamente set di dati sia grandi che disparati. È uno strumento ideale per creare dashboard con un'ampia varietà di visualizzazioni.
Caratteristiche:
- Permette di costruire dashboard interattivi senza competenze tecniche
- Crea un'unica versione della verità con dati continui
- Unifica i dati non correlati in un unico luogo centralizzato
- Interfaccia utente drag-and-drop orientale
- Permette di accedere ai cruscotti anche nel dispositivo mobile
- Visualizzazione accattivante
- Identifica le metriche critiche utilizzando filtri e calcoli
- Gestisce dati su larga scala in un unico commodity server
Link per il download: https://www.sisense.com/
15) Data Melt
DataMelt è uno strumento gratuito per il calcolo numerico, la matematica, l'analisi dei dati e la visualizzazione dei dati. Questo programma ti offre la semplicità dei linguaggi di scripting, come Python, Ruby, Groovy con la potenza di centinaia di pacchetti Java.
Caratteristiche:
- DataMelt offre statistiche, analisi di grandi volumi di dati e visualizzazione scientifica.
- Puoi usarlo con diversi linguaggi di programmazione su diversi sistemi operativi.
- Consente di creare immagini grafiche vettoriali di alta qualità (EPS, SVG, PDF, ecc.), Che possono essere incluse in LaTeX e in un altro elaboratore di testi.
- Data Melt offre l'utilizzo di linguaggi di scripting, che sono significativamente più veloci dello standard Python implementato in C.
Link per il download: https://jwork.org/dmelt/
16) ELKI:
ELKI è uno strumento di data mining open source scritto in Java. Lo strumento ci consente di ricercare algoritmi, con un'enfasi sui metodi non supervisionati nell'analisi dei cluster e nel rilevamento dei valori anomali.
Caratteristiche:
- ELKI offre un'ampia raccolta di algoritmi altamente parametrizzabili
- Consente una valutazione e un'analisi comparativa semplici e corrette degli algoritmi.
- ELKI fornisce strutture di indice dei dati come l'albero R * che migliorano il processo di data mining
Link per il download : https://elki-project.github.io/
17) SPMF
SPMF è una libreria di data mining open source scritta in Java. È distribuito con licenza GPL. Ti consente di integrare il codice sorgente con altri software Java.
Caratteristiche:
- Consente l'estrazione delle regole di associazione
- Supporta pattern sequenziali e mining di regole sequenziali
- Offre l'estrazione di modelli ad alta utilità,
- Estrazione di serie temporali.
- Supporta processi complessi di clustering e classificazione
Link per il download: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx è una soluzione di business intelligence e analisi per l'azienda. È uno strumento appositamente progettato per analisti di dati e leader aziendali.
Caratteristiche:
- Analytics per le medie imprese
- Consente l'analisi ad hoc.
- Offre un'elaborazione analitica online veloce
- Reportistica pianificata automatica
- Dashboard altamente personalizzabile
Link per il download: https://www.alteryx.com/
19) Enterprise Miner
Enterprise Miner è un software SAS che ti offre algoritmi all'avanguardia progettati per aiutarti a risolvere le sfide più significative e offre le migliori soluzioni per il tuo business.
Caratteristiche:
- Ti aiuta a migliorare l'accuratezza della previsione. Condividi risultati affidabili
- GUI di facile utilizzo e elaborazione in batch
- Modellazione predittiva e descrittiva avanzata
- Offre il punteggio automatizzato
- Automatizza la distribuzione e il punteggio dei modelli
Link per il download: https://www.sas.com/en_us/software/enterprise-miner.html
20) Datawatch
Datawatch Desktop è una soluzione di data mining e business intelligence. Ti consente di concentrarti sulla visualizzazione dei dati in tempo reale. Offre strumenti per creare e distribuire i propri sistemi di monitoraggio e analisi senza la necessità di scrivere una singola riga di codice.
Caratteristiche:
- La funzione di trascinamento della selezione consente agli utenti di creare una visualizzazione personalizzata dei dati
- Identifica le anomalie di trading
- Analizza come scenari alternativi influenzeranno le prestazioni utilizzando i dati storici
Link per il download: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Minatore avanzato
Un miner avanzato è uno strumento utile per l'elaborazione, l'analisi e la modellazione dei dati. La sua interfaccia di flusso di lavoro user-friendly consente di esplorare vari tipi di dati.
Caratteristiche:
- Estrazione e salvataggio di dati da / a diversi sistemi di database, file e trasformazioni di dati
- Offre varie operazioni sui dati, come il campionamento, l'unione di set di dati, ecc.
- Ti aiuta a costruire modelli statistici, analisi di importanza variabile, analisi di cluster, ecc.
- Integrazione dei modelli semplice ed efficace con applicazioni IT esterne
Link per il download: https://algolytics.com/products/advancedminer/
22) Risolutore analitico
Analytic Solver è libero di utilizzare lo strumento punta e clicca. Ti consente di eseguire analisi dei rischi e analisi prescrittive nel tuo browser. Offre lavori di data mining a piena potenza.
Caratteristiche:
- Ti aiuta a incorporare l'incertezza e risolvere con l'ottimizzazione della simulazione, la programmazione stocastica e l'ottimizzazione robusta.
- Consente di definire il modello di simulazione Monte Carlo utilizzando formule di Excel
Link per il download: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst è lo strumento analitico e di data mining per estrarre conoscenza fruibile nascosta e strutturata effettiva dei dati.
Caratteristiche:
- Ti aiuta ad accedere ai dati da varie fonti e unire i dati da diverse fonti
- Puoi scegliere da un'ampia selezione di algoritmi statistici e di apprendimento automatico.
- Ti offre la creazione di report di riempimento che possono essere riassunti e comunicare le tue intuizioni
Link per il download: https://www.megaputer.com/polyanalyst/
24) Civis
Civis ti consente di prendere decisioni informate pensando ai data scientist e al mercato decisionale. Consente al tuo team di collaborare in modo efficiente e trovare soluzioni più velocemente.
Caratteristiche:
- Offre architettura, prodotti e processi che ti aiutano a proteggere i tuoi dati
- È possibile configurare con una libreria di acquisizione dati e moduli ETL.
- Scrivi codice in uno script, offre più script o lavori in un flusso di lavoro e definisci un flusso di lavoro da eseguire secondo una pianificazione.
- Consente di trasformare analisi e modelli in applicazioni eseguite su un'infrastruttura flessibile a livello di produzione
Link per il download: https://www.civisanalytics.com/civis-platform/
25) Viscosità:
Viscovery è una suite software orientata al flusso di lavoro. Si basa su mappe auto-organizzate e statistiche multivariate per il data mining esplorativo e la modellazione predittiva. Il sistema eccelle nella guida utente intuitiva e nell'implementazione matura.
Caratteristiche:
- Una piattaforma dell'ambiente di progetto ideale per operazioni orientate agli obiettivi
- Flussi di lavoro dedicati che consentono di offrire una navigazione mirata
- Passaggi chiari del flusso di lavoro con impostazioni predefinite comprovate
- Ramificazione del flusso di lavoro che consente la generazione di variazioni del modello
- Funzioni per documentazione e annotazione integrate
- Molteplici strumenti di manipolazione per facilitarne l'utilizzo
Link per il download: https://www.viscovery.net/somine/