Il termine “data mining” si riferisce all’analisi mirata di grandi quantità di dati per ottenere nuove informazioni potenzialmente utili. Ti illustriamo il termine in modo più dettagliato spiegandoti alcuni dei metodi di analisi associati.

Il data mining in breve

Per dare una definizione di data mining, è utile decifrare la metafora su cui si basa e scoprirne il metodo di analisi alla base. Se si tende a considerare l’output che deriva dal tracciamento costante delle attività dei visitatori e delle visitatrici su internet come una montagna di dati inutile, con il data mining (letteralmente “estrazione dei dati”) si avranno gli strumenti necessari per comprendere i risultati raccolti e accedere alle informazioni rilevanti. Al contrario di quanto avvenga in miniera (il classico luogo dedicato alle estrazioni), qui vengono applicati dei metodi statistici, che consentono di identificare le tendenze e i collegamenti trasversali.

Generalmente, il data mining è strettamente connesso ai big data, cioè delle banche dati che non possono essere comprese manualmente e richiedono quindi un’analisi effettuata con l’aiuto del computer. In linea di massima, però, i metodi di data mining si applicano su qualsiasi quantità di dati. Le conoscenze che vengono acquisite tramite il data mining vengono usate nella strategia impiegata per un business online e nelle varie decisioni di marketing. Ugualmente eterogenei sono i campi di applicazione.

Campi di applicazione del data mining

Il data mining offre la possibilità di ottimizzare l’e-commerce su base scientifica. Infatti, i grandi database, utilizzati nel business online, sono alla base di spiegazioni e pronostici. Elaborati statisticamente e visualizzati sotto forma di statistiche, consentono a chi gestisce un negozio online di identificare i fattori per un business online di successo e di calcolare le strategie di marketing di un negozio online sulla base di modelli. Il data mining viene applicato per:

  • segmentare i mercati;
  • analizzare i carrelli;
  • delineare i profili dei compratori;
  • calcolare i prezzi dei prodotti;
  • formulare i pronostici sulla durata dei contratti;
  • analizzare la domanda;
  • identificare gli errori nel processo di vendita.
I software IA di IONOS
Scopri la potenza dell'intelligenza artificiale
  • Siti web in tempo record
  • Soluzioni IA per il tuo business
  • Risparmio di tempo e risultati eccellenti

Come funziona il data mining?

Il data mining è considerato una sottofase del Knowledge Discovery in Data (KDD), che comprende le seguenti fasi:

  • Definire gli obiettivi: in primo luogo, è necessario determinare le domande specifiche a cui si vuole rispondere con l’analisi dei dati. In questo modo è più facile per i professionisti del settore riconoscere i dati pertinenti e i metodi di analisi appropriati.
  • Pre-elaborazione dei dati: la qualità dei dati di base è decisiva per la natura delle informazioni ottenute attraverso il data mining. I dati rilevanti devono quindi essere ripuliti prima di essere analizzati, al fine di rimuovere duplicati, valori anomali e altre distorsioni. I dati ripuliti possono anche dover essere convertiti nel formato richiesto dalla procedura di analisi.
  • Analisi dei dati: a questo punto ha luogo l’analisi matematica vera e propria dei dati. I metodi di analisi da utilizzare dipendono in larga misura dagli obiettivi selezionati e dalle caratteristiche dei dati. Si possono utilizzare sia gli algoritmi classici sia i più recenti algoritmi di deep learning basati sulle reti neurali.
  • Interpretazione dei risultati: prima di tutto, è necessario valutare i risultati dell’analisi. Se i risultati sono comprensibili e informativi, è possibile identificare nuove correlazioni e ottenere approfondimenti che possono a loro volta influenzare le future strategie aziendali.

I metodi del data mining

Per poter estrarre le informazioni rilevanti per il proprio business dai database di grandi dimensioni, si sono affermati diversi metodi, che si basano sull’identificazione di relazioni importanti, schemi, tendenze e si servono di procedimenti statistici.

  • Identificazione delle anomalie (Outlier Detection): con anomalia si indicano i valori assoluti che emergono dal resto dei dati complessivi, visto che si allontanano dalla tendenza generale della sequenza di misurazione. Nel data mining viene applicata l’identificazione delle anomalie per individuare serie di dati non comuni. Nella pratica questo metodo di data mining si utilizza per smascherare delle transazioni sospette nel caso di falsificazioni di carte di credito.
  • Analisi del cluster: con cluster si indica un raggruppamento di oggetti, che si basa sulle similitudini dei membri del gruppo. Lo scopo di questo metodo di analisi è la segmentazione dei dati non strutturati. Per questo si applicano gli algoritmi come K-nearest neighbor (KNN) che ricercano nei database di grandi dimensioni le strutture simili per identificare dei nuovi cluster. Se non si riesce ad assegnare una serie di dati a un cluster, questa viene interpretata come un’anomalia. Un classico caso di applicazione per l’analisi del cluster è l’identificazione di gruppi di visitatori.
  • Classificazione: mentre nel caso dell’analisi del cluster l’identificazione dei nuovi gruppi rimane in primo piano, con la classificazione vengono applicate delle classi predefinite. La distribuzione avviene in base a proprietà concordanti dei singoli dati dal database complessivo. Un metodo comune di classificazione automatica dei dati è rappresentato dall’albero decisionale (“decision tree”). A ogni nodo viene richiesta una proprietà dell’oggetto, la cui presenza o assenza determina la scelta del nodo successivo. Nel settore dell’e-commerce si applica questo procedimento per suddividere i clienti in diversi segmenti.
  • Analisi di associazione: un’analisi di associazione mira all’identificazione delle relazioni in un database, che sono formulabili come regole finali. Nell’e-commerce si ricorre a questo metodo per identificare le correlazioni dei singoli prodotti presenti nei carrelli, secondo lo schema “se viene comprato un prodotto A, allora viene acquistato anche il prodotto B”.
  • Analisi di regressione: grazie alle analisi di regressione vengono creati dei modelli di data mining, che hanno il compito di chiarire una variabile dipendente tramite diverse indipendenti. Di norma si può creare, ad esempio, un pronostico per la vendita di un prodotto, instaurando una relazione tra il prezzo del prodotto e il reddito medio di un cliente basandosi su un modello di regressione.

Limiti del data mining

Nel data mining si applicano procedimenti statistici che consentono un’analisi sostanzialmente oggettiva dei database disponibili. Tuttavia, la scelta soggettiva del processo di analisi, come pure di diversi algoritmi e parametri sulla base di determinate previsioni, può portare alla falsificazione dei risultati (probabilmente voluta). È possibile aggirare questi effetti affidando i processi di data mining a servizi esterni.

Per concludere, è da notare che il data mining fornisce risultati solo sotto forma di schemi e collegamenti trasversali. Si ottengono delle risposte solo quando i risultati dell’analisi vengono interpretati in relazione alle domande precedenti e agli obiettivi preposti.

Hai trovato questo articolo utile?
Per offrirti una migliore esperienza di navigazione online questo sito web usa dei cookie, propri e di terze parti. Continuando a navigare sul sito acconsenti all’utilizzo dei cookie. Scopri di più sull’uso dei cookie e sulla possibilità di modificarne le impostazioni o negare il consenso.
Page top