- Cos'è il cloud computing?›
- Hub dei concetti di cloud computing›
- Analisi dei dati
Che cos'è lo streaming di dati in tempo reale?
In cosa consistono i flussi di dati in tempo reale?
I flussi di dati in tempo reale implicano la raccolta e l'acquisizione di una sequenza di dati da varie origini dati e l'elaborazione di tali dati in tempo reale per estrarne significato e informazioni.
Esempi di flussi di dati possono essere file di log generati dai clienti che utilizzano applicazioni Web o su dispositivi mobili, acquisti effettuati su siti di e-commerce, eventi all'interno di videogiochi, informazioni provenienti da social network, dati di transazioni finanziarie, servizi di geolocalizzazione e di telemetria relativi a dispositivi connessi o strumentazioni in data center.
I flussi di dati in tempo reale consentono di analizzare ed elaborare i dati in tempo reale anziché attendere ore, giorni o settimane per ottenere risposte.
Quali sono i componenti dei flussi di dati in tempo reale?

Origine: fino a centinaia e migliaia di dispositivi o applicazioni che producono elevati volumi di dati continui ad alta velocità. Alcuni esempi sono i dispositivi mobili, le applicazioni Web (clickstream), i log delle applicazioni, i sensori IoT, i dispositivi intelligenti e le applicazioni di gioco.
Stream Ingestion: semplice integrazione con oltre 15 servizi AWS (Amazon API Gateway, AWS IoT Core, Amazon Cloudwatch e altri) che consente di acquisire dati continui prodotti da migliaia di dispositivi in modo duraturo e sicuro.
Stream Storage: scegli una soluzione che soddisfi le tue esigenze di storage in base a requisiti di scalabilità, latenza ed elaborazione come Amazon Kinesis Data Streams, Amazon Data Firehose e Amazon Managed Streaming for Apache Kafka (Amazon MSK).
Elaborazione dello streaming: scegli tra una selezione di servizi che vanno da soluzioni che richiedono solo un paio di clic per trasformare e fornire continuamente dati a una destinazione come Amazon Data Firehose, a potenti applicazioni personalizzate in tempo reale e integrazione con l'apprendimento automatico utilizzando servizi come Amazon Managed Service for Apache Flink e AWS Lambda.
Destinazione: Distribuisci dati in streaming a una selezione di data lake, data warehouse e servizi di analisi completamente integrati per ulteriori analisi o archiviazione a lungo termine, come Amazon S3, Amazon Redshift, Amazon OpenSearch Service e Amazon EMR.
Quali sono i casi d'uso dei flussi di dati in tempo reale?
Spostamento dati in tempo reale
Grazie allo streaming di dati da centinaia di migliaia di dispositivi e all'esecuzione in tempo reale di trasformazioni ETL su volumi elevati di dati continui e ad alta velocità, gli utenti possono analizzare i dati non appena vengono prodotti e quindi archiviarli in modo duraturo in un data lake, un data warehouse o un database per analisi successive.
Scopri come WalkMe affronta le sfide del sequenziamento mentre trasmette i dati in un data lake
Scopri come John Deere esegue lo streaming ETL nel proprio data lake in tempo reale
Analisi in tempo reale
Analizza i dati non appena vengono prodotti e consenti di prendere decisioni in tempo reale all'interno dell'organizzazione per capitalizzare le opportunità, migliorare l'esperienza dei clienti, prevenire guasti di rete o aggiornare le metriche aziendali critiche in tempo reale.
Log: acquisisci, elabora e analizza i log delle tue applicazioni in tempo reale.
Scopri come analizzare il comportamento degli utenti in tempo reale
Scopri come analizzare e visualizzare il traffico di rete VPC
Scopri come gestire i log centralizzati del server Microsoft Exchange
Scopri di più sull'analisi dei log »
Aggiornamenti in tempo reale: interagisci con consumatori, giocatori, operatori finanziari e altri utenti fornendo aggiornamenti in tempo reale alle metriche decisionali critiche, ai consigli sulle offerte e alle esperienze dei clienti.
Scopri come utilizzare l'analisi dei giochi in tempo reale per soddisfare al meglio i tuoi giocatori
Scopri come fornire notizie personalizzate e che riscuotono maggiore successo, in tempo reale
Clickstream: ottieni una visione in tempo reale delle prestazioni del contenuto Web e dell'interazione tra gli utenti e le applicazioni e i siti Web, inclusi il comportamento degli utenti, la quantità di tempo impiegato, i contenuti popolari e altro ancora.
IoT: connettiti a centinaia di migliaia di dispositivi IoT e raccogli, elabora e analizza i flussi di dati in tempo reale.
Elaborazione di flussi di eventi
Cattura e rispondi agli eventi man mano che si verificano in tempo reale su più applicazioni. I casi d'uso più comuni riguardano la comunicazione tra centinaia di microservizi disaccoppiati e il mantenimento di un sistema di registrazione tramite Change Data Capture (cattura dei cambiamenti apportati ai dati).
Comunicazione tra microservizi disaccoppiati: quando viene attivato un microservizio, un evento può essere inviato a un flusso di dati in tempo reale e altri microservizi possono "guardare" il flusso per vedere se si è verificato un evento che ha attivato l'azione richiesta.
Scopri come Lyft comunica tra centinaia di microservizi in tempo reale
Change Data Capture: tutte le modifiche apportate ai dati in diverse applicazioni e database possono essere trasmesse a un sistema di registrazione centrale in tempo reale.
Scopri come caricare i dati Change Data Capture dai database relazionali
Quali servizi di streaming sono disponibili su AWS?
AWS offre varie opzioni per lavorare con i flussi di dati in tempo reale.
- Flusso di dati Amazon Kinesis è un servizio dimensionabile e durevole per i flussi di dati in tempo reale che può acquisire gigabyte di dati al secondo in modo costante da centinaia di migliaia di origini dati.
- Amazon Data Firehose acquisisce, trasforma e carica i flussi di dati negli archivi dati AWS per analisi quasi in tempo reale con gli strumenti di business intelligence esistenti con pochi clic.
- Servizio gestito da Amazon per Apache Flink trasforma e analizza dati in streaming in tempo reale utilizzando Apache Flink, un motore e framework open source per l'elaborazione dei flussi di dati.
- Amazon Managed Streaming for Apache Kafka è un servizio completamente gestito che semplifica la creazione e l’esecuzione di applicazioni che si servono di Apache Kafka per l’elaborazione dello streaming dei dati.
Inizia a utilizzare lo streaming di dati in tempo reale su AWS creando un account oggi stesso.