Oggi Google Cloud Platform ha annunciato la disponibilità generale di due nuovi prodotti di analisi dei dati, Google Cloud Dataflow e Google Cloud Pub/Sub. Questi prodotti forniranno un modello di programmazione unificato per l'analisi dei dati, eliminando la necessità di origini dati batch e stream, integrando applicazioni e servizi e analizzando i flussi di dati in tempo reale. Google annuncia inoltre il rilascio di Cloudera Director 1.5.
Oggi Google Cloud Platform ha annunciato la disponibilità generale di due nuovi prodotti di analisi dei dati, Google Cloud Dataflow e Google Cloud Pub/Sub. Questi prodotti forniranno un modello di programmazione unificato per l'analisi dei dati, eliminando la necessità di origini dati batch e stream, integrando applicazioni e servizi e analizzando i flussi di dati in tempo reale. Google annuncia inoltre il rilascio di Cloudera Director 1.5.
Google ha completato l'aggiunta dell'intera linea di strumenti per big data con la disponibilità generale di Google Cloud Dataflow e Google Cloud Pub/Sub. Il primo passo è BigQuery. Google sta rimuovendo le etichette beta e prevede che migliaia di terabyte di dati verranno immediatamente analizzati con questi nuovi prodotti. Google Cloud Dataflow e Google Cloud Pub/Sub consentiranno l'elaborazione dei dati senza il carico operativo tipico di tali sistemi. Consentono inoltre ai clienti di creare applicazioni su una piattaforma che si adatta alle loro esigenze e lo fa con bassa latenza e alta affidabilità.
Google Cloud Dataflow elimina la complessità legata allo sviluppo di sistemi separati per origini dati in batch e in streaming fornendo un modello di programmazione unificato. Cloud Dataflow elimina il sovraccarico relativo alla gestione e all'ottimizzazione dei cluster su larga scala.
I vantaggi includono:
- Un servizio completamente gestito, con tolleranza agli errori, altamente disponibile e supportato da SLA per l'elaborazione batch e flusso.
- Un modello completo per bilanciare correttezza, latenza e costi quando si gestiscono dati non ordinati su larga scala. Questi concetti alimentano gli elementi chiave del modello di programmazione Cloud Dataflow.
- Cloud Dataflow è 2-3 volte più veloce ed economico di Hadoop nella valutazione delle pipeline classiche basate su MapReduce, come PageRank e WordCount. Inoltre, grazie al ribilanciamento dinamico del lavoro, Cloud Dataflow ottimizza in modo efficace l'utilizzo delle risorse garantendo ulteriori miglioramenti delle prestazioni senza richiedere l'intervento manuale.
- Un SDK estensibile. Google ha ampliato gli sforzi di integrazione dei propri partner tecnologici, connettori di terze parti e fornitori di servizi tra cui Tamr, Salesforce, Clearstory, springML, Cloudera e data Artisans. Google continua inoltre a supportare l'abilitazione di runner alternativi per Apache Spark e Apache Flink.
- Integrazione nativa di Google Cloud Platform per Cloud Storage, Cloud Datastore, BigQuery e Cloud Pub/Sub.
Google Cloud Pub/Sub è il risultato di un decennio di innovazione. Può integrare applicazioni e servizi in modo affidabile, nonché analizzare flussi di big data in tempo reale. Cloud Pub/Sub ha distribuito oltre 1 trilione di messaggi durante la versione alpha e beta, contribuendo a perfezionarne le prestazioni. Può anche affrontare un'ampia gamma di scenari da una singola API.
Disponibilità
Sia Google Cloud Dataflow che Google Cloud Pub/Sub sono disponibili oggi.
Flusso di dati di Google Cloud
Iscriviti alla newsletter di StorageReview