Google heeft weer een nieuwe cloudtechnologie aangekondigd binnen zijn Cloud Platform-lijn, Google Cloud Dataproc. Deze nieuwe cloudtechnologie is erop gericht om Hadoop en Spark eenvoudiger te implementeren en te beheren binnen Google Cloud Platform. Net als de recente aankondiging van Dell en Cloudera, maakt deze technologie het gebruik van Hadoop mogelijk zonder de hoge opleidingskosten.
Google heeft weer een nieuwe cloudtechnologie aangekondigd binnen zijn Cloud Platform-lijn, Google Cloud Dataproc. Deze nieuwe cloudtechnologie is erop gericht om Hadoop en Spark eenvoudiger te implementeren en te beheren binnen Google Cloud Platform. Net als de recente aankondiging van Dell en Cloudera, maakt deze technologie het gebruik van Hadoop mogelijk zonder de hoge opleidingskosten.
Naarmate datasets in omvang en complexiteit blijven groeien, zullen krachtigere tools nodig zijn om deze datasets te analyseren. Hoewel de tools bestaan, voegen ze vaak een extra laag complexiteit toe en kunnen ze kostbaar zijn om beheerders te trainen in nieuwe technologieën of om consultants in te schakelen. Google introduceert Dataproc, een automatische en beheerde service voor Hadoop en Spark. Met Dataproc kunnen gebruikers profiteren van open source datatools voor batchverwerking, query's, streaming en machine learning, terwijl ze de automatisering gebruiken om snel clusters te maken en te beheren. Met Dataproc kunnen clusters ook worden uitgeschakeld wanneer ze niet in gebruik zijn, wat kosten bespaart omdat de facturering per minuut plaatsvindt.
Voordelen zijn onder andere:
- Cloud Dataproc kost slechts 1 cent per virtuele CPU in het cluster van een klant per uur, bovenop de andere gebruikte Cloud Platform-bronnen. Cloud Dataproc-clusters kunnen verwijderbare instanties bevatten met lagere rekenprijzen, waardoor de kosten verder worden verlaagd. In plaats van het gebruik af te ronden op het dichtstbijzijnde uur, brengt Cloud Dataproc klanten alleen in rekening voor wat wordt gebruikt met facturering per minuut en een minimale factureringsperiode van tien minuten.
- Zonder Dataproc te gebruiken, kan het 5 tot 30 minuten duren om Spark- en Hadoop-clusters op locatie of via IaaS-providers te maken. Ter vergelijking: Cloud Dataproc-clusters kunnen snel worden gestart, geschaald en afgesloten, waarbij elk van deze bewerkingen gemiddeld 90 seconden of minder in beslag neemt. Dit betekent dat gebruikers minder tijd hoeven te besteden aan het wachten op clusters en meer hands-on tijd kunnen besteden aan het werken met hun gegevens.
- Cloud Dataproc heeft ingebouwde integratie met andere Google Cloud Platform-services, zoals BigQuery, Cloud opslag, Cloud Bigtable, Cloud Logging en Cloud Monitoring, zodat klanten meer hebben dan alleen een Spark- of Hadoop-cluster: ze hebben een compleet dataplatform. Ze kunnen bijvoorbeeld Cloud Dataproc gebruiken om moeiteloos terabytes aan onbewerkte loggegevens rechtstreeks naar BigQuery te ETL voor zakelijke rapportage.
- Klanten kunnen eenvoudig communiceren met clusters en Spark- of Hadoop-taken via de Google Developers Console, de Google Cloud SDK of de Cloud Dataproc REST API. Als ze klaar zijn met een cluster, kunnen ze het eenvoudig uitschakelen, zodat er geen geld wordt verspild aan een inactief cluster. U hoeft zich geen zorgen te maken over gegevensverlies, want Cloud Dataproc is geïntegreerd met Cloud Storage, BigQuery en Cloud Bigtable.
- Het is niet nodig om nieuwe tools of API's te leren om Cloud Dataproc te gebruiken, waardoor het eenvoudig is om bestaande projecten naar Cloud Dataproc te verplaatsen zonder herontwikkeling. Spark, Hadoop, Pig en Hive worden regelmatig bijgewerkt, zodat gebruikers sneller productief kunnen zijn.
Beschikbaarheid en prijzen
Google Cloud Dataproc is nu beschikbaar als bètaservice vanaf $ 0.01 per virtuele CPU.
Meld u aan voor de StorageReview-nieuwsbrief