Big Data on AWS

Acest curs a fost retras din portofoliul vendorului.

Cursul certificat Big Data on AWS este un curs de 3 zile din care veți afla despre soluțiile de “big data” bazate pe cloud și Amazon Elastic MapReduce (EMR) și AWS Big Data Platform. 

În cadrul acestui program de training Amazon Cloud, veți învăța cum să folosiți Amazon EMR pentru a prelucra date folosind instrumente ecosistemice Hadoop precum Pig și Hive. Alte subiecte abordate în acest curs includ modalitatea de a crea medii de tip “big data” utilizând Amazon DynamoDB, Amazon Redshift și Amazon Kinesis.

Alege cursul certificat Amazon Big Data on AWS, pentru o carieră de succes! Bittnet Training îți oferă cursuri AWS live – online pentru a te ajuta să îți dezvolți cunoștințele și performanțele!

Cui i se adresează?

Acest curs este destinat: 

  • Persoanelor responsabile de proiectarea și implementarea soluțiilor de date mari, și anume Solutions Architects și SysOps Administrators 
  • Data Scientists și Data Analysts interesați să descopere mai în profunzime soluțiile AWS Big Data 

Ce vei învăța?

Participanții la acest curs vor învăța: 

  •  Să utilizeze Apache Hadoop cu Amazon EMR 
  •  Să lanseze și să configureze un cluster Amazon EMR 
  •  Să folosească framework-uri comune de programare pentru Amazon EMR, Hive, Pig și Streaming 
  •  Să utilizeze Hue pentru a îmbunătăți utilizărea Amazon EMR 
  •  Să efectueze analize de date în memorie cu Spark și Shark pe Amazon EMR 
  •  Să înțelegă cum pot fi utilizate servicii precum AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena și Amazon QuickSight cu fluxuri de lucru big data 

Cerințe preliminare:

Recomandăm ca participanții la acest curs: 

  • Să fie familiarizațicu tehnologiile de bază “big data”, inclusiv Apache Hadoop, HDFS și interogări SQL / NoSQL 
  • Să cunoascănoțiunile fundamentale privind analiza datelor completate, formare digitală gratuită sau experiență echivalentă 
  • Să aibăunoștințe practice despre serviciile AWS de bază și implementarea cloud-ului public 
  • Săcunoască procesele de bază a stocării datelor, a sistemelor de baze de date relaționale și a proiectării bazelor de date 
  • Să participe lacursul AWS Technical Essentials   

 

Agenda cursului:

Materialele de curs sunt în limba Engleză. Predarea se face în limba Română.

Day One

Module 1: Overview of Big Data

  • What is big data
  • The big data pipeline
  • Big data architectural principals

Module 2: Big Data ingestion and transfer

  • Overview: Data ingestion
  • Transferring data

Module 3: Big data streaming and Amazon Kinesis

  • Stream processing of big data
  • Amazon Kinesis
  • Amazon Kinesis Data Firehose
  • Amazon Kinesis Video Streams
  • Amazon Kinesis Data Analytics
  • Hands-on lab 1: Streaming and Processing Apache Server Logs Using Amazon Kinesis

Module 4: Big data storage solutions

  • AWS data storage options
  • Storage solutions concepts
  • Factors in choosing a data store

Module 5: Big data processing and analytics

  • Big data processing and analytics
  • Amazon Athena
  • Hands-on lab 2: Using Amazon Athena to Analyze Log Data

Day Two

Module 6: Apache Hadoop and Amazon EMR

  • Introduction to Amazon EMR and Apache Hadoop
  • Best practices for ingesting data
  • Amazon EMR
  • Amazon EMR architecture
  • Hands-on lab 3: Storing and Querying Data on Amazon DynamoDB

Module 7: Using Amazon EMR

  • Developing and running your application
  • Launching your cluster
  • Handling output from your completed jobs

Module 8: Hadoop programming frameworks

  • Hadoop frameworks
  • Other frameworks for use on Amazon EMR
  • Hands-on lab 4: Processing Server Logs with Hive on Amazon EMR

Module 9: Web interfaces on Amazon EMR

  • Hue on Amazon EMR
  • Monitoring your cluster
  • Hands-on lab 5: Running Pig Scripts in Hue on Amazon EMR

Module 10: Apache Spark on Amazon EMR

  • Apache Spark
  • Using Spark
  • Hands-on lab 6: Processing NY Taxi Data Using Apache Spark

Day Three

Module 11: Using AWS Glue to automate ETL workloads

  • What is AWS Glue?
  • AWS Glue: Job orchestration

Module 12: Amazon Redshift and big data

  • Data warehouses vs. traditional databases
  • Amazon Redshift
  • Amazon Redshift architecture

Module 13: Securing your Amazon deployments

  • Securing your Amazon deployments
  • Amazon EMR security overview
  • AWS Identity and Access Management (IAM) overview
  • Securing data
  • Amazon Kinesis security overview
  • Amazon DynamoDB security overview
  • Amazon Redshift security overview

Module 14: Managing big data costs

  • Total cost considerations for Amazon EMR
  • Amazon EC2 pricing models
  • Amazon Kinesis pricing models
  • Cost considerations for Amazon DynamoDB
  • Cost considerations and pricing models for Amazon Redshift
  • Optimizing cost with AWS

Module 15: Visualizing and orchestrating big data

  • Visualizing big data
  • Amazon QuickSight
  • Orchestrating a big data workflow
  • Hands-on lab 7: Using TIBCO Spotfire to visualize data

Module 16: Big data design patterns

Common architectures

Module 17: Course wrap-up

What’s next?

Recomandăm să continui cu:

Programe de certificare

Big Data on AWS

Big Data on AWS

Oferte personalizate pentru grupuri de minim 2 persoane

Detalii curs

Durată:

3
zile

Preț:

1440 EUR

Livrare:

Predare în clasă, Clasă hibridă, Clasă virtuală

Nivel:

3. Intermediate

Roluri:

Architect, Developer

Oferte personalizate pentru grupuri de minim 2 persoane