BIG DATA ON AWS (AMAZON WEB SERVICES)

Formation : 13110

RÉFÉRENCE INTERNE DE LA FORMATION :

BIG DATA ON AWS (AMAZON WEB SERVICES)

Description de la formation

BIG DATA ON AWS (AMAZON WEB SERVICES)

Durée : 3 jours

Résumé

La formation Big Data sur AWS présente des solutions de Big Data basées sur le cloud ainsi qu'Amazon Elastic MapReduce (EMR), la plate-forme de Big Data d'AWS. Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Pig et Hive. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift et Amazon Kinesis, et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.

Ce cours vous permet de tester de nouvelles compétences et d'appliquer vos connaissances à votre environnement de travail grâce à différents exercices pratiques.

Pré-requis

Pour assister à ce cours, il est recommandé :

d'avoir des connaissances de base sur les technologies Big Data, y compris Apache Hadoop et HDFS ; Il peut également être utile d'avoir des connaissances préalables concernant Pig, Hive et MapReduce, mais ce n'est pas une obligation.
de savoir utiliser les principaux services AWS et l'implémentation de cloud public ; Les participants doivent avoir suivi le cours notion de base AWS
de comprendre les concepts d'entrepôt de données, de système de base de données relationnelle et de conception de base de données.
Nous conseillons également de visionner deux modules gratuits accessibles aux liens suivants (en anglais) :
Intro Serie for EMR : http://sebs.to/VyOop3
Big Data Technology Fundamental (3 heures, elearning) : http://amzn.to/1udV10k
Objectifs

Comprendre les applications d'Apache Hadoop dans le contexte d'Amazon EMR
Comprendre l'architecture d'un cluster Amazon EMR
Lancer un cluster Amazon EMR en utilisant une image machine Amazon (AMI) et des types d'instances Amazon EC2 adaptés
Sélectionner les options de stockage de données sur AWS les plus adaptées dans le cadre de l'utilisation d'Amazon EMR
Connaître les différentes options d'importation, de transfert et de compression des données destinées à Amazon EMR
Utiliser les frameworks de programmation courants compatibles avec Amazon EMR, notamment Hive, Pig et Streaming
Utiliser Amazon Redshift pour déployer une solution de Big Data
Utiliser un logiciel de visualisation des Big Data
Sélectionner les options de sécurité les plus adaptées à Amazon EMR et à vos données
Effectuer des analyses de données en mémoire avec Spark et Shark sur Amazon EMR
Sélectionner les options adaptées pour gérer votre environnement Amazon EMR de façon rentable
Comprendre les avantages d'Amazon Kinesis pour les applications de Big Data

Contenu

Journée 1

Présentation générale des technologies Big Data et Apache Hadoop, et des avantages liés à l'utilisation d'Amazon EMR
Architecture d'Amazon EMR
Utilisation d'Amazon EMR
Lancement et utilisation d'un cluster Amazon EMR
Frameworks de programmation Hadoop
Journée 2

Utilisation de Hive pour les analyses de données publicitaires
Utilisation de la diffusion en continu pour les analyses de données du domaine des sciences de la vie
Présentation : Spark et Shark pour les analyses en mémoire
Utilisation de Spark et Shark pour les analyses en mémoire
Gestion des frais liés à Amazon EMR
Présentation générale des options de sécurité d'Amazon EMR
Importation, transfert et compression de données
Utilisation d'Amazon Kinesis pour le traitement en temps réel de Big Data
Journée 3

Utilisation d'Amazon Kinesis et d'Amazon EMR pour la diffusion en continu et le traitement de Big Data
Options de stockage de données sur AWS
Utilisation de DynamoDB avec Amazon EMR
Présentation : Amazon Redshift et les technologies Big Data
Utilisation d'Amazon Redshift pour les applications de Big Data
Visualisation et orchestration de Big Data
Utilisation de Tableau Desktop ou de Jaspersoft BI pour visualiser des Big Data

Destinataires de la formation

Personnes en charge de la conception et de l'implémentation de solutions de Big Data, c'est-à-dire architectes de solutions et administrateurs SysOps
Experts en science des données et analystes de données souhaitant découvrir les solutions de Big Data sur AWS

Mots-clés en rapport avec la formation

BIG DATA AWS