Maîtrisez l'utilisation des technologies Hadoop Maîtrisez l'utilisation des technologies Hadoop
Maîtrisez l'utilisation des technologies Hadoop Maîtrisez l'utilisation des technologies Hadoop

Maîtrisez l'utilisation des technologies Hadoop

À propos

Le manuel d'apprentissage de référence. Cet ouvrage est un manuel d'apprentissage technique qui a été rédigé pour toute personne souhaitant développer des compétences sur une ou plusieurs technologie(s) de l'écosystème Hadoop. Il permet d'utiliser de façon professionnelle 18 technologies clés de l'écosystème Hadoop : Spark, Hive, Pig, Impala, ElasticSearch, HBase, Lucene, HAWQ, MapReduce, Mahout, HAMA, Tez, Phoenix, YARN, ZooKeeper, Storm, Oozie et Sqoop. L'ouvrage permet d'initier les débutants pour les emmener vers une utilisation professionnelle de ces technologies. Pour faciliter la compréhension de l'ouvrage, chaque chapitre s'achève par un rappel des points clés et un guide d'étude qui permettent au lecteur de consolider ses acquis. Des compléments web sont également disponibles en téléchargement sur le site www.editions-eyrolles.com/dl/0067478. Au fil de la lecture de cet ouvrage, vous allez comprendre les approches conceptuelles de chacune de ces technologies pour rendre vos compétences indépendantes de l'évolution d'Hadoop. Vous serez finalement capable d'identifier les portées fonctionnelle, stratégique et managériale de chacune de ces technologies. À qui cet ouvrage s'adresse-t-il ? Aux consultants BI/big data, data scientists, chargés d'études et chefs de projets data. Aux étudiants désireux de s'orienter vers le big data. Plus généralement, à tout professionnel souhaitant prendre le virage du big data ou souhaitant valoriser les données de son entreprise.

Sommaire

Les modèles de calcul de l'écosystème Hadoop. Les modèles de calcul batch. Les modèles de calcul interactifs. Les abstractions des modèles de calcul d'Hadoop. Les langages d'abstraction d'Hadoop. Le SQL sur Hadoop. Le stockage de données en Hadoop. Généralités sur le stockage des données. HBase. L'indexation de contenu. Apache Lucene. ElasticSearch. La gestion du cluster Hadoop. YARN. Apache ZooKeeper. Le streaming en temps réel dans Hadoop. Apache Storm. Les outils annexes de l'écosystème Hadoop. Oozie et Sqoop. Hue et Ambari. Adoption à grande échelle d'Hadoop. Distributions d'Hadoop. Solutions Hadoop embarquées. Hadoop dans le Cloud. Le big data.

Rayons : Sciences & Techniques > Informatique > Données > Data Mining

  • EAN

    9782212674781

  • Disponibilité

    Disponible

  • Nombre de pages

    432 Pages

  • Longueur

    23 cm

  • Largeur

    19 cm

  • Épaisseur

    2.5 cm

  • Poids

    906 g

  • Distributeur

    Sodis

  • Support principal

    Grand format

Infos supplémentaires : Broché  

empty