Schulungen

meet-the-experts-logo-weiss

Wissen, das Sie persönlich weiterbringt, weil Sie es sofort anwenden können – das versprechen unsere neuesten Schulungen und Workshops.

HDP Operations: HDP Administration 1

Beschreibung:

Apache Hadoop ist eine der umfassendsten und populärsten Lösungen für die aktuellen Herausforderungen im Umfeld von Big Data. Hadoop 2.x bietet dabei sowohl eine skalierbare und zuverlässige Plattform für das Speichern von großen Datenmengen unterschiedlicher Struktur und Herkunft als auch zahlreiche Werkzeuge und Paradigmen für deren Verarbeitung. Zudem existiert rund um diese Kernfunktionalitäten eine Vielzahl von zusätzlichen Open Source Projekten und Softwarelösungen, die Apache Hadoop 2.x zu einer funktionsreichen Plattform rund um Big Data machen.  Das viertägige Training richtet sich an Administratoren und DevOps, die Apache Hadoop 2.x Cluster auf Basis der Hortonworks Data Platform mit Ambari installieren, managen und verstehen wollen. Dieses praxisorientierte Training wird in Zusammenarbeit mit Hortonworks angeboten (siehe Original-Kursbeschreibung) und unsere erfahrenen Trainer teilen ihr Wissen und ihre Erfahrung in ca. 60% Theorie & Diskussionen sowie ca. 40% Labs & Übungen am eigenen Rechner mit Ihnen. Dieser Kurs bereitet auf die Zertifizierung zum HDP Certified Administrator (HDPCA) vor, welche nach diesem Training über den Anbieter www.examslocal.com am eigenen Rechner abgelegt werden kann (Weitere Details zur Zertifizierung).

Schulungssprache

Deutsch, Material auf Englisch

Termine und Ort

  • 27.02.-02.03.2017 - Frankfurt am Main
  • 15.05.-18.05.2017 - Frankfut am Main

Teilnahmegebühr

2.400 € EUR zzgl. MwSt.

Anmeldeformular


Teilnahmevoraussetzungen und Zielgruppe

  • Administratoren & DevOps, die verantwortlich sind für die Installation, den Betrieb und den Support von Hadoop-Clustern auf Basis der Hortonworks Data Platform (HDP) 2.3 mit Apache Ambari
  • Basiskenntnisse in Linux werden vorausgesetzt
  • Grundkenntnisse in Apache Hadoop sind hilfreich, aber nicht zwingend erforderlich
  • Jeder Teilnehmer bekommt für die Dauer des Trainings eine vorkonfigurierte HDP 2.3 Umgebung über Amazon AWS zur Verfügung gestellt. Daher benötigen die Teilnehmer lediglich einen zeitgemäßen Rechner zum Verbinden mit dieser Umgebung:
    • Zeitgemäße CPU mit 2+ GHz (bevorzugt Intel i5/i7 oder äquivalente AMD-Architektur
    • 2+ GB RAM
    • 2 GB freier Speicherplatz
    • Firefox, Chrome oder Safari (Internet Explorer wird aktuell nicht unterstützt)

Trainer:

Uwe Printz

Uwe Printz ist Data Architect und Trainer. Seit dem ersten Kontakt mit verteilten Systemen lässt seine Begeisterung dafür nicht nach und zurzeit hält er sich bevorzugt im Hadoop-Zoo auf.

Inhalte:

 Themen:

  • Überblick über Enterprise Big Data Architekturen auf Basis von Hadoop und der Hortonworks Data Platform (HDP)
  • Installation von HDP
  • Benutzer- und Gruppenmanagement mit Ambari
  • Management von Hadoop Services
  • Benutzung, Management und Konfiguration von HDFS
  • Datenverschlüsselung mittels HDFS Transparent Data Encryption
  • Ressourcenmanagement mit Apache YARN
  • Einstellen von YARN Jobs
  • Konfiguration von YARN und des Capacity Schedulers
  • Hinzufügen und Entfernen von Clusterknoten
  • Konfiguration von Rack Awareness auf Ebene von HDFS und YARN
  • Konfiguration von Hochverfügbarkeit auf Ebene von HDFS und YARN
  • Monitoring eines Hadoop-Clusters
  • Backup-Konzepte für Hadoop-Cluster

Hands-on Labs:

  • Einführung in die Trainingsumgebung
  • Durchführung einer HDP-Installation mit Ambari
  • Konfiguration von Benutzern und Gruppen in Ambari
  • Management von Hadoop Services
  • Benutzung des verteilten Dateisystems HDFS
  • Benutzung von WebHDFS
  • Konfiguration von ACL’s in HDFS
  • Konfiguration von HDFS
  • Konfiguration von Quotas in HDFS
  • Konfiguration von HDFS Transparent Data Encryption
  • Konfiguration und Benutzung von YARN
  • Verwaltung von Nicht-YARN-Ressourcen
  • Konfiguration der YARN Fehlertoleranz, Joberhaltung und des Log-Aggregations-Services
  • Einstellen von YARN Jobs
  • Konfiguration von YARN für unterschiedliche Lastverhalten
  • Konfiguration von Benutzer und Gruppen in YARN
  • Konfiguration des Job Scheduling Mechanismus
  • Feintuning der Benutzer-, Gruppen und YARN-Einstellungen
  • Hinzufügen von Worker Nodes
  • Konfiguration von Rack Awareness
  • Konfiguration von HDFS Hochverfügbarkeit
  • Konfiguration von YARN Hochverfügbarkeit
  • Konfiguration und Management von Ambari Alerts
  • Konfiguration und Management von HDFS Snapshots
  • Benutzung von Distributed Copy (DistCP)

Tag 1

  • Einführung in Big Data, Hadoop und die Hortonworks Data Plattform
  • Verwaltung von Benutzern und Gruppen in Ambari
  • Verwaltung von Hadoop Services
  • Benutzung von HDFS

Tag 2

  • Benutzung von WebHDFS
  • Verwendung von HDFS ACL’s
  • Verwaltung und Architektur von HDFS
  • Arbeiten mit HDFS Quotas
  • Ressourcenmanagement mit YARN

Tag 3

  • YARN-Applikationen
  • Hinzufügen, Ersetzen und Entfernen von Worker Nodes
  • YARN Capacity Scheduler
  • Konfiguration von Rack Awareness

Tag 4

  • HDFS und YARN Hochverfügbarkeit
  • Monitoring eines HDP-Clusters mit Ambari
  • Backup-Strategien für Hadoop-Cluster
  • Installation der Hortonworks Data Platform