Einkaufswagen 0

Microsoft Azure

Data Engineering on Microsoft Azure

Ihr Nutzen

Dieses Seminar richtet sich an Daten-Analysten, die mit HDInsight Cluster, Spark, Stream Analytics Big-Data Workflows implementieren möchten.

4,62

Zielgruppe

IT Professional

Voraussetzungen

Kenntnisse des Windows Betriebssystem von Datenanalyse und Statistik und Kenntnisse der Programmiersprache R.

Dauer und Investition

Seminardauer: 4 Tag(e)
€ 2.360,- pro Teilnehmer excl. MwSt.
Individuelle Firmenseminare
Frühbucher-Bonus möglich
Mehr Teilnehmer?
Punktekarte

Termine

Ihr Wunschtermin ist nicht dabei?
Mich bei Termingarantie benachrichtigen.

Hinweis

DP203-T00,

Original-Seminar

DP203-T00 mit digitalen Seminarunterlagen.

Inhalte

Alle Details anzeigen

1. Tag

Einführung in HDInsight
Was ist Big Data?
Einführung in Hadoop
Arbeiten mit der MapReduce Funktion
Einführung in HDInsight

Bereitstellen von HDInsight
HDInsight Cluster Types
Verwaltung über das Azure Portal und Azure PowerShell

Benutzer und Berechtigungen
Domain-Joined und Non-Domain Joined Clusters
Verwaltung über die Azure PowerShell
Das Ambari Management UI
Das Ranger Admin UI
Hive Polices

Daten in HDInsight laden
Speicher fpr HDInsight
Azure Blob und Azure Data Lake Storage
Verwenden der Data Loading Tools

2. Tag

Troubleshooting und Logging in HDInsight
HDInsight Logs
YARN Logs
Heap Dumps
OMS

Batch Solutions
Apache Hive Storage
Data Queries mit Hive und Pig

Batch ETL Solutions mit Spark
Was ist Spark?
ETL mit Spark

3. Tag

Daten mit Spark SQL analysieren
Interative und interaktive Abfragen
Verwenden von Zeppelin und Livy

Daten mit Hive und Phoenix analysieren
Interaktive Abfragen mit interactive hive
Interactive Processing mit Apache Phoenix

4. Tag

Stream Analytics
Verarbeiten von Streaming Daten
Verwalten von Stream Analytics Jobs

Implmentierung von Streaming Solutions
Aufbau und Bereitstellung eines Kafka Clusters
Storm Cluster, Kafka Producer und Power BI Dashboards
Publizieren und Nutzen des Kafka Clusters
Verwenden von HBase für Storage und Abfrage

5. Tag

Real Time Processing Solutions mit Apache Storm
Streaming von Daten mit Storm
Storm Topologies

Spark Streaming Applications erstellen
Arbeiten mit Spark Streaming
Spark Structured Streaming Applications
Erstellen einer Spark Streaming Pipeline
Verwenden von DStreams

Beschreibung

Microsoft Azure bietet eine Vielzahl von Daten-Analyse Lösungen in der Cloud an.

Zertifizierungen

70-775 Hadoop in the Cloud

Achtung: Dieses Seminar wird in dieser Version nicht mehr offen angeboten. Bitte kontaktieren Sie Ihren Bildungsberater für eine aktualisierte Version.