Apache Hadoop Eğitimi

Hadoop, bilgi ve cevap edinmek için büyük ve karmaşık veri kümelerini işleyebilir, böylece tüm anlaşılmazlıkları açıklığa kavuşturur.
Hadoop Eğitimi, başarılı bir Hadoop developer olabilmek için gerekli bilgi ve tekniklerini aktarılmasını amaçlar. Hadoop Eğitimi süresince, derinlemesine bilgi ve olay çalışmaları ile Hadoop’un amacına uygun olarak kendi alanlarında nasıl kullanıldığını öğrenirsiniz.

Apache Hadoop Eğitim İçeriği

Eğitim Süresi: 5 Gün

1. Big Data ve Hadoop’un Anlaşılması

  • Big Data (Büyük Veri)
  • Mevcut Veri Analitiği Mimarisi Limitasyonu ve Mimarisi
  • Hadoop Nedir?
  • Hadoop Özellikleri
  • Hadoop Ekosistemi
  • Hadoop 2.x core Bileşenleri
  • Hadoop Storage: HDFS
  • Hadoop MapReduce Framework
  • Yazma ve Okuma Dosyalarının Anatomisi
  • Rack Awareness

2. Hadoop Mimarisi (Architecture) ve HDFS

  • Hadoop 2.x Cluster Mimarisi
  • Devamlılık Süresi (High Availibility)
  • Federation
  • Tipik bir Hadoop Cluster Ürünü
  • Hadoop 2.x MapReduce Mimarisi
  • Hadoop 2.x MapReduce Bileşenleri
  • Yaygın Hadoop Shell Komutları
  • Hadoop 2.x Kongigürasyon Dosyaları
  • Password-Less SSH
  • MapReduce İş Düzenlemesi
  • Veri Yükleme Teknikleri
  • Hadoop Copy Komutları
  • FLUME
    SQOOP

3. Hadoop MapReduce Framework- 1

  • MapReduce Kullanma Durumları
  • Geleneksel Yöntemler vs. MapReduce Yöntemi
  • Neden MapReduce?
  • Hadoop 2.x MapReduce Mimarisi
  • Hadoop 2.x MapReduce Bileşenleri
  • YARN MR Uygulama Yürütme Akışı
  • YARN İş Akışı
  • Hadoop MapReduce Programının Anatomisi
  • Hadoop MapReduce Üzerinde Demo

4. Hadoop MapReduce Framework- 2

  • Giriş Splits
  • HDFS Blokları ve Splits Girişleri Arasında İlişki
  • MapReduce İş Submission Akışı
  • Giriş Splits Demosu
  • MapReduce: Combiner (Katıştırıcı) ve Partition (Paylaştırma)
  • De-Identifying Health Care Data Set on Demo
  • Demo on Weather Data Set

5. Gelişmiş MapReduce

  • Counters (Sayaç)
  • Distrubuted Cache
  • MRunit
  • Reduce Join
  • Özel Giriş Formatı
  • Giriş Formatı Sequence

6. Hadoop – Pig

  • Pig Hakkında
  • Pig vs. MapReduce
  • Pig Kullanma Durumları
  • Pig İçinde Programlama Yapısı
  • Pig Çalıştırma Modları
  • Pig Execution
  • Pig Latin Program
  • Pig İçinde Veri Modelleri
  • Pig Veri Türleri

7. Hadoop – Hive

  • Hive Background
  • Hive Kullanma Durumları
  • Hive Nedir?
  • Hive Hakkında
  • Hive vs. Pig
  • Hive Mimarisi ve Bileşenleri
  • Hive Metastore
  • Hive Limitasyonu
  • Geleneksel Veritabanı ile Kıyaslama
  • Hive Veri Türleri ve Veri Modelleri
  • Paylaştırma (Partitions) ve Buckets
  • Hive Tabloları
  • Veri Import Etmek
  • Sorgu Verisi (Querying Data)
  • Hive Script
  • Hive UDF
  • Hive Demo on Health Care Data Set

8. Gelişmiş Hive ve HBase

  • Hive QL: Tablolar Katma
  • HBase Shell
  • Dinamik Paylaştırma
  • Özel MapReduce Scriptleri
  • Hive: Thrift Server
  • Kullanıcı Tanımlı Fonksiyonlar
  • HBase: SQL’siz Veritabanlarına HBase’ye Giriş
  • HBase vs. RDBMS
  • HBase Bileşenleri
  • HBase Mimarisi
  • HBase Cluster Yerleştirme

9. Hadoop Gelişmiş HBase

  • HBase Veri Modeli
  • HBase Shell
  • HBase Client API
  • Veri Yükleme Teknikleri
  • ZooKeeper Veri Modeli
  • ZooKeeper Servisi
  • ZooKeeper Hakkında
  • Bulk Looading
  • Veri Eklemek ve Edinmek
  • HBase İçinde Filtreler

10. Oozie ve Hadoop Projesi

  • Flume ve Sqoop Demosu
  • Oozie Nedir?
  • Oozie Hakkında
  • Oozie Bileşenleri
  • Oozie İş Akışı
  • Oozie ile İş Programı Yapma
  • Oozie İş Akışı (Workflow) Demo
  • Oozie Co-ordianator
  • Oozie Komutları
  • Oozie Web Konsolu
  • Demo Hadoop Projesi