Apache Hadoop Hizmetleri ve Temel Komutlar

Apache Hadoop Hizmetleri ve Temel Komutlar

Büyük veri denilince akla ilk gelen araçlardan olan Apache Hadoop’u kısaca tanımaya ne dersiniz?
Seda Kayademir26 Eki 2022

Hadoop dağıtılmış dosya sistemi (HDFS) , Hadoop çerçevesi için Java ile yazılmış dağıtılmış, ölçeklenebilir ve taşınabilir bir dosya sistemidir. Bir Hadoop örneği, HDFS ve MapReduce'a bölünmüştür. Verileri depolamak için HDFS kullanılır ve verileri işlemek için MapReduce kullanılır. HDFS'nin aşağıdaki gibi beş hizmeti vardır.

 

Namenode

HDFS, master node üzerinde namenode arka plan programı çalışır. Namenode, dosya sistemi hakkındaki meta verileri fsimage adlı bir dosyada saklar ve yönetir. Bu meta veriler, okuma sırasında istemcilere daha hızlı erişim sağlamak için ana bellekte önbelleğe alınır. Namenode’un istemciyle doğrudan teması vardır. Namenode, dosyaların bloklara nasıl bölündüğünü yönetir ve kontrol eder, dağıtılmış dosya sisteminin genel durumu ve uygunluğu ile birlikte bu blokları hangi bağımlı düğümün depolaması gerektiğini tanımlar.
 

Secondary namenode

İkincil Namenode, Namenode için bir yedek değildir. İkincil Namenode'un işi, dosya sistemini periyodik olarak okumak, değişiklikleri günlüğe kaydetmek ve bunları fsimage dosyasına uygulamaktır. Bu, şekilde gösterildiği gibi bir dahaki sefere daha hızlı başlamak için Namenode'un güncellenmesine yardımcı olur.

 

Datanode

Hadoop kümesi, her bağımlı düğümde çalışan datanode arka plan programından oluşur. Datanode'lar, HDFS'de depolanan dosyalarda veri bloklarını ve hizmet okuma/yazma isteklerini depolayan HDFS'nin birincil depolama öğeleridir. Bunlar namenode tarafından kontrol edilir. Datanodes'ta depolanan bloklar, güvenilirlik ve yüksek kullanılabilirlik sağlamak için yapılandırmaya göre çoğaltılır. Bu çoğaltılmış bloklar, hızlı hesaplama sağlamak için küme boyunca dağıtılır.

 

Jobtracker

JobTracker hizmeti ana düğümde çalışır ve TaskTracker tarafından salve düğümlerinde yürütülen mapreduce görevlerini izler. Masternode ile etkileşim halinde olan kullanıcı, işi JobTracker'a gönderir. JobTracker daha sonra namenode'dan işlenecek verilerin HDFS'deki gerçek konumunu sorar. Jobtracker, tasktracker'ı bağımlı düğümlerde bulur ve işleri bağımlı düğümlerde tasktracker'a gönderir. TaskTracker, belirli bir bağımlı düğümdeki tasktracker'ın canlı olduğundan ve tahsis edilen işi yürüttüğünden emin olmak için düzenli aralıklarla JobTracker'a sinyal mesajı gönderir. Kalp atışı mesajı öngörülen bir süre içinde alınmazsa, belirli bir kurtarma düğümündeki tasktracker'ın işlevsel olmadığı kabul edilir ve atanan iş başka bir tasktracker'da planlanır. Jobtracker ve tasktracker, mapreduce motoru olarak bilinir. Jobtracker, hadoop mapreduce hizmeti için tek bir hata noktasıdır, eğer kapanırsa tüm yürütme işleri durdurulur.

 

Tasktracker

Tasktracker arka plan programı, bir kümenin bağımlı düğümlerinde çalışır. Jobtracker'dan işleri kabul eder ve mapreduce işlemlerini yürütür. Her tasktracker, bir düğümün yeteneğine bağlı olarak sınırlı sayıda "görev yuvasına" sahiptir. Kalp atışı protokolü, jobtracker'ın bir bağımlı düğümde tasktracker'da kaç tane "görev yuvası" bulunduğunu bilmesine izin verir. Kaç tane boş görev yuvası bulunduğuna bağlı olarak uygun işleri belirli tasktracker'a tahsis etmek jobtracker'ın görevidir.
 

HDFS temel komutları

  • Listeleme 
hdfs dfs -ls /
  • Klasör oluşturma
hdfs dfs -mkdir /user/train/miuul
  • HDFS üzerinde grup değiştirme
hdfs dfs -chown train:train /user/train/Advertising.csv
  • HDFS üzerindeki dosyayı -head ile okuma
hdfs dfs -head /user/train/miuul/Advertising.csv
  • HDFS’den bulunduğumuz dizine dosya aktarımı
hdfs dfs -get /user/train/Advertising.csv
  • Linux local’den HDFS üzerine kopyalama
hdfs dfs -put ~/datasets/Advertising.csv /user/train/miuul
  • HDFS üzerinde -mv ile dosya taşıma
hdfs dfs -mv /user/train/miuul/Advertising.csv /user/train
  • HDFS üzerinde -cp ile dosya kopyalama
hdfs dfs -cp /user/train/miuul/Advertising.csv /user/train/miuul
  • HDFS üzerinde -rm ile dosya silme
hdfs dfs -rm -skipTrash /user/train/Advertising.csv

 

Kaynaklar

Miuul topluluğunun bir parçası ol!

Abone ol butonuna tıklayarak Miuul'dan pazarlama ve haber içerikleri almayı onaylıyorum.