Kapsayıcı bellek sınırlarının ötesinde çalışıyor

Question 1

Hadoop v1'de, her 7 eşleyici ve düşürücü yuvasını 1 GB boyutunda atadım, eşleyicilerim ve indirgeyicilerim sorunsuz çalışıyor. Makinemde 8G bellek, 8 işlemci var. Şimdi YARN ile aynı uygulamayı aynı makinede çalıştırdığımda konteyner hatası alıyorum. Varsayılan olarak şu ayarlara sahibim:

  <property>
    <name>yarn.scheduler.minimum-allocation-mb</name>
    <value>1024</value>
  </property>
  <property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>8192</value>
  </property>
  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>8192</value>
  </property>

Bana hata verdi:

Container [pid=28920,containerID=container_1389136889967_0001_01_000121] is running beyond virtual memory limits. Current usage: 1.2 GB of 1 GB physical memory used; 2.2 GB of 2.1 GB virtual memory used. Killing container.

Daha sonra mapred-site.xml'de bellek sınırı ayarlamaya çalıştım:

  <property>
    <name>mapreduce.map.memory.mb</name>
    <value>4096</value>
  </property>
  <property>
    <name>mapreduce.reduce.memory.mb</name>
    <value>4096</value>
  </property>

Ama yine de hata alıyorum:

Container [pid=26783,containerID=container_1389136889967_0009_01_000002] is running beyond physical memory limits. Current usage: 4.2 GB of 4 GB physical memory used; 5.2 GB of 8.4 GB virtual memory used. Killing container.

Harita görevinin neden bu kadar belleğe ihtiyacı olduğunu kafam karıştı. Anladığım kadarıyla haritam / azaltma görevim için 1GB hafıza yeterli. Neden konteynere daha fazla bellek atadıkça görev daha çok kullanıyor? Her görevin daha fazla bölünmesi mi? Kabın boyutunu biraz küçültmenin ve daha fazla kap oluşturmanın daha verimli olduğunu düşünüyorum, böylece daha fazla görev paralel olarak çalışıyor. Sorun şu ki, her bir konteynere başa çıkabileceğinden daha fazla bölme atanmayacağından nasıl emin olabilirim?

Question 2

Ayrıca MapReduce için maksimum bellek ayırmalarını doğru şekilde yapılandırmalısınız. Gönderen bu HortonWorks öğretici :

[...]

Kümemizdeki her makinede 48 GB RAM bulunmaktadır. Bu RAM'in bir kısmı İşletim Sistemi kullanımı için> ayrılmalıdır. Her düğümde, İşletim Sistemi için kullanmak ve 8 GB'ı kullanmak üzere YARN için 40 GB RAM atayacağız

Örnek kümemiz için, bir Konteyner için minimum RAM'e sahibiz (iplik.scheduler.minimum-ayırma-mb) = 2 GB. Bu nedenle, Harita görevi Kapsayıcıları için 4 GB ve Görevleri Azaltma Kapsayıcıları için 8 GB atayacağız.

Mapred-site.xml'de:

mapreduce.map.memory.mb: 4096

mapreduce.reduce.memory.mb: 8192

Her Konteyner, Harita ve Azaltma görevleri için JVM'leri çalıştıracaktır. JVM yığın boyutu, YARN tarafından ayrılan Konteyner belleğinin sınırları içinde olmaları için yukarıda tanımlanan Eşleme ve Azaltma belleğinden daha düşük bir değere ayarlanmalıdır.

Mapred-site.xml'de:

mapreduce.map.java.opts: -Xmx3072m

mapreduce.reduce.java.opts: -Xmx6144m

Yukarıdaki ayarlar , Harita ve Azaltma görevlerinin kullanacağı fiziksel RAM'in üst sınırını yapılandırır .

Özetlersek:

mapreduceYARN'da yapılandırmaları kullanmalısınız , mapredolanları değil . DÜZENLEME: Sorunuzu düzenlediğiniz için bu yorum artık geçerli değil.
Yapılandırmakta olduğunuz şey, tahsis edilecek maksimum miktar değil, aslında ne kadar talep etmek istediğinizdir.
Maksimum limitler, java.optsyukarıda listelenen ayarlarla yapılandırılır .

Son olarak, benzer bir sorunu (ve çözümü) tanımlayan bu diğer SO sorusunu kontrol etmek isteyebilirsiniz .

Question 3

Sanal ve Fiziksel bellek kullanım oranı için İplik seviyesinde bir kontrol vardır. Sorun sadece sanal makinenin yeterli fiziksel belleğe sahip olmaması değildir. Ancak bunun nedeni, sanal bellek kullanımının belirli fiziksel bellek için beklenenden fazla olmasıdır.

Not : Bu, sanal belleğin agresif tahsisi nedeniyle Centos / RHEL 6'da oluyor.

Aşağıdakilerden biri çözülebilir:

Ayarlayarak devre dışı bırak sanal bellek kullanımı kontrol yarn.nodemanager.vmem-çek özellikli etmek yanlış ;
İplik.nodemanager.vmem-pmem oranını daha yüksek bir değere ayarlayarak VM: PM oranını artırın .

Referanslar :

https://issues.apache.org/jira/browse/HADOOP-11364

http://blog.cloudera.com/blog/2014/04/apache-hadoop-yarn-avoiding-6-time-consuming-gotchas/

İplik-site.xml'de aşağıdaki özelliği ekleyin

 <property>
   <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
    <description>Whether virtual memory limits will be enforced for containers</description>
  </property>
 <property>
   <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>4</value>
    <description>Ratio between virtual memory to physical memory when setting memory limits for containers</description>
  </property>

Question 4

EMR'de HIVE kullanırken gerçekten benzer bir sorun yaşadım. Mevcut çözümlerin hiçbiri benim için işe yaramadı - yani, mapreduce yapılandırmalarının hiçbiri benim için çalışmadı; ve hiçbiri yarn.nodemanager.vmem-check-enabledyanlış ayarlamadı .

Bununla birlikte, sonuçta işe yarayan şey ayarlanmaktı tez.am.resource.memory.mb, örneğin:

hive -hiveconf tez.am.resource.memory.mb=4096

İnce ayar yapmayı düşünmeniz gereken başka bir ayar da yarn.app.mapreduce.am.resource.mb

Question 5

Düşük itibar nedeniyle kabul edilen cevap hakkında yorum yapamam. Ancak, eklemek isterim ki, bu davranış tasarım gereğidir. NodeManager, kapsayıcınızı öldürüyor. Harita azaltma görevinin alt süreci olarak çalışan hadoop akışını kullanmaya çalışıyorsunuz gibi görünüyor. NodeManager, görevin tüm işlem ağacını izler ve eğer sırasıyla mapreduce.map.memory.mb veya mapreduce.reduce.memory.mb'deki maksimum setten daha fazla bellek tüketirse, Nodemanager'ın görevi sonlandırmasını bekleriz, aksi takdirde Senin görevin, istemediğin diğer kaplara ait olan belleği çalmak.

Question 6

EMR'de kıvılcımla çalışırken aynı sorunu ve ayarı yaşıyordum maximizeResourceAllocation=true hile yaptı; umarım birine yardımcı olur. Kümeyi oluştururken ayarlamanız gerekir. Gönderen EMR docs:

aws emr create-cluster --release-label emr-5.4.0 --applications Name=Spark \
--instance-type m3.xlarge --instance-count 2 --service-role EMR_DefaultRole --ec2-attributes InstanceProfile=EMR_EC2_DefaultRole --configurations https://s3.amazonaws.com/mybucket/myfolder/myConfig.json

MyConfig.json şunu söylemelidir:

[
  {
    "Classification": "spark",
    "Properties": {
      "maximizeResourceAllocation": "true"
    }
  }
]

Question 7

Son zamanlarda bu sorunla da karşılaştık. Sorun eşleştirici belleğiyle ilgiliyse, kontrol edilmesi gereken birkaç şey önermek isterim.

Olmadığını kontrol edin birleştirici etkin olup ? Evet ise, bu, tüm kayıtlarda azaltma mantığının çalıştırılması gerektiği anlamına gelir (eşleyicinin çıktısı). Bu hafızada olur.Uygulamanıza bağlı olarak, birleştiriciyi etkinleştirmenin yardımcı olup olmadığını kontrol etmeniz gerekir. Takas, ağ aktarım baytları ile 'X' sayıda kayıt üzerinde azaltma mantığı için alınan zaman / bellek / CPU arasındadır.
- Birleştiricinin çok değerli olmadığını düşünüyorsanız, devre dışı bırakın.
- Birleştiriciye ihtiyacınız varsa ve 'X' çok büyük bir sayıysa (örneğin milyonlarca kayıt), o zaman ayırma mantığınızı değiştirmeyi düşünün (Varsayılan giriş biçimleri için daha az blok boyutu kullanın, normalde 1 blok boyutu = 1 bölme) tek eşleyici.
Tek bir eşleştiricide işlenen kayıt sayısı. Tüm bu kayıtların bellekte sıralanması gerektiğini unutmayın (eşleyicinin çıktısı sıralanır). Gerekirse, mapreduce.task.io.sort.mb'yi (varsayılan 200MB) daha yüksek bir değere ayarlamayı düşünün . mapred-configs.xml
Yukarıdakilerden herhangi biri yardımcı olmadıysa, eşleyici mantığını bağımsız bir uygulama olarak çalıştırmayı deneyin ve bir Profiler (JProfiler gibi) kullanarak uygulamanın profilini çıkarın ve belleğin nerede kullanıldığını görün. Bu size çok iyi bilgiler verebilir.

Question 8

Ubunto OS ile Windows Linux alt sisteminde iplik çalıştırma, hata "sanal bellek sınırlarının ötesine geçiyor, Killing container" İplik-site.xml dosyasında sanal bellek kontrolünü devre dışı bırakarak sorunu çözdüm

<property> <name>yarn.nodemanager.vmem-check-enabled</name> <value>false</value> </property>

Question 9

Şahsen kontrol etmedim , ancak hadoop-ipliği-konteyner-sanal-bellek-anlama-ve-çözme-konteyner-sanal-bellek-limitlerinin-ötesinde-çalışıyor-hataları çok mantıklı geliyor

Sorunu yarn.nodemanager.vmem-pmem-ratiodaha yüksek bir değere geçerek çözdüm ve şunu kabul ediyorum:

Daha az önerilen bir başka çözüm, iplik.nodemanager.vmem-check-enabled'i false olarak ayarlayarak sanal bellek kontrolünü devre dışı bırakmaktır.