X86 derlemesindeki kayıtlarda kullanılan push / pop komutlarının işlevi nedir?

Question 1

Sık sık onlar yazılı insanlara rastlamak montajcı hakkında okurken itmek işlemcinin belli bir kayıt ve pop tekrar sonradan önceki durumuna geri yüklemek için.

Bir kaydı nasıl itebilirsiniz? Nereye itiliyor? Bu neden gerekli?
Bu tek bir işlemci talimatına mı indirgeniyor yoksa daha karmaşık mı?

Question 2

bir değeri itmek (bir kayıtta saklanması gerekmez), onu yığına yazmak anlamına gelir.

popping , yığının tepesinde bulunan her şeyi bir kasaya geri yüklemek anlamına gelir . Bunlar temel talimatlardır:

push 0xdeadbeef      ; push a value to the stack
pop eax              ; eax is now 0xdeadbeef

; swap contents of registers
push eax
mov eax, ebx
pop ebx

Question 3

İşte bir kaydı nasıl ittiğiniz. X86 hakkında konuştuğumuzu varsayıyorum.

push ebx
push eax

Yığın üzerine itilir. Değeri ESPyığını 86 sistemlerinde aşağı doğru büyür olarak kayıt itilir değer boyutuna azaltılır.

Değerlerin korunması gerekir. Genel kullanım

push eax           ;   preserve the value of eax
call some_method   ;   some method is called which will put return value in eax
mov  edx, eax      ;    move the return value to edx
pop  eax           ;    restore original eax

A push, x86'da dahili olarak iki şey yapan tek bir talimattır.

Kaydı ESPitilen değerin boyutuna göre azaltın.
Basılan değeri mevcut ESPkayıt adresinde saklayın.

Question 4

Nereye itiliyor?

esp - 4. Daha kesin:

esp 4 çıkarılır
değer itilir esp

pop bunu tersine çeviriyor.

System V ABI, Linux'a rsp, program çalışmaya başladığında makul bir yığın konumuna işaret etmesini söyler : Program başladığında (asm, linux) varsayılan kayıt durumu nedir? bu genellikle kullanmanız gereken şeydir.

Bir kaydı nasıl itebilirsiniz?

Minimal GNU GAS örneği:

.data
    /* .long takes 4 bytes each. */
    val1:
        /* Store bytes 0x 01 00 00 00 here. */
        .long 1
    val2:
        /* 0x 02 00 00 00 */
        .long 2
.text
    /* Make esp point to the address of val2.
     * Unusual, but totally possible. */
    mov $val2, %esp

    /* eax = 3 */
    mov $3, %ea 

    push %eax
    /*
    Outcome:
    - esp == val1
    - val1 == 3
    esp was changed to point to val1,
    and then val1 was modified.
    */

    pop %ebx
    /*
    Outcome:
    - esp == &val2
    - ebx == 3
    Inverses push: ebx gets the value of val1 (first)
    and then esp is increased back to point to val2.
    */

Yukarıdaki çalıştırılabilir iddialarla GitHub'da .

Bu neden gerekli?

Bu talimatların mov, addve aracılığıyla kolayca uygulanabileceği doğrudur sub.

Var olmalarının nedeni, bu talimat kombinasyonlarının o kadar sık olması ki Intel bunları bizim için sağlamaya karar verdi.

Bu kombinasyonların bu kadar sık olmasının nedeni, yazmaçların değerlerini geçici olarak belleğe kaydetmeyi ve geri yüklemeyi kolaylaştırmaları ve böylece üzerine yazılmamalarıdır.

Sorunu anlamak için, bazı C kodunu elle derlemeyi deneyin.

En büyük zorluk, her değişkenin nerede saklanacağına karar vermektir.

İdeal olarak, tüm değişkenler, erişilmesi en hızlı bellek olan (şu anda RAM'den yaklaşık 100 kat daha hızlı ) yazmaçlara sığacaktır .

Ama elbette, özellikle iç içe geçmiş fonksiyonların argümanları için yazmaçlardan daha fazla değişkene sahip olabiliriz, bu yüzden tek çözüm belleğe yazmaktır.

Herhangi bir bellek adresine yazabiliriz, ancak işlev çağrılarının ve geri dönüşlerinin yerel değişkenleri ve argümanları, bellek parçalanmasını önleyen güzel bir yığın modeline uyduğundan , bununla başa çıkmanın en iyi yolu budur. Bunu bir yığın ayırıcı yazmanın çılgınlığıyla karşılaştırın.

Ardından, derleyicilerin bizim için yazmaç tahsisini optimize etmelerine izin veriyoruz, çünkü bu NP tamamlandı ve bir derleyici yazmanın en zor kısımlarından biri. Bu soruna kayıt ayırma denir ve grafik renklendirmesi izomorfiktir .

Derleyicinin ayırıcısı bir şeyleri sadece yazmaçlar yerine bellekte depolamaya zorlandığında, bu dökülme olarak bilinir .

Bu tek bir işlemci talimatına mı indirgeniyor yoksa daha karmaşık mı?

Kesin olarak bildiğimiz tek şey Intel'in a pushve bir poptalimatı belgelediği , bu nedenle bunlar bu anlamda bir talimat.

Dahili olarak, biri değiştirmek, diğeri espbellek IO'yu yapmak için birden fazla mikrokoda genişletilebilir ve birden çok döngü alabilir.

Ancak pushdaha spesifik olduğu için, tek bir komutun diğer komutların eşdeğer kombinasyonundan daha hızlı olması da mümkündür .

Bu çoğunlukla belgelenmiştir (der):

Peter Cordes , http://agner.org/optimize/microarchitecture.pdf adresinde açıklanan tekniklerin bunu önerdiğini pushve poptek bir mikro işlemi gerçekleştirdiğinden bahseder .
Johan , Pentium M Intel'in önceden hesaplanmış esp + regsize ve esp-regsize değerleri depolayan ve push ve pop'un tek bir uop'ta yürütülmesine izin veren bir "yığın motoru" kullandığından bahsediyor. Ayrıca şu adreste bahsedilmiştir: https://en.wikipedia.org/wiki/Stack_register
Intel mikro kodu nedir?
/security/29730/processor-microcode-manipulation-to-change-opcodes
Her bir montaj talimatı için kaç CPU döngüsü gereklidir?

Question 5

İtme ve patlama kayıtları, buna eşdeğer perde arkasındadır:

push reg   <= same as =>      sub  $8,%rsp        # subtract 8 from rsp
                              mov  reg,(%rsp)     # store, using rsp as the address

pop  reg    <= same as=>      mov  (%rsp),reg     # load, using rsp as the address
                              add  $8,%rsp        # add 8 to the rsp

Bunun x86-64 At & t sözdizimi olduğuna dikkat edin.

Çift olarak kullanıldığında, yığına bir kayıt kaydetmenizi ve daha sonra geri yüklemenizi sağlar. Başka kullanımlar da var.

Question 6

Hemen hemen tüm CPU'lar yığın kullanır. Program yığını, donanım destekli yönetmeli LIFO tekniğidir.

Yığın, normalde CPU bellek yığınının tepesine tahsis edilen program (RAM) belleği miktarıdır ve ters yönde büyür (PUSH komutunda yığın işaretçisi azaltılır). Yığına eklemek için standart terim PUSH ve yığından kaldırmak için standart terim POP'dur .

Yığın, yığın işaretçisi olarak da adlandırılan, yığın amaçlı CPU kaydı aracılığıyla yönetilir; bu nedenle, CPU, POP veya PUSH gerçekleştirdiğinde , yığın işaretçisi, yığın belleğine bir kayıt veya sabit yükler / depolar ve yığın işaretçisi, itilen sözcük sayısına göre otomatik olarak azaltılır veya artırılır. veya yığına (nereden) yerleştirilir.

Assembler talimatları aracılığıyla istiflemek için saklayabiliriz:

CPU kayıtları ve ayrıca sabitler.
İşlevler veya prosedürler için iade adresleri
Giriş / çıkış değişkenleri fonksiyonlar / prosedürler
Fonksiyonlar / prosedürler yerel değişkenler.