Buna ne sebep olur? pcieport 0000: 00: 03.0: PCIe Veri Yolu Hatası: AER / Kötü TLP


20

Aşağıdaki gibi hata mesajları görüyorum:

Nov 15 15:49:52 x99 kernel: pcieport 0000:00:03.0: AER: Multiple 
Corrected error received: id=0018 Nov 15 15:49:52 x99 kernel: pcieport
0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, 
id=0018(Receiver ID) Nov 15 15:49:52 x99 kernel: pcieport 0000:00:03.0: 
device [8086:6f08] error status/mask=00000040/00002000 Nov 15 15:49:52 
x99 kernel: pcieport 0000:00:03.0: [ 6] Bad TLP

Bunlar (şimdiye kadar) düzeltilmiş olsalar bile performansın düşmesine neden olurlar. Açıkçası, bu sorunun çözülmesi gerekiyor. Ancak, bu konuda internette fazla bir şey bulamıyorum. (Belki de yanlış yerlere bakıyorum.) Aşağıda yazacağım birkaç bağlantı buldum.

Bu hatalar hakkında daha fazla bilgi sahibi olan var mı?

Anakart, Samsung 950 Pro veya GPU (veya bunların bir kombinasyonu) mı?

Donanım: M2'de Asus X99 Deluxe II Samsung 950 Pro NVMe. mb üzerindeki yuva (PCIe bağlantı noktası 3'ü paylaşır). PCIe bağlantı noktası 3'e başka bir şey takılı değil. PCIe yuvası 1 Core i7 6850K CPU'da bir GeForce GTX 1070

Bulduğum bağlantılardan birkaçı aynı donanımdan (X99 Deluxe II mb ve Samsung950 Pro) bahsediyor. Arch Linux kullanıyorum.

Journalctl veya şimdiye kadar aramayı düşündüğüm başka bir yerde "8086: 6f08" dizesini bulamıyorum.

nvme ssd ile tek hata mesajı (Bozuk TLP): linuxquestions https://www.reddit.com/r/linuxquestions/comments/4walnu/odd_error_message_with_nvme_ssd_bad_tlp/

PCIe: Kartınız TLP yeniden iletimiyle sessizce mücadele ediyor mu? http://billauer.co.il/blog/2011/07/pcie-tlp-dllp-retransmit-data-link-layer-error/

GTX 1080 Kötü TLP PCIe Otobüs Hatalarını Atma - GeForce Forums https://forums.geforce.com/default/topic/957456/gtx-1080-throwing-bad-tlp-pcie-bus-errors/

sürücüleri - dmesg günlüğünde PCIe hatası - Ubuntu'ya sorun /ubuntu/643952/pcie-error-in-dmesg-log

780Ti X99 sabit kilit - PCIE hataları - NVIDIA Geliştirici Forumları https://devtalk.nvidia.com/default/topic/779994/linux/780ti-x99-hard-lock-pcie-errors/


i (asal b450-plus, ryzen 5 3600, samsung nvme 970 asus) bir x1 yuvaya inci pcie x16 yuvadan benim gtx 710 taşındı
trants

Yanıtlar:


23

Ne olduğunu tam olarak açıklayamasam da, en az birkaç ayrıntı verebilirim.

Örneğin burada açıklandığı gibi , CPU, işlem katmanı paketleri (TLP'ler) ile PCIe veri yolu denetleyicisiyle iletişim kurar . Donanım hatalı olanları tespit eder ve Linux çekirdeği bunu mesaj olarak bildirir.

Çekirdek seçeneği pci=nommconf, çekirdek 2.6'dan beri Linux'ta bulunan Bellek Eşlemeli PCI Yapılandırma Alanını devre dışı bırakır. Çok kabaca, tüm PCI aygıtlarında bu aygıtı tanımlayan bir alan vardır (gördüğünüz lspci -vv) ve bu alana erişim için orijinal yöntem G / Ç bağlantı noktalarından geçmeyi içerirken, PCIe bu alanın daha kolay erişim için belleğe eşlenmesine izin verir.

Bu, bu özel durumda, PCIe denetleyicisi, belirli bir aygıtın yapılandırma alanına erişmek için bu yöntemi kullandığında bir şeyler ters gittiğini gösterir. Aygıtta, anakarttaki PCIe kök denetleyicisinde, bu ikisinin belirli etkileşimlerinde veya başka bir şeyde bir donanım hatası olabilir.

Kullanarak pci=nommconf, tüm cihazların yapılandırma alanına orijinal şekilde erişilir ve erişim yöntemlerini değiştirmek bu soruna geçici bir çözüm sağlar. Yani isterseniz, hem çözüyor hem de bastırıyor.


Anakart sorunum olup olmadığını öğrenebilir miyim? Ya da CPU sorunum. Onları değiştirmeli miyim?
user10024395

@ user2675516: CPU ile ilgili değil. Bu, (genellikle Güney Köprüsü'nde bulunan) PCIe kök denetleyicisinin ve / veya cihazın PCIe denetleyicisinin veya etkileşimlerinin bir sorunudur. Evet, anakartı farklı donanıma sahip biri için değiştirmek genellikle ondan kurtulur.
Dirkt

Asus e-ws'den asus deluxe'e geçtim, ama sorun hala devam ediyor. Bu yüzden CPU olduğundan şüpheleniyorum. Yoksa her ikisi de X99 yongaseti olduğu için mi?
user10024395

1
@ user2675516: Yonga seti aynıysa, esp. PCIe denetleyici, anakartı değiştirmek elbette yardımcı olmaz. Bu yüzden " farklı donanıma sahip anakart" yazdım .
Dirkt

benim için ortak faktör X99 yonga seti ile bir anakart gibi görünüyor
Monica

3

Çekirdek komut satırı seçeneğini eklemek pci=nommconfsorunu benim için çözdü. Bu nedenle, sorunun anakartla ilgili olduğunu varsayıyorum. Bu, tüm X99 anakart donanımlı bilgisayarlarımda oluyor. Z170 sistemlerinde veya sahip olduğum başka bir donanımda olmaz.


1
Merhaba ben de bu sorunla karşı karşıyayım. PCI-Nommconf'un ne yaptığını bilebilir miyim? Sadece sorunu bastırmak mı yoksa çözmek mi?
user10024395

Onaylanamıyor
z170i'de

@sitilge - yorumunuz için teşekkürler. Hangi marka / model z170i? Anakartlarım Asus. Biri X99 Deluxe II
Monica

Bu asus z170i pro oyunudur.
sitilge

3

Bu adımları deneyin:

  1. cp /etc/default/grub ~/Desktop
  2. Grub'u düzenle. pci=noaerSonuna ekleyin GRUB_CMDLINE_LINUX_DEFAULT. Çizgi şöyle olacak:

    GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=noaer"
    
  3. sudo cp ~/Desktop/grub /etc/default/

  4. sudo update-grub
  5. Şimdi yeniden başlat

Ben senin çözüm uygulanan ama yerine pci=noaerben kullanılan pci=nommconfolarak @dirkt önerdiği
user3405291

Teşekkürler, pci = noaer bir hp dizüstü bilgisayarda yüklü olan slackware 14.2x64 sorunumu düzeltti (masaüstü kurulumu bu sorunu hiç göstermedi)
John Forkosh

7
Biraz ayrıntılı düşünür müsünüz? Bu seçenek ne işe yarar ve sorunun nasıl çözülmesini beklersiniz?
Calimo

Neden sudoeditgüvenli düzenleme için kullanmıyorsunuz ? Bu kopya için -1 ve burada adımlar tam bir saçmalık
LinuxSecurityFreak

4
pci=noaerGelişmiş Hata Bildirimi'ni devre dışı bırakır. Yani hala bu hatalar var, onları görmüyorsun ...
dirkt

2

Aynı hataları alıyorum (8086: 6f08 aygıtıyla ilişkili bozuk TLP). X99 Deluxe II, Samsung 960 pro, Nvidia 1080 ti var. Bu sorunlar, Samsung Pro gibi X99 yonga seti ve M.2 cihazıyla ilişkili gibi görünüyor.

X99 Deluxe II anakart PCIE16_3 yuvası ile M.2 / U.2 arasındaki bant genişliğini paylaşıyor. @Nic tarafından yapılan yorumdan sonra BIOS'ta Yerleşik Aygıt Yapılandırmasını değiştirdim | U.2_2 Otomatik'ten U.2_2'ye bant genişliği. Bu benim için sorunu düzeltti.


Bunun sadece bu yonga seti olduğunu nasıl belirlediniz? Diğer yonga setlerini denediniz mi? Çok çeşitli donanımlarda görülür.
doug65536

2

X99-E cihazımdaki Bios'taki PCIE16_3 yuvası Config'i M.2 cihaz desteği için varsayılan otomatik yerine x8 moduna ayarlı olacak şekilde değiştirdim. PCIe 1x - 16x genişletme kartlarına bağlı 1070GTX kartların her ikisinde de TLP hatası olmadan iyi çalışıyor.

İlk olarak 16_3 bağlantı noktasını kullanmadım, test etmek için o yuvaya taşındım, ancak bios'ta değişiklik yapmadan önce hala sorunları vardı. Ayrıca madenci yapılandırmasında tüm kartlar için bsleep ayarı 30 olarak değiştirildi.

Değişiklikten önce, çekirdek günlüğünün hatalarla spam olmasını sağladım. Ayrıca değişimden önce ve sonra sistemi çalıştırmaya çalıştı. Oldukça kalıcı görünüyor.


2

Anakart kılavuzunuzda "AER" ifadesini arayın. Sorunun kaynağını, belirli uyumsuzluğu düzelterek veya AER'yi tamamen devre dışı bırakarak öldürebilirsiniz. Bunu yalnızca tüm hata spamleri düzeltilmiş hatalarla ilgiliyse kullanın , aksi takdirde gerçek bir sorunu ele alıyor olabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.