OOB varyansının iki kaynağı vardır. Birincisi, prosedürün kendisinin rastgele olması; bu ağaç sayısını artırarak azaltılabilir.
Diğer varyans kaynağı, sınırlı veriye sahip olmanın ve karmaşık bir dünyada yaşamanın indirgenemez kusurudur. Ağaç sayısını artırmak bunu düzeltemez.
Ayrıca, bazen sorunu çözmek için yeterli veri yoktur. Örneğin, iki örneğin karşıt etiketlere ancak özdeş özellik değerlerine sahip olduğunu düşünün. Bu örneklerden biri her zaman yanlış sınıflandırılacaktır. (Bu aşırı bir örnektir, ancak bazı sorunların nasıl düzeltilemez olduğunu gösterir. Bir vektöre küçük bir pertürbasyon düşünerek biraz rahatlatabiliriz; şimdi genellikle ikiziyle aynı olarak sınıflandırılır, ancak her zaman değil.) Bu sorunu çözmek için , iki noktayı daha da ayırt etmek için ek ölçümler toplamanız gerekir.
Bununla birlikte, ağaç sayısını artırmak, gibi bir şeyin tahmininin varyansını azaltabilir . Merkezi limit teoreminin sonuçlarını düşünün: örneklem büyüklüğünü arttırmak, bir istatistiğin ortalama gibi varyansını azaltabilir, ancak ortadan kaldırmaz. Rastgele orman tahminleri, tüm ağaçların tahminlerinin ortalama bir değeridir ve bu tahminlerin kendileri rastgele değişkenlerdir (önyükleme ve özelliklerin rastgele alt kümelenmesi nedeniyle; her ikisi de bağımsız olarak gerçekleşir, bu nedenle oylar da doğrudur). CLT, normal bir dağılıma yaklaşır ; burada gerçek ortalama öngörüdür vep ( y= 1 | x )x¯x¯x¯∼ N( μ , σ2n)μσ2ağaçların oylarının varyansıdır. (Oylar 0 veya 1 değerlerini alır, bu nedenle oyların ortalaması sonlu bir değişime sahiptir.) Mesele şu ki , ağaç sayısının iki katına çıkarılması varyansını yarıya indirecek, ancak sıfır. x¯( hariç , ancak burada böyle olmadığını biliyoruz.)σ2= 0
İndirgenemez varyans önyükleme ile düzeltilemez. Dahası, rastgele ormanlar zaten önyüklenmiştir; adında "rastgele" olmasının nedeninin bir parçası. (Diğer neden, her bir bölmede rastgele bir özellik alt kümesinin seçilmesidir.)