Ortalama eğimin hesaplanması: Harmonik veya Aritmetik Ortalama?


11

Büyük bir veri kümesi için ortalama artış eğimi yüzde eğimini hesaplamak zorundayım, temel yöntem burada ayrıntılı . Ancak, harmonik ortalamanın standart aritmetik ortalamadan daha uygun olup olmadığını merak etmeye başladım , çünkü teknik olarak bir değişim oranı. Puanlar, alanlar, çizgiler, vb. Üzerinde eğim ortalamaları üzerine yapılan diğer tartışmaların hiçbirinde bu dönüşümü görmedim. Bunu başarmak oldukça basit olmalı.

edit: Bu durumda ortalama eğimi hesaplamanın amacı, kanal başlatma eşiklerini modellemede kullanılacak bir parametre (çok sayıda) oluşturmaktır. Akış birikimini, çeşitli ortalama yukarı eğim parametrelerini vb. Toplayacağım ve birikim eşiklerini diğer parametreler açısından tanımlamaya çalışmak için çoklu doğrusal regresyon kullanacağım alandan toplanan kanal başı konumlarına sahibim.


4
Ortalama eğimi neden hesapladığınıza bağlıdır. Amaç nedir? Hangi fiziksel miktarı ölçmeye çalışıyorsunuz? Her ne kadar birçok ortalama form meşru olsa da, harmonik ortalamaya dikkat edin: herhangi bir eğim sıfır olduğunda sık sık meydana gelen sorunlara neden olur.
whuber

Yanıtlar:


10

Ortalama eğim doğal bir miktara benziyor, ancak oldukça garip bir şey. Örneğin, düz yatay bir ovanın ortalama eğimi sıfırdır, ancak bu ovanın bir DEM'ine küçük bir rastgele, sıfır-ortalama gürültü eklediğinizde, ortalama eğim yalnızca yükselebilir. Diğer garip davranışlar DEM ben var çözünürlük, ortalama eğimin bağımlılığı olan burada belgelenen ve DEM nasıl oluşturulduğuna onun bağımlılığı. Örneğin, kontur haritalarından oluşturulan bazı DEM'ler aslında kontur çizgilerinin yattığı küçük ani sıçramalarla - biraz da teraslıdır - ancak aksi takdirde yüzeyin bir bütün olarak doğru temsilidir. Ortalamalama sürecinde çok fazla veya çok az ağırlık verilirse, bu ani sıçramalar ortalama eğimi değiştirebilir.

Yetiştirme ağırlık aslında, bir harmonik ortalama (ve diğer araçlar) diferansiyel olarak yamaçları ağırlıklandırma edilir çünkü alakalıdır. Bunu anlamak için, sadece iki pozitif sayının x ve y'nin harmonik ortalamasını düşünün . Tanım olarak,

Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y

burada ağırlıklar a = y / (x + y) ve b = x / (x + y) 'dir. (Bunlar "ağırlıklar" olarak adlandırılmayı hak eder, çünkü bunlar pozitiftir ve birliğin toplamıdır. Aritmetik ortalama için ağırlıklar a = 1/2 ve b = 1 / 2'dir). Açıkçası, x'e bağlı ağırlık , y / (x + y) 'ye eşittir, x , y'ye kıyasla küçük olduğunda büyüktür . Böylece harmonik, daha küçük değerlerin aşırı ağırlığı anlamına gelir .

Soruyu genişletmek yardımcı olabilir. Harmonik ortalama, gerçek bir p değeri ile parametreleştirilmiş bir ortalamalar ailesinden biridir . Harmonik ortalama ortalamasının alınmasıyla elde edilir gibi reciprocals arasında x ve y (ortalama devrik alma ve daha sonra), genel olarak, bir PTH güçlerini ortalama olabilir x ve y (ve sonra sonucun 1 / p-inci güç almak ). P = 1 ve p = -1 vakaları sırasıyla aritmetik ve harmonik ortalamalardır. (Biz bir ortalama tanımlayabilir p de sınırlar alarak = 0 ve böylece bu ailenin bir üyesi olarak geometrik ortalama elde edin.) Olarak p1'den düştüğünde, daha küçük değerler daha ağırdır; ve p , 1'den arttıkça, daha büyük değerler giderek daha ağırdır. Ortalamanın ancak p arttıkça artabileceği ve p azaldıkça azalması gerektiği sonucuna varılır. (Bu, üç çizginin de düz veya soldan sağa doğru arttığı aşağıdaki ikinci şekilde görülmektedir.)

Konuyla ilgili pratik bir bakış açısıyla, bunun yerine çeşitli yamaçların davranışlarını inceleyebilir ve bu bilgiyi analitik araç kutumuza ekleyebiliriz: yamaçların daha küçük yamaçlara daha fazla verilecek şekilde bir ilişkiye girmesini beklediğimizde bir etkisi biz ortalama seçebilir p az 1'den; tersine, en büyük eğimleri vurgulamak için p'yi 1'in üzerine çıkarabiliriz . Bu amaçla, bir noktanın yakınında çeşitli drenaj profilleri formlarını ele alalım.

Neler olabileceğini göstermek için, niteliksel olarak farklı üç yerel araziyi düşündüm : biri tüm eğimlerin eşit olduğu yerdir (bu iyi bir referans oluşturur); diğeri ise yerel olarak bir kasenin dibinde olduğumuz yer: çevremizdeki eğimler sıfır, ancak daha sonra kademeli olarak artar ve sonunda jantın etrafında keyfi olarak büyür. Bu durumun tersi, yakındaki yamaçların ılımlı olduğu ancak daha sonra bizden uzaklaştığı yerlerde meydana gelir. Bu gerçekçi olarak geniş bir yelpazedeki davranışları kapsamaktadır.

İşte bu üç tür drenaj formunun sözde 3D grafikleri:

3D çizimler

Burada p'nin bir fonksiyonu olarak her birinin ortalama eğimini - aynı renk kodlamasıyla - hesapladım, p'nin -1 (harmonik ortalama) ile 2 arasında değişmesine izin verdim .

Eğim vs p demektir

Elbette mavi çizgi yataydır: p değeri ne olursa olsun , sabit bir eğimin ortalaması bu sabitten başka bir şey olamaz (referans için 1 olarak ayarlanmıştır). Kırmızı çanağın uzak kenarındaki yüksek eğimler p değiştikçe ortalama eğimleri güçlü bir şekilde etkiler : p bir kez aştıklarında ne kadar büyük olduklarına dikkat edin. Üçüncü (altın-yeşil) yüzeydeki yatay jant harmonik ortalamaya neden olur (p = - 1) sıfır olmak.

Üç eğrinin göreli konumlarının p = 0'da (geometrik ortalama) değişmesi dikkat çekicidir: 0'dan büyük p için , kırmızı kase maviden daha büyük ortalama eğimlere sahipken, negatif p için kırmızı kase daha küçük ortalamaya sahiptir. mavi daha eğimli. Böylece, p seçiminiz ortalama eğimlerin göreli sıralamasını bile değiştirebilir .

Harmonik ortalamanın (p = -1) sarı-yeşil şekil üzerindeki derin etkisi bize duraklama vermelidir: drenajda yeterince küçük eğimler olduğunda , harmonik ortalama o kadar küçük olabileceğini gösterir. diğer tüm eğimler.

Keşifsel bir veri analizi ruhu ile , p'yi değiştirmek - belki de aşırı ağırlıkları önlemek için 0'dan 1'den biraz daha büyük olmasına izin vermeyi - ve hangi değerin ortalama eğim ile sizin değişkeniniz arasında en iyi ilişkiyi yarattığını düşünebilirsiniz. modelleme (kanal başlatma eşikleri gibi). "En iyi" genellikle bir regresyon modelinde "en doğrusal" veya "sabit [homoscedastik] artıklar oluşturma" anlamında anlaşılır.


Ayrıntılı analiz için teşekkürler! Bu konuda biraz düşünmem gerekecek.
Jay Guarneri

1

Whuber'ın mükemmel teorik cevabına tamamlayıcı bir cevap bulmak için ampirik bir yaklaşım benimsedim. Eğimi açısal ortalama kullanarak derece ve ortalama olarak hesaplamaya karar verdim . Daha sonra, çalışma alanında rastgele yerleştirilmiş bir dizi örnek nokta oluşturduğum yüzde eğiminin aritmetik ve harmonik araçlarını hesapladım. Minimum 100m mesafeden 2000 puan talep ettim, bu da 1326 puan verdi. Her bir noktada her ortalama eğim rasterinin değerlerini örnekledim ve formülü kullanarak yüzde aracını dereceye dönüştürdüm Degrees = atan(percent/100). Buradaki varsayımım, açısal ortalamanın derece cinsinden "doğru" ortalama eğimi üreteceği ve hangi yüzdelik ortalamaya yaklaştığı doğru prosedür olacaktır.

Daha sonra, bir Kruskal-Wallace testi kullanarak sıfır olmayan tüm değerleri karşılaştırdım (varsayımların çoğu sıfır eğim değeri için her üçünde de sıfır olacağı ve sıfır değerlerinin yöntemler arasındaki farkları maskeleyeceği yönündedir). Üç arasında anlamlı bir fark buldum (ki kare = 17.9570, DF = 2, p = 0.0001), bu yüzden de alfa = 0.05 kullanarak Dunn Prosedürünü kullanarak verileri inceledim (Elliot ve Hynan 2011) . Nihai sonuç, aritmetik ve harmonik ortalamanın birbirinden önemli ölçüde farklı olması, ancak daha büyük olanın açısal ortalamadan önemli ölçüde farklı olmasıdır:

Comparison           Diff        SE        q         q(0.05)    Conclude                      
------------------------------------------------------------------------------                
arith     harm      164.12    38.78     4.23       2.394    Reject                            
arith     angular   75.3      38.8      1.94       2.394    Do not reject                     
angular   harm      88.82     38.68     2.3        2.394    Do not reject                     

Eğer varsayımlarımın hepsi doğruysa (çok iyi olmayabilirler), bu, harmonik ve aritmetik araçların birbirinden farklı değerler yaratmasına rağmen, her ikisinin de kabul edilebilir olması için açısal ortama "yakın zeka" oldukları anlamına gelir. Burada düşünebileceğim iki uyarı daha var (lütfen bunları başkalarını ekleyin):

  1. Daha büyük bir örnek büyüklüğü olabilir yüzde aracı ve açısal ortalamaları arasında anlamlı bir fark. Ancak, örnek boyutum yalnızca sıfır olmayan değerler için ~ 1000 puandı.
  2. Örnek noktalarım drenaj havzalarına bakılmaksızın yerleştirildiğinden, herhangi bir ortalama eğim üstündeki ortalama eğimlerle ilişkili olacağından sözde bazı sahte çoğaltma olabilir.

1
Bu ilginç (+1), ancak sınırlamalara dikkat edin. (1) Evet, daha büyük bir numune boyutu seçerseniz, tüm farklılıkların önemli olduğunu göreceksiniz. Bu nedenle istatistiksel bir hipotez testi yapmak mantıklı değildir: prosedürler arasındaki fark miktarına odaklanmak istersiniz . (2) Sonuçlarınız tamamen verilerinizin gerçek özelliklerine bağlıdır. Diğer veri kümelerine göre değişiklik gösterirler. (3) Açısal ortalama bir referans olarak yararlıdır, ancak hiçbir şekilde tercih edilen bir değer değildir. Referans olarak hangisinin kullanılacağı tamamen ortalamanın ileri analizlerde veya haritalamada nasıl kullanılacağına bağlıdır.
whuber

0

Eğimi tanımlayan hiçbir parametrenin bilinmediği varsayımı göz önüne alındığında, herhangi bir istatistikçi, verilerin RMS sapmalarını en aza indiren eğimi kullandığını söyleyebilir. (Tabii ki, o zamanki örnekler matematiksel olarak oluşturulmuş yeryüzü biçimlerini seçtiği için geçerli değildir, ancak gerçek yeryüzü biçimleri için bilinmeyen parametreler varsayımı geçerli olmalıdır.)


Bu cevap takdir ediliyor, ancak bence durumu yanlış anlıyor. En önemlisi, bu eğimler eğrilere uymak için kullanılmaz: "Verilerin RMS sapmaları" kavramı geçerli değildir. İkincisi, gerçekten karşılaşılacakları geniş bir yelpazeye yaymak için kalitatif yer şekli türlerini seçtim, bu yüzden ne beklemeleri hakkında yararlı bilgiler verdiklerini iddia ediyorum. Gerçek veri kümeleri burada olup bitenleri anlamada fazla bir katkıda bulunmaz, çünkü "gerçek" ortalama eğim diye bir şey yoktur. Ana soru, ortalamaların hangi yararlı veya bilgilendirici
whuber

1
BTW, istatistikçi olarak bazı niteliklerimin olduğuna inanıyorum . Bu konu hakkında fikrimi daha iyi veya daha kötü hale getirmiyor: başkalarında olduğu gibi, bunu olabildiğince açık ve objektif olarak desteklemem gerekiyor ve yanlış olmaya ve fikrimi değiştirmek zorunda kaldım: - ). Ben sadece bu noktayı "herhangi bir istatistikçi" sözlerinize bir sayaç olarak öneriyorum.
whuber

Uygun olanın ne işe yaradığı sorusu eğimin ne için kullanılacağına bağlı. Örneğin, arazi çöküş potansiyeli için, dik eğimler, düşme potansiyeline karşı eğim modeline göre ılımlı eğimlere göre daha yüksek ağırlıkta olacaksa, RMS uyum yaklaşımı geçerli olmalıdır. Diğer kullanımlara uygun diğer ağırlık modelleri kullanılacaktır. Kısacası, bildiğimiz her şeyi ağırlıklandırarak veya başka yollarla modelleyin, sonra önermediğim şey, RMS'ye dayanmadığımız her şeyin modeli olarak güvenin.
johnsankey

Bu yorumun önermesine katılıyorum, John, ama sonucunun nasıl takip ettiğini göremiyorum. Daha dik eğimler daha ağır ağırlıklar almak istiyorsak, o zaman RMS do sadece ne gibi görünüyor değil çünkü ağırlıkları tüm sapmalar aynı bakılmaksızın yamacın, yapmak istiyorum. Ayrıca, ikinci dereceden bir kayıp fonksiyonu olarak RMS, eğimin doğrusal olmayan yeniden ifadeleri ve alternatif kayıp fonksiyonlarının (örneğin sağlam montaj yöntemlerinden istifade edildiği gibi) kullanılması dahil, diğer tekniklerin başarabileceği evrensel bir yedek olamaz.
whuber

RMS ağırlıkları içerir
johnsankey
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.