Yukarıdaki soru her şeyi söylüyor. Temelde sorum tahmin etmeye çalıştığım parametrelerde doğrusal olmayan bir genel uydurma işlevi (rastgele karmaşık olabilir) için, bir uyum başlatmak için ilk değerleri nasıl seçer? Doğrusal olmayan en küçük kareler yapmaya çalışıyorum. Herhangi bir strateji veya yöntem var mı? Bu çalışıldı mı? Referans var mı? Ad hoc tahmin dışında bir şey var mı? Özellikle, şu anda birlikte çalıştığım uygun formlardan biri, tahmin etmeye çalıştığım beş parametreye sahip bir Gauss artı doğrusal formudur.
burada (apsis verileri) ve (sıradan veriler), log-log alanında verilerimin düz bir çizgi artı bir Gaussian tarafından yaklaştığım bir yumru gibi göründüğü anlamına gelir. Hiçbir teorim yok, belki çizginin eğimi gibi grafik ve göz küresi ve yumru merkezinin / genişliğinin ne olduğu dışında doğrusal olmayan uyumun nasıl başlatılacağı konusunda bana rehberlik edecek hiçbir şeyim yok. Ama bunu yapmak için yüzlerce daha fazla uyuma sahibim, grafik yapmak ve tahmin etmek yerine, otomatikleştirilebilecek bazı yaklaşımları tercih ederim. y = log 10
Kütüphanede veya çevrimiçi olarak referans bulamıyorum. Aklıma gelen tek şey başlangıç değerlerini rastgele seçmektir. MATLAB eşit dağılımlı [0,1] arasından rastgele değerler seçmeyi önerir. Yani her veri seti ile, rastgele başlatılmış fit bin kez çalıştırın ve sonra en yüksek olanı seçin ? Başka (daha iyi) fikirler var mı?
Zeyil # 1
İlk olarak, size ne tür verilerden bahsettiğimi göstermek için veri kümelerinin bazı görsel gösterimleri. Verileri herhangi bir dönüşüm olmadan orijinal formunda ve daha sonra da log-log alanında görsel temsilini veriyorum, çünkü bazılarını bozurken verinin özelliklerini açıklıyor. Hem iyi hem de kötü verilerin bir örneğini gönderiyorum.
Her bir şekildeki altı panelin her biri, kırmızı, yeşil, mavi ve cam göbeği ile birlikte çizilen dört veri setini gösterir ve her veri setinde tam olarak 20 veri noktası bulunur. Verilerinde görülen çarpmalar nedeniyle her birini düz bir çizgi artı bir gauss ile uydurmaya çalışıyorum.
İlk rakam iyi verilerden bazılarıdır. İkinci şekil, birinci şekilden aynı iyi verilerin log-log grafiğidir. Üçüncü rakam bazı kötü verilerdir. Dördüncü şekil, üçüncünün log-log grafiğidir. Çok daha fazla veri var, bunlar sadece iki alt küme. Verilerin çoğu (yaklaşık 3/4), burada gösterdiğim iyi verilere benzer şekilde iyidir.
Şimdi bazı yorumlar, lütfen bu süre uzayabilir, ancak tüm bu detayların gerekli olduğunu düşünüyorum. Mümkün olduğunca kısa ve öz olmaya çalışacağım.
Başlangıçta basit bir güç yasası bekliyordum (log-log uzayında düz çizgi anlamına geliyordu). Günlük kaydı alanına her şeyi çizdiğimde, beklenmedik yumruları 4,8 mHz'de gördüm. Yumru iyice araştırıldı ve diğer işlerde de keşfedildi, bu yüzden onun berbat değil. Fiziksel olarak orada ve diğer yayınlanmış çalışmalar da bundan bahsediyor. Sonra lineer formuma bir gaussian terimi ekledim. Bu uyumun günlük kaydı alanında yapılması gerektiğine dikkat edin (bu nedenle bunu içeren iki sorum var).
Şimdi, okuduktan sonra benim başka soruya Stumpy Joe Pete tarafından cevap (hiç bu verilerin ilgili olmayan) ve okuma bu ve bu (Clauset tarafından malzeme) ve referansları, ben log-log sığmayan gerektiğini fark Uzay. Şimdi her şeyi önceden dönüştürülmüş alanda yapmak istiyorum.
Soru 1: İyi verilere baktığımda, önceden dönüştürülmüş alanda doğrusal bir artı bir gaussun hala iyi bir form olduğunu düşünüyorum. Ne düşündüklerini daha fazla veri keşfi olan diğerlerinden duymak isterim. Gauss + lineer makul midir? Sadece bir gaussçi mi yapmalıyım? Yoksa tamamen farklı bir form mu?
Sorular 2: Soru 1'in cevabı ne olursa olsun, hala (büyük olasılıkla) doğrusal olmayan en küçük karelere uymam gerekiyordu, bu yüzden başlatma konusunda hala yardıma ihtiyacım var.
İki set gördüğümüz verilerde, ilk yumru yaklaşık 4-5 mHz'de yakalamayı çok tercih ediyoruz. Bu yüzden daha fazla gaussian terim eklemek istemiyorum ve gaussian terimimiz neredeyse her zaman daha büyük olan tüm yumruya odaklanmalıdır. 0.8mHz ile 5mHz arasında "daha fazla doğruluk" istiyoruz. Daha yüksek frekanslar için çok fazla umursamıyoruz ama onları da tamamen göz ardı etmek istemiyoruz. Yani belki bir çeşit tartım? Veya B her zaman 4.8mHz civarında başlatılabilir mi?
Apsis verileri milihertz birimi cinsinden frekanstır, . Sıradan veriler, hesapladığımız bir katsayıdır, . Yani günlük dönüşümü yok ve formL
- frekanstır, daima pozitiftir.
- pozitif bir katsayıdır. Bu yüzden ilk çeyrekte çalışıyoruz.
- A > 0 A , genlik her zaman pozitif olmalı bence çünkü sadece çarpmalarla uğraşıyoruz. Verilere baktığımda hep doruklar görüyorum ve vadiler yok. Tüm verilerde daha yüksek frekanslarda çoklu çarpma var gibi görünüyor. İlk yumru her zaman diğerlerinden daha büyüktür. İyi verilerde, ikincil tümsekler çok zayıftır ancak kötü verilerde (örneğin panel 2 ve 5), ikincil tümsekler güçlüdür. Biz aslında Yani yok bir vadiye değil, iki darbe var. Yani genlik . Ve çoğunlukla ilk zirveyi önemsediğimiz için, pozitif olması için daha fazla neden var .
- , çıkıntının merkezidir ve her zaman 4-5mHz civarında büyük bir çıkıntıda olmasını isteriz. Çözülmüş frekans aralığımızda, neredeyse her zaman 4.8mHz'de görünür.
- C - C , çıkıntının genişliğidir. Sıfır civarında simetrik olduğunu düşünüyorum, yani , aynı etkiye sahip olacaktır çünkü kare. Bu yüzden değerinin ne olduğu umrumda değil. Diyelim ki olumlu tercih ediyoruz.
- çizginin eğimidir, biraz negatif olabilir, bu yüzden üzerinde herhangi bir kısıtlama uygulamamaktadır. Eğim kendi başına ilginçtir, bu nedenle üzerinde herhangi bir kısıtlama uygulamak yerine, ne olacağını görmek istiyoruz. Olumlu mu, olumsuz mu? Büyüklük açısından ne kadar büyük / küçük? ve bunun gibi.
- L E L f = 0 (neredeyse) kesişmesidir. Burada ince bir şey, çünkü Gauss terimin, yani oldukça değildir -intercept. Asıl kesişme noktası ( olarak tahmin edersek )
Yani buradaki tek kısıtlama, engellemenin de olumlu olması gerektiğidir. Kesme noktasının sıfır olması, bunun ne anlama geldiğini bilmiyorum. Ama negatif kesin olarak saçma görünecektir. Sanırım burada küçük bir büyüklükte biraz negatif olmasına izin verebiliriz . ve kesişmenin nedeni burada önemlidir, ancak bazı meslektaşlarımız aslında ekstrapolasyonla da ilgilenmektedir. Sahip olduğumuz minimum frekans 0.8mHz'dir ve 0 ile 0.8mHz arasında ekstrapolasyon yapmak isterler. Benim saf fikrim sadece kadar gitmek için fit kullanmaktı .E f = 0
Ekstrapolasyonun enterpolasyondan daha zor / tehlikeli olduğunu biliyorum, ancak düz bir çizgi artı bir gaussian (yeterince hızlı bozunmasını umuyor) kullanmak benim için makul görünüyor. Doğal sınır koşullarına sahip doğal kübik splinelar gibi, sol uç noktadaki eğim, sadece çizgiyi uzatır ve eksenini nereden geçtiğini görür . Negatif değilse, bu satırı ekstrapolasyon için kullanın.
Sorular 3: Bu durumda bu şekilde tahmin edilme fikriniz nedir? Artıları / eksileri var mı? Ekstrapolasyon için başka fikirleriniz var mı? Yine sadece 0 ve 1mHz arasında ekstrapolasyon yapan düşük frekansları önemsiyoruz ... bazen sıfıra yakın çok küçük frekanslar. Bu yazının zaten dolu olduğunu biliyorum. Bu soruyu burada sordum çünkü cevaplar ilgili olabilir, ancak isterseniz bu soruyu ayırabilir ve daha sonra başka bir soru sorabilirim.
Son olarak, talep üzerine iki örnek veri seti aşağıda verilmiştir.
0.813010000000000 0.091178000000000 0.012728000000000
1.626000000000000 0.103120000000000 0.019204000000000
2.439000000000000 0.114060000000000 0.063494000000000
3.252000000000000 0.123130000000000 0.071107000000000
4.065000000000000 0.128540000000000 0.073293000000000
4.878000000000000 0.137040000000000 0.074329000000000
5.691100000000000 0.124660000000000 0.071992000000000
6.504099999999999 0.104480000000000 0.071463000000000
7.317100000000000 0.088040000000000 0.070336000000000
8.130099999999999 0.080532000000000 0.036453000000000
8.943100000000001 0.070902000000000 0.024649000000000
9.756100000000000 0.061444000000000 0.024397000000000
10.569000000000001 0.056583000000000 0.025222000000000
11.382000000000000 0.052836000000000 0.024576000000000
12.194999999999999 0.048727000000000 0.026598000000000
13.008000000000001 0.045870000000000 0.029321000000000
13.821000000000000 0.041454000000000 0.067300000000000
14.633999999999999 0.039596000000000 0.081800000000000
15.447000000000001 0.038365000000000 0.076443000000000
16.260000000000002 0.036425000000000 0.075912000000000
İlk sütun mHz cinsinden frekanslardır, her veri kümesinde aynıdır. İkinci sütun iyi bir veri kümesidir (iyi veri şekil bir ve iki, panel 5, kırmızı işaret) ve üçüncü sütun kötü bir veri kümesidir (kötü veri şekil üç ve dört, panel 5, kırmızı işaret).
Umarım bu biraz daha aydınlanmış tartışmayı teşvik etmek için yeterlidir. Herkese teşekkürler.