Bu soruyu cevaplamak için kaos teorisini okurken ortaya çıkardığım en garip şey, veri madenciliğinin ve akrabalarının kaos teorisinden yararlandığı şaşırtıcı bir araştırma eksikliğiydi. Bu, AB belambel'in Uygulamalı Kaos Teorisi: Karmaşıklık için Bir Paradigma ve Alligood ve diğerleri Kaos: Dinamik Sistemlere Giriş gibi kaynaklara danışarak onları bulmak için uyumlu bir çabaya rağmen (ikincisi, bu konu) ve kaynakçalarını bastırma. Tüm bunlardan sonra, sadece uygun olabilecek tek bir çalışma hazırlayacaktım ve sadece bu son durumu dahil etmek için “veri madenciliği” sınırlarını genişletmek zorunda kaldım: Teksas Üniversitesi'nden Belousov-Zhabotinsky (BZ) reaksiyonları (zaten aperiodisiteye eğilimli olduğu bilinen) üzerinde araştırma yapan bir ekip, malonik asitte, kaotik desenlerden dolayı kullanılan deneylerinde kullanılan tutarsızlıkları yanlışlıkla keşfetti. satıcılar [1]. Muhtemelen başkaları da var - kaos teorisinde uzman değilim ve literatürün kapsamlı bir değerlendirmesini yapamıyorum - ancak üç beden problemi gibi fizikten sıradan bilimsel kullanımlarla keskin bir orantısızlık, hepsini saymamız halinde çok fazla değişmeyecekti. Aslında, bu sorunun kapatıldığı arada, “Veri Madenciliği ve İlgili Alanlarda Neden Kaos Teorisinin Çok Az Uygulaması Var?” Başlığı altında yeniden yazmayı düşündüm. Bu, veri madenciliği ve ilgili alanlarda, nöral ağlar, örüntü tanıma, belirsizlik yönetimi, bulanık kümeler, vb. sonuçta, kaos teorisi aynı zamanda birçok yararlı uygulamaya sahip son teknoloji bir konudur. Aramamın neden sonuçsuz olduğunu ve izlenimin yanlış olduğunu anlamak için bu alanlar arasındaki sınırların tam olarak nerede olduğunu uzun ve çok düşünmek zorunda kaldım.
The; tldr Yanıt
Çalışma sayısındaki bu kesin dengesizliğin kısa açıklaması ve beklentilerden sapma, kaos teorisi ve veri madenciliği vb .'nin iki ayrı soru sınıfını cevapladığı gerçeğine atfedilebilir; aralarındaki keskin ikilik bir zamanlar belirdi, ancak kendi burnuna bakmak gibi, fark edilmeden gitmek kadar temel. Kaos teorisinin ve veri madenciliği gibi alanların göreceli yeniliğinin, uygulamaların bazı eksikliklerini açıkladığı inancı için bir gerekçe olabilir, ancak bu alanlar olgunlaştıkça bile göreceli dengesizliğin devam etmesini bekleyebiliriz, çünkü sadece aynı para. Şimdiye kadar yapılan uygulamaların neredeyse tamamı, birkaç şaşırtıcı kaotik sapma sergileyen iyi tanımlanmış çıktıları olan bilinen işlevler üzerinde yapılan çalışmalarda, oysa veri madenciliği ve sinir ağları ve karar ağaçları gibi münferit tekniklerin tümü, bilinmeyen veya zayıf tanımlanmış bir fonksiyonun belirlenmesini içerir. Örüntü tanıma ve bulanık kümeler gibi ilgili alanlar da, o kuruluşun araçları da kolayca görülmediği zaman, genellikle bilinmeyen veya kötü tanımlanmış işlevlerin sonuçlarının organizasyonu olarak görülebilir. Bu, yalnızca belirli nadir durumlarda geçilebilen pratik olarak aşılmaz bir uçurum yaratır - ancak bunlar bile tek kullanımlık bir durumun altında toplanabilir: veri madenciliği algoritmaları ile açıklıksız etkileşimi önler. Örüntü tanıma ve bulanık kümeler gibi ilgili alanlar da, o kuruluşun araçları da kolayca görülmediği zaman, genellikle bilinmeyen veya kötü tanımlanmış işlevlerin sonuçlarının organizasyonu olarak görülebilir. Bu, yalnızca belirli nadir durumlarda geçilebilen pratik olarak aşılmaz bir uçurum yaratır - ancak bunlar bile tek kullanımlık bir durumun altında toplanabilir: veri madenciliği algoritmaları ile açıklıksız etkileşimi önler. Örüntü tanıma ve bulanık kümeler gibi ilgili alanlar da, o kuruluşun araçları da kolayca görülmediği zaman, genellikle bilinmeyen veya kötü tanımlanmış işlevlerin sonuçlarının organizasyonu olarak görülebilir. Bu, yalnızca belirli nadir durumlarda geçilebilen pratik olarak aşılmaz bir uçurum yaratır - ancak bunlar bile tek kullanımlık bir durumun altında toplanabilir: veri madenciliği algoritmaları ile açıklıksız etkileşimi önler.
Kaos Bilimi İş Akışı ile Uyumsuzluk
“Kaos bilimindeki” tipik iş akışı, bifürkasyon diyagramları, Hénon haritaları, Poincaré kesitleri, faz diyagramları ve faz yörüngeleri gibi, genellikle faz alanının görsel yardımcılarının yanında, bilinen bir fonksiyonun çıktılarının hesaplamalı bir analizini yapmaktır. Araştırmacıların hesaplama deneylerine güvenmesi, kaotik etkilerin ne kadar zor bulunacağını göstermektedir; normalde kalem ve kağıtla belirleyebileceğiniz bir şey değil. Ayrıca sadece doğrusal olmayan fonksiyonlarda ortaya çıkarlar. Bilinen bir işlevimiz olmadığı sürece bu iş akışı mümkün değildir. Veri madenciliği regresyon denklemleri, bulanık fonksiyonlar ve benzerlerini verebilir, ancak hepsi aynı sınırlamayı paylaşırlar: hatalar için çok daha geniş bir pencereye sahip olan sadece genel yaklaşımlardır. Aksine, kaosa maruz kalan bilinen işlevler nispeten nadirdir, kaotik desenler veren girdi aralıkları gibi, kaotik etkileri test etmek için bile yüksek derecede özgüllük gerekir. Bilinmeyen fonksiyonların faz boşluğunda bulunan garip çekiciler, tanımları ve girdileri değiştikçe kesinlikle değişecek veya ortadan kalkacak ve Alligood, et al.
Veri Madenciliği Sonuçlarında Bulaşıcı Olarak Kaos
Aslında, veri madenciliği ve akrabalarının kaos teorisiyle ilişkisi pratik olarak çekicidir. Şifreleme şemalarındaki kaostan yararlanma konusunda en az bir araştırma kağıdına rastladığım göz önüne alındığında, kriptanalizi geniş bir şekilde belirli bir veri madenciliği biçimi olarak görürsek, bu gerçekten doğrudur (Şu anda alıntıyı bulamıyorum, ancak avlayabilirim) istek üzerine aşağı). Bir veri madencisi için, kaosun varlığı normalde kötü bir şeydir, çünkü çıktı verdiği görünüşte saçma değer aralıkları, bilinmeyen bir işleve yaklaşmanın zaten zorlu sürecini büyük ölçüde karmaşıklaştırabilir. Veri madenciliği ve ilgili alanlarda kaos için en yaygın kullanım, onu ortadan kaldırmaktır, bu da demek değildir. Kaotik etkiler mevcut ama fark edilmemişse, bunların bir veri madenciliği girişimi üzerindeki etkilerinin üstesinden gelmek zor olabilir. Sıradan bir sinir ağının veya karar ağacının kaotik bir çekicinin görünüşte saçma çıktının ne kadar kolay geçebileceğini veya giriş değerlerindeki ani artışların kesinlikle regresyon analizini nasıl engelleyebileceğini ve kötü örneklere veya diğer hata kaynaklarına atfedilebileceğini düşünün. Tüm işlevler ve girdi aralıkları arasındaki kaotik etkilerin nadir görülmesi, bunlarla ilgili soruşturmanın deneyciler tarafından ciddi ölçüde depireitleştirileceği anlamına gelir.
Veri Madenciliği Sonuçlarında Kaos Tespit Yöntemleri
Kaos teorisiyle ilişkili bazı önlemler, Kolmogorov Entropisi ve faz boşluğunun pozitif bir Lyapunov üssü sergilemesi şartı gibi aperiodik etkilerin tanımlanmasında yararlıdır. Bunların her ikisi de AB belambel'in Uygulamalı Kaos Teorisinde sağlanan kaos tespiti için kontrol listesinde [2], ancak çoğu bilinen limitleri olan belirli fonksiyonlar gerektiren Lyapunov üssü gibi yaklaşık fonksiyonlar için yararlı değildir. Genel prosedürü yine de veri madenciliği durumlarında yararlı olabilir; Belambel'in amacı nihayetinde bir “kaos kontrolü” programı, yani karışan aperiodik etkilerin ortadan kaldırılmasıdır. [3] Kaosa yol açan kesirli boyutların saptanması için kutu sayımı ve korelasyon boyutlarının hesaplanması gibi diğer yöntemler, veri madenciliği uygulamalarında Lyapunov ve listesindeki diğerlerinden daha pratik olabilir. Kaotik etkilerin diğer bir belirtisi, faz çıktılarında genellikle aperiodik (yani "kaotik") davranıştan önce gelen fonksiyon çıktılarında dönem ikiye katlama (veya üç kat ve daha fazla) örüntülerinin varlığıdır.
Teğetsel Uygulamaların Farklılaştırılması
Bu birincil kullanım durumu, sadece kaos teorisiyle teğet olarak ilişkili ayrı bir uygulama sınıfından ayırt edilmelidir. Daha yakından incelendiğimde, sorumda verdiğim “potansiyel uygulamalar” listesi neredeyse tamamen kaos teorisinin bağlı olduğu, ancak aperiodik davranışın (dönem ikiye katlanması hariç) bağımsız olarak uygulanabilecek kavramlardan yararlanma fikirlerinden oluşuyordu. Son zamanlarda, yerel minimadan pop sinir ağlarına popperetik davranış üreten yeni bir potansiyel niş kullanımını düşündüm, ancak bu da teğet uygulamalar listesine ait olacaktı. Birçoğu kaos bilimine yönelik araştırmalar sonucunda keşfedildi veya ete geçti, ancak diğer alanlara da uygulanabilir. Bu “teğet uygulamaların” birbirleriyle sadece bulanık bağlantıları vardır, ancak farklı bir sınıf oluştururlar, veri madenciliğinde kaos teorisinin ana kullanım durumundan kesin bir sınırla ayrılmış; ilki, kaos teorisinin aperiodik paternleri olmadan belirli yönlerinden yararlanırken, ikincisi sadece belki de Lyapunov üssünün pozitifliği ve dönem ikilemesinin tespiti gibi ön koşulların kullanımı ile veri madenciliği sonuçlarında karmaşık bir faktör olarak kaosun dışlanmasına ayrılmıştır. . Kaos teorisi ile doğru bir şekilde kullandığı diğer kavramlar arasında ayrım yaparsak, öncül uygulamalarının sıradan bilimsel çalışmada bilinen fonksiyonlarla sınırlı olduğunu görmek kolaydır. Bu ikincil kavramların kaosun yokluğunda potansiyel uygulamaları hakkında heyecanlanmak için gerçekten iyi bir neden var, aynı zamanda, beklenmedik aperiodik davranışın mevcut olduğunda veri madenciliği çabaları üzerindeki kontamine edici etkileri hakkında endişelenmenin de nedeni. Bu tür durumlar nadir olacak, ancak bu nadirlik muhtemelen tespit edilmeyecekleri anlamına gelecektir. Belambel'in yöntemi bu tür problemleri çözmede yararlı olabilir.
[1] s. 143-147, Alligood, Kathleen T .; Sauer, Tim D. ve Yorke, James A., 2010, Kaos: Dinamik Sistemlere Giriş, Springer: New York. [2] s. 208-213, Şambel, AB, 1993, Uygulamalı Kaos Teorisi: Karmaşıklık için Bir Paradigma, Academic Press, Inc .: Boston. [3] s. 215, belambel.