Sansür ve kesilme arasındaki fark nedir?


30

Ömür Boyu Verilere İlişkin İstatistiksel Modeller ve Yöntemler kitabında ;

Sansür Verme: Rasgele bir nedenden ötürü bir gözlem eksik olduğunda.
Kısaltma: Gözlemin eksik doğası, çalışma tasarımına özgü sistematik bir seçim sürecinden kaynaklandığı zaman.

Kısaltma tanımında “çalışma tasarımına özgü sistematik seçim süreci” ile ne kastedilmektedir?

Sansür ve kesilme arasındaki fark nedir?


3
Buradaki cevaba bir göz atın .
Dimitriy V. Masterov

3
Sansür: "Bir yerde o bölgede bir gözlem yaptık ama bunun ne olduğunu bilmiyoruz". Kısaltma: "Gözlem? Ne gözlemi?"
Glen_b -Reinstate Monica

Tanımlarınız nereden alıntılandı?
Glen_b -Reinstate Monica

1
@Glen_b Sorumu değiştirdim.
ABC

Yanıtlar:


57

Tanımlar değişkendir ve iki terim bazen birbirinin yerine kullanılır. En yaygın kullanımları aşağıdaki veri setini kullanarak açıklamaya çalışacağım:

11.25245

Sansür : Bazı gözlemler sansürlenecek, bu sadece onların bir sınırın altında (veya üstü) olduğunu bildiğimiz anlamına geliyor. Bu, örneğin bir su örneğindeki bir kimyasal maddenin konsantrasyonunu ölçersek oluşabilir. Konsantrasyon çok düşükse, laboratuar ekipmanı kimyasalın varlığını tespit edemez. Yine de mevcut olabilir, bu yüzden konsantrasyonun yalnızca laboratuvar tespit sınırının altında olduğunu biliyoruz.

Tespit sınırı 1.5 ise, bu sınırın altına düşen gözlemler sansürlenirse, örnek veri setimiz: yani, ilk iki gözlemin gerçek değerlerini bilmiyoruz, ancak sadece 1.5'ten küçük olduklarını biliyoruz.

<1.5<1.5245,

Kısaltma : Verileri üreten işlem, kesme sınırının sadece üstündeki (veya altındaki) sonuçları gözlemlemenin mümkün olduğu şekildedir. Bu, örneğin ölçümler, yalnızca tespit ettiği sinyaller belirli bir limitin üzerindeyse etkin olan bir dedektör kullanılarak alındığında ortaya çıkabilir. Çok sayıda zayıf gelen sinyal olabilir, ancak bu dedektörü kullanmayı asla söyleyemeyiz.

Kısaltma sınırı 1.5 ise, örnek veri setimiz ve aslında kaydedilmemiş iki sinyal olduğunu bilmiyorduk.

245

Yani, terimlerin bu kullanımı üzerine, kelimenin teknik olmayan kullanımı anlamında düşünürsek, "sansür" yanıltıcı olur mu? yani bu istatistiksel anlamda, teknik olmayan bir anlam gibi bir şeyden ziyade "belirsiz" veya "sadece belirli bir aralığa girdiği bilinen" anlamına gelir; içeriği.
Mars,

3
Kesin bir somut örnek için, araba sigortası şirketleri hiçbir zaman hasarın düşülenden daha az olduğu kazaları hiç duymazlar, çünkü insanlar orada rapor vermezler. Bu sol kesmedir; bu olaylarla ilgili hiçbir zaman veri görmeyiz. Bir doğru sansür örneği için, hasta bir hasta doktorunu görmeyi bırakmaya karar verdiğinde veya farklı bir şehre taşındığında, o zaman bilinen tek şey bıraktıkları gün hayatta oldukları, ancak ne zaman öldüklerini bilmediğimizdir. .
David White

@Mars: “sansür işleminin” tüm izlerini ortadan kaldırdığı ve “kesmenin” detayları sildiği modern teknik olmayan kullanımdan geriye doğru geldiğini kabul ediyorum. Ancak istatistiklerde "sansürleme", eskiden modaya uygun olmayan teknik anlamda, bir sansürün bir şey izini kaldırabildiği ancak ortadan kaldıramayacağı bir anlamda kullanılır: bir fotoğraf veya videonun rahatsız edici kısımlarına yerleştirilen kara kutular veya bulanıklıklar radyoda veya sansürlü (daha modern terim "yeniden düzenlenmiş") parçaların karartıldığı yerlerde, askerlerin eve ya da sınıflandırılmış belgelere yazdıkları mektuplar.
Wayne

İki tür olay olayı arasındaki zaman atlamasını ölçtüğümü hayal edin. Ancak etkinliği yalnızca 1 yıl boyunca kaydedebilirim. Zaman sansürlenir mi yoksa kesilir mi?
skan

4

Tıpkı başka bir alandan (programlama) bir perspektif gibi, sansürleme ve kesme iki ayrı işlemdir.

Hassas bir veri kümesi ile çalışırken, örnek sosyal güvenlik numaraları ve telefon numaraları için, ben belki sansür o ya da var sansürlenmiş erişimi öncesinde hak kazanmak:

123-12-1234 => 999-99-9999
567-56-5678 => 999-99-9999
(906) 123-4567 => (000) 000-0000

Bu, uygulamanın geri kalanının normalde olduğu gibi, benzer veri yapılarında, ancak gerçek bilgi içeriği veya özel bilgilerin yayılması olmadan çalışmasını sağlar.

Kesinti, aksine, genellikle belirli bir noktadan sonra kalan değerleri keser. Bir uygulama üzerinde çalışmak için yüz binlerce kayda ihtiyacım yok, belki de sadece ~ 50’ye ihtiyacım var ki bu da veri erişimini çok daha hızlı hale getiriyor ve veri daha küçük oluyor.

Benzer bir kesme çeşidi, bir sütuna veya sınırlı uzunlukta veya hassasiyetli bir veri türüne bir değer eklerken:

abcdefghijklmnopqrstuv => abcdef
10.23412421345 => 10.23
10.92455311 => 10

1
+1 Sansür ve kısaltmanın istatistik dışında tamamen farklı anlamlara sahip olabileceğini bilmek önemlidir!
MånsT
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.