İstatistik görüşme soruları


65

Bazı istatistikler (ve olasılık, sanırım) en temelden en ileri seviyeye kadar olan sorularla röportaj soruları arıyorum. Cevaplar gerekli değildir (bu sitedeki belirli sorulara bağlantılar iyi yapsa da).



Biri ile röportaj yaparken kendilerine verilen örnekler verebilecek olsaydı çok ilginç olurdu ...
kjetil b halvorsen

Yanıtlar:


40

İşin ne olduğundan emin değilim, ama bence "x acemiye açıkla" muhtemelen iyi olurdu

a) Çünkü muhtemelen bu işi yapmak zorunda kalacaklar

b) iyi bir anlama testi, sanırım.


8
(+1): Bir şeyi anladığımı düşündüğüm zamanı sayamıyorum, ama sonra başkalarına kolay sözlerle açıklayamadım. Örnek: p-değeri;)
steffen

6
“Altı yaşındaki bir çocuğa açıklayamazsanız, o zaman muhtemelen kendiniz anlamıyorsunuzdur” - Albert Einstein. Belki o kadar aşırı değil, ama sen anladın ... :)
JM istatistikçi değil

1
"Acemiye" kısmıyla veya olmadan "p-değerini açıkla" yı seviyorum.
36'da shabbychef

bu nedenle çapraz onaylanmış durum mükemmeldir. birçok "layman" sorusu ve cevabı.
Neil McGuigan

Röportaj yapsanız da yapmasanız da gerçekten iyi bir tavsiye!
JMS

21

Çalıştığım standart Q, şu satırlar boyunca:

Kullandığınızı iddia ettiğiniz istatistiksel bir paketin çoklu bir lojistik regresyon çıktısına bir göz atın (tercihen bir tane de kullanırız). XXX, ana faizin bağımsız değişkenidir. Bir meslektaşın sonuçlarını, konuyla ilgili bilgi sahibi ancak resmi bir istatistiksel eğitim olmadan ne kadar yorumluyorsunuz? (Gerekirse nokta tahmininin ayrı ayrı yorumlanması istenirse, CI, p-değeri).


15
Daha fazla akademik bağlamda, şunu da sorabilirsiniz: 'Bu makalede sizin yazdığınız (birlikte) yazdığınız çıktıya bir bakın . Bana ne anlama geldiğini söyle. Underwhelming cevaplar daha sonra ölümcüldür, çünkü bilinmeyen bir bahane yoktur, ancak dehşet verici derecede yaygındır.
conjugateprior

4
@conjugateprior Doğru değil. Mevcut olmayan en az bir ortak yazar olduğu sürece, mevcut olmayan ortak yazarın alanıydı. Bu tekniğin temel kullanımı konferans sunumlarında.
Mark L. Stone

18

Ayrıca, röportajın ilgi yapısını ölçmek için en iyi araç olup olmadığını da düşünebilirsiniz. Öncelikli olasılık veya istatistik bilgisini ölçmek istiyorsanız, yazılı bir sınava daha fazla güvenerek daha iyi olabilirsiniz. Daha fazla soru sorabilir ve böylece ölçümün güvenilirliğini artırabilirsiniz. Hem yönetimde hem de puanlamada daha standart hale geldi. Cihaz geliştirildikten sonra, yönetmek için muhtemelen daha az kaynak kullanır.

Daha sonra görüşmeyi sözlü ve kişilerarası beceriler gibi faktörlere bakarak daha odaklı bir araç olarak kullanabilirsiniz.


1
Bu iyi bir nokta. Geçmişte onlarla birlikte çalışmadıysanız, belirli bir adayın işe yarayıp yaramadığını söylemenin çok zor olduğunu öğrendim.
Aralık'ta

15

Bana iki soru soruldu:

1) Başka bir departmandaki bir işçinin ilgilendiği belirli bir değişkenin etkisini incelemek için çoklu bir regresyon uyguluyorsunuz. Değişken önemsiz geri geliyor, ancak iş arkadaşınız bunun bir etkisinin olduğu bilindiği için bunun imkansız olduğunu söylüyor. Ne söyler / yaparsın?

2) 1000 değişken ve 100 gözleminiz var. Belirli bir yanıt için önemli değişkenleri bulmak istersiniz. Sen ne yapardın?


Cevapları da gönderebilir misin? 1) Sanırım, soruna neden olan bazı bağımlı değişkenler olabilir. 2 için) muhtemelen (² (ki-kare) istatistik testine giderim
Rishi Dua

2
Her ikisine de çok makul cevaplar var, işte benim hızlı düşüncelerim: 1) regresyon modeli bir numuneden geliyor, bu örnek rastgele değişkenlik gösteriyor ve bu nedenle model sadece bir tahmindir ve tip 1 veya tip 2 hatalarına neden olabilir. Prediktörler arasında ağır bir eşliklilik de olabilir. 2 için) bu büyük P vs küçük N problemi. Bu durumu ele almak için boyutları ve Kementleri azaltmak gibi birçok teknik var.
Glen

2) değişkenlerin tek değişkenli
adam

11

İşte büyük bir veri kümesi. Aykırılıklarla başa çıkma planınız nedir? Kayıp değerler nasıl? Dönüşümler nasıl?

Gerçek dünyadaki verilerle başa çıkabilir mi?


Sevgili anonim kullanıcı, lütfen yorumlar için düzenleme kullanmayın (bu sizin için değil Neil).

10

Bu sitedeki birçok soru / cevap, iyi sorular için fikir verebilir. İyi olduğunu düşündüğüm bazı bağlantıları içeren bir liste vereceğim. Yanıtladığım yayınlar aşırı temsil ediliyor, çünkü bu yayınları daha iyi biliyorum, zorunlu olarak en iyisi oldukları için değil! Her bağlantıya kısa yorumlar veriyorum, böylece bağlantıyı takip etmek isteyip istemediğinize karar verebilirsiniz.

SVD'nin ardındaki sezgi nedir? "Müşterilerimize SVD'nin nasıl çalıştığını açıklayabilir misiniz?"

En İyi Olabilirlik Tahmini (MLE) meslekten olmayan terimlerle "Teknik olmayan bir dilde en çok olabilirlik tahmini fikrini açıklayabilir misiniz?"

Talebi ve Kara Kuğu "Söyle bana, bir siyah kuğu nedir ve bu neden alakalı? Ne zaman alakalı?"

Örneklem "nüfus " olduğunda istatistiki çıkarım "Örneklem bütün nüfus olduğunda istatistiksel çıkarım hakkında ne söyleyebilirsiniz?"

Uyum iyiliği ve lineer regresyon veya Poisson'ı seçmek için hangi modeli " Cevabın bir sayım değişkeni olduğu bir regresyon problemimiz var. Bu bağlamda hangisini seçersiniz? “Bu modeller arasındaki temel farklar nedir?”

Sonlu ve sonsuz varyans arasındaki fark nedir? "Mümkün olduğu kadar basit bir dilde, rasgele bir değişkenin sonsuz beklentiye veya sonsuz varyansa sahip olmasının ne anlama geldiğini açıklayabilir misiniz? Bu ayrımın pratik önemi nedir? örnek."

Kademeli regresyona modern, kolay kullanılan alternatifler nelerdir? “Pek çok olası yordayıcı değişkeni olduğunda karmaşık bir regresyon modelini nasıl inşa edersiniz? Farklı olası stratejileri tanımlayın ve her biriyle ilgili sorunları anlatın”

Lojistik regresyonda kusursuz ayrılıkla nasıl başa çıkılır? “Lojistik regresyonda ayrılma sorunu, nedenleri, belirtileri nedir? Gerçekten bir sorunsa, bunu çözmek için ne yapabilirsiniz?”

Korelasyon matrisinin neden pozitif yarı kesin olması gerekir ve pozitif yarı kesin olmanın anlamı nedir? ve
Ne olmayan bir pozitif kesin kovaryans matrisi benim veriler hakkında bana anlatıyor? "Bir kovaryans matrisinin neden pozitif (yarı) kesin olması gerektiğini ve bunun ne anlama geldiğini açıklayın. Bu gerçek nasıl kullanılabilir?"

Medyanın çok boyutlu versiyonları nelerdir ? "Medyanı çok değişkenli verilere genelleştirmek için bir yol önerebilir misiniz?"

Logit regresyonda etkileşimli terimleri kategorik değişkenlerle yorumlayabilme ve etkileşim etkilerini belirlemede en iyi uygulamalar nelerdir? ve İki olumsuz ana etki henüz olumlu etkileşim etkisi var mı? ve etkileşim ama bir model değil ana etkileri dahil ve ortak etkisi anlamlı değilken nasıl ana etkilerini yorumlamak? “Regresyon modellerinde etkileşimin ne anlama geldiğini açıklayın. Özellikle, ana etkiler olmasa da etkileşimin anlamlı olması ne anlama gelir? Normal sıradan regresyon ve lojistik regresyon arasındaki etkileşimin yorumlanmasında bir farklılık var mı?”

Verilerde karekök dönüşümünü kullanmanın nedeni ne olabilir? ve Uygun veri dönüşümü "Regresyon (veya ANOVA) modelinde cevap değişkenini ne zaman, nasıl ve neden dönüştürüyorsunuz? Herhangi bir alternatif var mı?

Normal olmayan dağıtılmış bir DV için ANOVA sonuçlarına güvenebilir miyim? "Bir ANOVA'ya normal olmayan artıklarla nasıl davranırsınız?

İstatistikler, önemli olan birçok şey tek vuruşlu şeyler olduğunda faydalıdır?

Bernoulli rasgele değişkenlerinin toplamını nasıl verimli bir şekilde modelleyebilirim?

Genelleştirilmiş tahmin denklemleri ve karma etki modellerini ne zaman kullanmalı?

Lojistik regresyonda kare kaybı kullandığımda burada neler oluyor? "Neden lojistik regresyon için maksimum olasılık kullanıyoruz? Neden en küçük kareler değil?"


9

Bir keresinde merkezi limit teoreminin ilişkisini, sosyal bilimlerde, istatistiklerle ilgili bilgisi olmayan bir birinci sınıf öğrenciyle nasıl açıklayacağımı sordum.


4
Merkezi Limit Teoreminin alaka düzeyi, aslında hiçbir şey olmadığı zaman, insanların her şeyin Normal olduğunu düşünmelerini sağlamaktır. Ve bu nedenle birçok hatalı sonuca yol açar.
Mark L. Stone


8

İstatistiksel bir model oluştururken aşırı uyumu nasıl önlersiniz?

İyi cevap: çapraz doğrulama


6

Sık sık "Tahminlerin ne olduğunu nasıl tanımlarsınız / açıklarsınız?" Diye soruyorum.

Bu tür çok genel bir sorunun cevabı, insanların belirli bir tahmin durumuyla bağlantılı olup olmadıklarını görmeme yardımcı oluyor. Doğru bir cevap yoktur ancak görüşme sırasında bunu sentetik olarak cevaplamak her zaman kolay değildir :)


5

Gözlemsel veri içeriği için:

Bu temel soruna uygulanan bu regresyon modelini göz önünde bulundurun. Ne, içinde bir şey varsa, nedensel olarak yorumlanabilir mi? [Daha fazla araştırma] Fikrinizi değiştirmek için ne öğrenmeniz gerekir?


4

Bangalore'daki sandal ağacı ağaçlarının sayısını nasıl sayacaksınız?


1
Bu bir çeşit Fermi sorusu mu demek ?
Thies Heidecke

2
İyi soru. Bunun bir versiyonunu sınıfta kullandım (bir parkta ağaç). Örnekleme fikrini alıyorlar, ancak operasyonel tanımlamaya duyulan ihtiyacı özlüyorlar: ne zaman ağaç demeye başlıyorsun?
zbicyclist

4

Nedensellik - korelasyon başlığı altında :

Tahmini model için müşteri / kullanıcı katılımını kullanmak yaygındır. Örneğin, bu düğmeyi tıklayanların abone olmadıklarından daha fazla abone olma olasılıkları yüksektir. Pazartesi günleri alışveriş yapanların salı günleri alışveriş yapanlara göre tekrar alışveriş yapma olasılıkları daha yüksektir.

Bunu bir uç noktaya götürürsek: "Satın al" ı tıklayan kullanıcıların bir ürünü satın alma olasılıkları, satın almayı tıklatmayan kullanıcılardan daha fazladır.

Ancak açıkçası, bazı kullanıcıların neden abone olduklarını ve bazılarının neden katılmadıklarını açıklamakta pek yardımcı olmuyor.

Aboneliğin neden aboneliğiyle yüksek oranda ilişkili olduğunu, ancak bu görevi gerçekleştirmek için gerekli olanları neden abone olduklarını açıklayan müşteri özelliklerini kullanarak dengelemeyi nasıl sürdürürsünüz?


3

İşte bir TinkerToy seti. Öklid mesafesinin üç boyutta nasıl çalıştığını göster. Şimdi bana çoklu regresyonun nasıl çalıştığını göster.

İstatistiğin fiziksel dünyada nasıl işlediğini açıklayabilir mi?


1
NN

1
100 gözlemlerle arsa iki değişken dağılmaya istiyorsanız, sadece böyle devam 2 boyutları değil 100 :) ve ihtiyaç
Neil McGuigan

3

Bir müşteri hizmetleri merkezi işletiyoruz. Ayda 1 milyon çağrı alıyoruz. Onu on bine nasıl indiririz?


5
Telefonlarınızın% 99'unu kaldırın!
11'te

5
Telefon faturasını ödemeyi bırak.
Glen

3
Arama için bir ücret ödemeniz gerekir. (ABD’de 900’lü bir rakam ...)
gWaldo

7
Bu soru yaklaşık 80–20 kuraldır. İşletmelerde ortak bir kuraldır; örneğin, "satışlarınızın% 80'i müşterilerinizin% 20'sinden geliyor". Microsoft, bildirilen ilk% 20 hata giderildiğinde, hata ve çökmelerin% 80'inin giderileceğini belirtti. Bu, sorunların% 20'sinin adresini tespit etmek için bir SSS oluşturmak anlamına gelecektir
Rishi Dua

3

Sorduğumuz soruların çoğu, daha önce tarif edilmiş olanlara benzer. Fakat henüz okumadığım, bazıları kullanılmış: bir beyaz tahtada bir program çizmeniz gibi bir şey yapmanız istenebilir: bir zar atma veya başka bir olasılık problemi simülasyonu yapmak veya bir dizi asal sayıyı hesaplamak (örn. 1000.000'den az olan asal sayılar) - bunu istediğiniz dilde yapabilirsiniz, ancak çoğu kişi R'yi, bazıları Python'u (inanıyorum) seçer, ancak sanırım Stata, SAS, SPSS'yi seçebilirsiniz. , Matlab, vb. Muhtemelen, seçtiğiniz programlama dili konusundaki bilginizin derinliğini araştırmak için size sorular sorulur - örneğin, kullanım neden örneğin R'deki bir for döngüsü yerine uygulanır?

Ayrıca bir şeyi araştırmak için bir deney ya da başka bir çalışma tasarlamanız istenebilir - genellikle pratik bir şey - bazen bu yaptığımız işle ilgili olacaktır, ancak çoğu zaman değil. (Yaptığımız çalışma hakkında bilgi sahibi olmamanız gerekiyor, ancak bilmediğiniz belirli alan bilgisine sahip olsanız bile, duymadığınız bir problemin özünü kavrayabilmeli ve üzerinde akıllıca spekülasyon yapabilmelisiniz. bu yanlıştı - tamam, etki alanı bilgisine sahip olmanız beklenmiyor). İktidar gibi şeyleri hesaba katmanız istenebilir.


2

Nicel değişkenin varyans analizi yapılırken, bazen değişkenin sıklığının çok yüksek olduğu bulundu (> 5), o zaman Fisher'ın kesin testini değişkenin bağımsızlığını bulmak için kullanırız.


Bu muhtemelen Chris'in cevabı altında ele alınacaktı.
JM, istatistikçi değil

4
Buna doğru cevap, sabit marjinallerin anlam ifade edip etmediğine ve konuyla ilgili bilinçli bir düşünceye sahip olup olmadığına dair bir tartışma olduğunu bilmek mi?
Ben Bolker

1

Geçen yıl Yankees oyunlarına ortalama ücretli katılım 55.000 idi. NYC'de bir grup kişiye, geçen sezon bir Yankees maçına girip girmediklerini soruyorsunuz ve yaptılarsa, ücretli katılımı kaydediyorsunuz. Oyuna gittiğini sorduğun kişilerin katıldığı oyunlara ortalama ücretli katılım nedir?

Size cevabım için ipucu vereceğim (ipucu verilmedi): uzunluk önyargılı örnekleme. Bunun üzerine bir ev koştum ama oyunu kazanmak için yeterli değildi, ha ha. Not: Örneklemenin nasıl yapıldığına ilişkin birçok uyarıdan bahsettim ve görüşmeci bana hepsini göz ardı etmemi söyledi.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.