Bazı istatistikler (ve olasılık, sanırım) en temelden en ileri seviyeye kadar olan sorularla röportaj soruları arıyorum. Cevaplar gerekli değildir (bu sitedeki belirli sorulara bağlantılar iyi yapsa da).
Bazı istatistikler (ve olasılık, sanırım) en temelden en ileri seviyeye kadar olan sorularla röportaj soruları arıyorum. Cevaplar gerekli değildir (bu sitedeki belirli sorulara bağlantılar iyi yapsa da).
Yanıtlar:
İşin ne olduğundan emin değilim, ama bence "x acemiye açıkla" muhtemelen iyi olurdu
a) Çünkü muhtemelen bu işi yapmak zorunda kalacaklar
b) iyi bir anlama testi, sanırım.
Çalıştığım standart Q, şu satırlar boyunca:
Kullandığınızı iddia ettiğiniz istatistiksel bir paketin çoklu bir lojistik regresyon çıktısına bir göz atın (tercihen bir tane de kullanırız). XXX, ana faizin bağımsız değişkenidir. Bir meslektaşın sonuçlarını, konuyla ilgili bilgi sahibi ancak resmi bir istatistiksel eğitim olmadan ne kadar yorumluyorsunuz? (Gerekirse nokta tahmininin ayrı ayrı yorumlanması istenirse, CI, p-değeri).
Ayrıca, röportajın ilgi yapısını ölçmek için en iyi araç olup olmadığını da düşünebilirsiniz. Öncelikli olasılık veya istatistik bilgisini ölçmek istiyorsanız, yazılı bir sınava daha fazla güvenerek daha iyi olabilirsiniz. Daha fazla soru sorabilir ve böylece ölçümün güvenilirliğini artırabilirsiniz. Hem yönetimde hem de puanlamada daha standart hale geldi. Cihaz geliştirildikten sonra, yönetmek için muhtemelen daha az kaynak kullanır.
Daha sonra görüşmeyi sözlü ve kişilerarası beceriler gibi faktörlere bakarak daha odaklı bir araç olarak kullanabilirsiniz.
Bana iki soru soruldu:
1) Başka bir departmandaki bir işçinin ilgilendiği belirli bir değişkenin etkisini incelemek için çoklu bir regresyon uyguluyorsunuz. Değişken önemsiz geri geliyor, ancak iş arkadaşınız bunun bir etkisinin olduğu bilindiği için bunun imkansız olduğunu söylüyor. Ne söyler / yaparsın?
2) 1000 değişken ve 100 gözleminiz var. Belirli bir yanıt için önemli değişkenleri bulmak istersiniz. Sen ne yapardın?
İşte büyük bir veri kümesi. Aykırılıklarla başa çıkma planınız nedir? Kayıp değerler nasıl? Dönüşümler nasıl?
Gerçek dünyadaki verilerle başa çıkabilir mi?
Bu sitedeki birçok soru / cevap, iyi sorular için fikir verebilir. İyi olduğunu düşündüğüm bazı bağlantıları içeren bir liste vereceğim. Yanıtladığım yayınlar aşırı temsil ediliyor, çünkü bu yayınları daha iyi biliyorum, zorunlu olarak en iyisi oldukları için değil! Her bağlantıya kısa yorumlar veriyorum, böylece bağlantıyı takip etmek isteyip istemediğinize karar verebilirsiniz.
SVD'nin ardındaki sezgi nedir? "Müşterilerimize SVD'nin nasıl çalıştığını açıklayabilir misiniz?"
En İyi Olabilirlik Tahmini (MLE) meslekten olmayan terimlerle "Teknik olmayan bir dilde en çok olabilirlik tahmini fikrini açıklayabilir misiniz?"
Talebi ve Kara Kuğu "Söyle bana, bir siyah kuğu nedir ve bu neden alakalı? Ne zaman alakalı?"
Örneklem "nüfus " olduğunda istatistiki çıkarım "Örneklem bütün nüfus olduğunda istatistiksel çıkarım hakkında ne söyleyebilirsiniz?"
Uyum iyiliği ve lineer regresyon veya Poisson'ı seçmek için hangi modeli " Cevabın bir sayım değişkeni olduğu bir regresyon problemimiz var. Bu bağlamda hangisini seçersiniz? “Bu modeller arasındaki temel farklar nedir?”
Sonlu ve sonsuz varyans arasındaki fark nedir? "Mümkün olduğu kadar basit bir dilde, rasgele bir değişkenin sonsuz beklentiye veya sonsuz varyansa sahip olmasının ne anlama geldiğini açıklayabilir misiniz? Bu ayrımın pratik önemi nedir? örnek."
Kademeli regresyona modern, kolay kullanılan alternatifler nelerdir? “Pek çok olası yordayıcı değişkeni olduğunda karmaşık bir regresyon modelini nasıl inşa edersiniz? Farklı olası stratejileri tanımlayın ve her biriyle ilgili sorunları anlatın”
Lojistik regresyonda kusursuz ayrılıkla nasıl başa çıkılır? “Lojistik regresyonda ayrılma sorunu, nedenleri, belirtileri nedir? Gerçekten bir sorunsa, bunu çözmek için ne yapabilirsiniz?”
Korelasyon matrisinin neden pozitif yarı kesin olması gerekir ve pozitif yarı kesin olmanın anlamı nedir? ve
Ne olmayan bir pozitif kesin kovaryans matrisi benim veriler hakkında bana anlatıyor? "Bir kovaryans matrisinin neden pozitif (yarı) kesin olması gerektiğini ve bunun ne anlama geldiğini açıklayın. Bu gerçek nasıl kullanılabilir?"
Medyanın çok boyutlu versiyonları nelerdir ? "Medyanı çok değişkenli verilere genelleştirmek için bir yol önerebilir misiniz?"
Logit regresyonda etkileşimli terimleri kategorik değişkenlerle yorumlayabilme ve etkileşim etkilerini belirlemede en iyi uygulamalar nelerdir? ve İki olumsuz ana etki henüz olumlu etkileşim etkisi var mı? ve etkileşim ama bir model değil ana etkileri dahil ve ortak etkisi anlamlı değilken nasıl ana etkilerini yorumlamak? “Regresyon modellerinde etkileşimin ne anlama geldiğini açıklayın. Özellikle, ana etkiler olmasa da etkileşimin anlamlı olması ne anlama gelir? Normal sıradan regresyon ve lojistik regresyon arasındaki etkileşimin yorumlanmasında bir farklılık var mı?”
Verilerde karekök dönüşümünü kullanmanın nedeni ne olabilir? ve Uygun veri dönüşümü "Regresyon (veya ANOVA) modelinde cevap değişkenini ne zaman, nasıl ve neden dönüştürüyorsunuz? Herhangi bir alternatif var mı?
Normal olmayan dağıtılmış bir DV için ANOVA sonuçlarına güvenebilir miyim? "Bir ANOVA'ya normal olmayan artıklarla nasıl davranırsınız?
İstatistikler, önemli olan birçok şey tek vuruşlu şeyler olduğunda faydalıdır?
Bernoulli rasgele değişkenlerinin toplamını nasıl verimli bir şekilde modelleyebilirim?
Genelleştirilmiş tahmin denklemleri ve karma etki modellerini ne zaman kullanmalı?
Lojistik regresyonda kare kaybı kullandığımda burada neler oluyor? "Neden lojistik regresyon için maksimum olasılık kullanıyoruz? Neden en küçük kareler değil?"
Bir keresinde merkezi limit teoreminin ilişkisini, sosyal bilimlerde, istatistiklerle ilgili bilgisi olmayan bir birinci sınıf öğrenciyle nasıl açıklayacağımı sordum.
Sayısal olmayan bir şeyi nasıl sayısallaştırırsınız?
Örnek, "Ses Verilerini Sınıflandırmak için Otomatik Özellik Çıkarma"
Gerekçe: Halen büyük bir tabloda bulunmayan bir şeyi istatistiksel olarak nasıl analiz edebileceğini bulabilirler mi?
İstatistiksel bir model oluştururken aşırı uyumu nasıl önlersiniz?
İyi cevap: çapraz doğrulama
Sık sık "Tahminlerin ne olduğunu nasıl tanımlarsınız / açıklarsınız?" Diye soruyorum.
Bu tür çok genel bir sorunun cevabı, insanların belirli bir tahmin durumuyla bağlantılı olup olmadıklarını görmeme yardımcı oluyor. Doğru bir cevap yoktur ancak görüşme sırasında bunu sentetik olarak cevaplamak her zaman kolay değildir :)
Gözlemsel veri içeriği için:
Bu temel soruna uygulanan bu regresyon modelini göz önünde bulundurun. Ne, içinde bir şey varsa, nedensel olarak yorumlanabilir mi? [Daha fazla araştırma] Fikrinizi değiştirmek için ne öğrenmeniz gerekir?
Bangalore'daki sandal ağacı ağaçlarının sayısını nasıl sayacaksınız?
Nedensellik - korelasyon başlığı altında :
Tahmini model için müşteri / kullanıcı katılımını kullanmak yaygındır. Örneğin, bu düğmeyi tıklayanların abone olmadıklarından daha fazla abone olma olasılıkları yüksektir. Pazartesi günleri alışveriş yapanların salı günleri alışveriş yapanlara göre tekrar alışveriş yapma olasılıkları daha yüksektir.
Bunu bir uç noktaya götürürsek: "Satın al" ı tıklayan kullanıcıların bir ürünü satın alma olasılıkları, satın almayı tıklatmayan kullanıcılardan daha fazladır.
Ancak açıkçası, bazı kullanıcıların neden abone olduklarını ve bazılarının neden katılmadıklarını açıklamakta pek yardımcı olmuyor.
Aboneliğin neden aboneliğiyle yüksek oranda ilişkili olduğunu, ancak bu görevi gerçekleştirmek için gerekli olanları neden abone olduklarını açıklayan müşteri özelliklerini kullanarak dengelemeyi nasıl sürdürürsünüz?
İşte bir TinkerToy seti. Öklid mesafesinin üç boyutta nasıl çalıştığını göster. Şimdi bana çoklu regresyonun nasıl çalıştığını göster.
İstatistiğin fiziksel dünyada nasıl işlediğini açıklayabilir mi?
Bir müşteri hizmetleri merkezi işletiyoruz. Ayda 1 milyon çağrı alıyoruz. Onu on bine nasıl indiririz?
Sorduğumuz soruların çoğu, daha önce tarif edilmiş olanlara benzer. Fakat henüz okumadığım, bazıları kullanılmış: bir beyaz tahtada bir program çizmeniz gibi bir şey yapmanız istenebilir: bir zar atma veya başka bir olasılık problemi simülasyonu yapmak veya bir dizi asal sayıyı hesaplamak (örn. 1000.000'den az olan asal sayılar) - bunu istediğiniz dilde yapabilirsiniz, ancak çoğu kişi R'yi, bazıları Python'u (inanıyorum) seçer, ancak sanırım Stata, SAS, SPSS'yi seçebilirsiniz. , Matlab, vb. Muhtemelen, seçtiğiniz programlama dili konusundaki bilginizin derinliğini araştırmak için size sorular sorulur - örneğin, kullanım neden örneğin R'deki bir for döngüsü yerine uygulanır?
Ayrıca bir şeyi araştırmak için bir deney ya da başka bir çalışma tasarlamanız istenebilir - genellikle pratik bir şey - bazen bu yaptığımız işle ilgili olacaktır, ancak çoğu zaman değil. (Yaptığımız çalışma hakkında bilgi sahibi olmamanız gerekiyor, ancak bilmediğiniz belirli alan bilgisine sahip olsanız bile, duymadığınız bir problemin özünü kavrayabilmeli ve üzerinde akıllıca spekülasyon yapabilmelisiniz. bu yanlıştı - tamam, etki alanı bilgisine sahip olmanız beklenmiyor). İktidar gibi şeyleri hesaba katmanız istenebilir.
Nicel değişkenin varyans analizi yapılırken, bazen değişkenin sıklığının çok yüksek olduğu bulundu (> 5), o zaman Fisher'ın kesin testini değişkenin bağımsızlığını bulmak için kullanırız.
Geçen yıl Yankees oyunlarına ortalama ücretli katılım 55.000 idi. NYC'de bir grup kişiye, geçen sezon bir Yankees maçına girip girmediklerini soruyorsunuz ve yaptılarsa, ücretli katılımı kaydediyorsunuz. Oyuna gittiğini sorduğun kişilerin katıldığı oyunlara ortalama ücretli katılım nedir?
Size cevabım için ipucu vereceğim (ipucu verilmedi): uzunluk önyargılı örnekleme. Bunun üzerine bir ev koştum ama oyunu kazanmak için yeterli değildi, ha ha. Not: Örneklemenin nasıl yapıldığına ilişkin birçok uyarıdan bahsettim ve görüşmeci bana hepsini göz ardı etmemi söyledi.