İyi değişken isimleri:
a) kısa / yazması kolay,
b) hatırlaması kolay,
c) anlaşılabilir / iletişimsel.
Bir şey unutuyor muyum? Tutarlılık aranacak bir şeydir. Benim ifade ettiğim yol, tutarlı adlandırma sözleşmelerinin yukarıdaki niteliklere katkıda bulunmasıdır. Tutarlılık (b) geri çağırma kolaylığına ve (c) anlaşılabilirliğe katkıda bulunur, ancak diğer faktörler genellikle daha önemlidir. (A) ad uzunluğu / yazma kolaylığı (örneğin, tümü küçük harf) ve (c) anlaşılabilirlik arasında açık bir denge vardır.
Binlerce insan veri kullanıyor çünkü bu konularda adil bir düşünce yatırım yapıyorum ve umarım birçok veri hazırlamak ve bazı analiz türlerini kolaylaştırmak için kodumu kullanacaktır . Ergen Sağlığı Boylamsal Çalışmasından elde edilen veriler, birden çok veri kümesine ayrılmıştır. İlk adım, en sık kullanılan veri kümesindeki 227 değişkeni almak, bunları yeniden kodlamak, daha anlamlı adlar vermekti. Orijinal değişken adları, "aid2", "age" ve "male.is" olarak yeniden adlandırdığım "aid", "s1", "s2" gibi şeylerdir. Diğer veri kümelerinde, araştırmacının hedeflerinin ne olduğuna bağlı olarak birleştirilebilecek binlerce başka değişken vardır.
Değişkenleri yeniden adlandırdığım sürece, onları olabildiğince yararlı hale getirmek istiyorum. İşte düşündüğüm konulardan bazıları. Şimdiye kadar sadece küçük harf kullandım ve herhangi bir tire veya alt çizgi kullanmaktan kaçındım ve sadece belirli bir amaç için dönemler kullandım. Bu sadelik ve tutarlılık erdemine sahiptir ve çoğu değişken için sorun yaratmaz. Ama işler daha karmaşık hale geldikçe, tutarlılığımı kırmaya cazip geliyorum. Örneğin, değişkenim "talkprobmsum" olarak, "talkProbMSum" veya daha iyisi "talk.prob.m.sum" olarak okumak daha kolay olurdu, ancak kelimeleri ayırmak için büyük harf veya nokta kullanacaksam tüm değişkenler için yapmamalı mıyım?
Bazı değişkenler birden fazla kez kaydedilir, örneğin .is veya .ih gibi yarış değişkenleri okul içi veya ev içi anketten gelip gelmediklerini belirtmek için ekledim. Ama kesinlikle farkında olmadığım bazı tekrarlar var, her değişkenin adına veri kümesine bir referans eklemek daha iyi olur mu?
Bir çok değişkeni grup ortalamam ve standartlaştırmam gerekiyor, bunu yaptığım yol erkek ve okul tarafından z-skoru anlamına gelen .zms eklemektir.
Herhangi bir genel veya özel düşünce veya kaynak büyük beğeni topluyor. Bazı kodlarım ve değişken adlarının listesini içeren açıklayıcı istatistikler için bu veri havuzuna bakın . Kısaca bu kodu paylaşımı nedenini tarif burada ve biraz kamuoyuna burada , ama bu son iki bağlantılar değişken adlandırma kuralları konusuna gerçekten alakalı değildir. Eklendi: Yorumlarda açıkça görülen karışıklıklardan kaçınmak için bunu hafifçe düzenledim, çoğunlukla sadece bir paragrafı hareket ettirdim. Düşünceleriniz için teşekkürler!
2016/09/05 Eklendi: belirterek Onun değerinde Hadley Wickham'ın R Stil Kılavuzu'na ve Google'ın R Stil Kılavuzu'na ... Hadley diyor ki:
Değişken ve işlev adları küçük harf olmalıdır. Bir ad içindeki kelimeleri ayırmak için alt çizgi (_) kullanın.
Google diyor:
Tanımlayıcılarda alt çizgi (_) veya kısa çizgi (-) kullanmayın. Tanımlayıcılar aşağıdaki kurallara göre adlandırılmalıdır. Değişken adları için tercih edilen form, küçük harflerle ve noktalarla ayrılmış değişkenlerdir (değişken.adı), ancak değişkenAdı da kabul edilir; işlev adları başlangıçta büyük harf kullanır ve nokta içermez (İşlevAdı); sabitleri benzer işlevler olarak adlandırır, ancak bir başlangıç k ile.
R
değil, verileri belgelemek ve kullanmak için uygun uygulamalarla ilgili görünmektedir .