Büyük bir veri çerçevesinin tüm çıktısını görüntülemek için hiçbir neden yoktur. Büyük veri karelerini görüntülemek veya değiştirmek gereksiz yere büyük miktarda bilgisayar kaynağı kullanır.
Yaptığınız her şey minyatür olarak yapılabilir. Veri çerçevesi küçük olduğunda verileri kodlamak ve değiştirmek üzerinde çalışmak çok daha kolaydır. Büyük verilerle çalışmanın en iyi yolu, büyük veri çerçevesinin yalnızca küçük bir kısmını veya küçük bir örneğini alan yeni bir veri çerçevesi oluşturmaktır. Daha sonra verileri keşfedebilir ve kodunuzu daha küçük veri çerçevesinde yapabilirsiniz. Verileri keşfettikten ve kodunuzu çalıştırdıktan sonra, daha büyük veri çerçevesinde bu kodu kullanın.
En kolay yol, head () işlevini kullanarak veri çerçevesindeki ilk n, ilk satır sayısını almaktır. Kafa işlevi yalnızca n, satır sayısını yazdırır. Büyük veri çerçevesindeki başlık işlevini kullanarak mini bir veri çerçevesi oluşturabilirsiniz. Aşağıda ilk 50 satırı seçip değerlerini small_df dosyasına aktarmayı seçtim. Bu, BigData'nın bu proje için açtığınız bir kitaplıktan gelen bir veri dosyası olduğunu varsayar.
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
Bu çoğu zaman işe yarayacaktır, ancak bazen büyük veri çerçevesi raporlanan değişkenlerle veya önceden gruplandırılmış değişkenlerle birlikte gelir. Büyük veriler böyle ise, büyük verilerden rastgele bir örnek almanız gerekir. Ardından aşağıdaki kodu kullanın:
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df