Üç farklı haber yayınının farklı konuları nasıl kapsadığını görsel olarak karşılaştırmaya çalışıyorum (bir LDA konu modeli ile belirlenir). Bunu yapmak için iki yöntemim var, ancak meslektaşlardan bunun çok sezgisel olmadığı konusunda çok sayıda geri bildirim aldım. Birisinin bunu görselleştirmek için daha iyi bir fikri olduğunu umuyorum.
İlk grafikte, her yayındaki her konunun oranlarını şu şekilde gösterdim:
Bu, konuştuğum neredeyse herkes için oldukça basit ve sezgisel. Ancak yayınlar arasındaki farkları görmek zor. Hangi gazete hangi konuyu daha fazla ele alıyor?
Bunu elde etmek için, en yüksek ve en yüksek ikinci konuya sahip yayın arasındaki farkı, en yüksek yayınla renklendirdim. Bunun gibi:
Örneğin, futbol için büyük bar, gerçekten Ahram İngilizce ve Daily News Egypt (futbol kapsamında 2 numara) arasındaki mesafedir ve Al-Ahram # 1 olduğu için kırmızı renktedir. Benzer şekilde, denemeler yeşil çünkü Mısır Bağımsız en yüksek orana sahip ve bar boyutu Mısır Bağımsız ve Daily News Mısır (yine # 2) arasındaki mesafedir.
İki paragrafın hepsinin, grafiğin kendi kendine yeterlilik testini geçemediğinden oldukça emin bir işaret olduğunu açıklamam gerekiyor. Sadece ona bakarak gerçekten neler olduğunu anlatmak zor.
Her bir konu için baskın yayının nasıl daha sezgisel bir şekilde vurgulanacağı hakkında genel bir öneriniz var mı?
Düzenleme: Oynatılacak veriler: Burada dput
R'nin yanı sıra bir CSV dosyası çıktısı var .
Düzenleme 2: İşte noktaların çapları, korpustaki konunun oranına (konuların başlangıçta nasıl sıralandığı) orantılı olarak orantılı olan bir ön nokta çizimidir. Yine de biraz daha ince ayar yapmam gerekse de, daha önce yaptığımdan çok daha sezgisel geliyor. Herkese teşekkürler!