Tweet'leri içeren bir metin dosyasına sahibim ve bir kelimenin tweet'te kaç kez bulunduğunu saymam gerekiyor. Örneğin, dosya şunları içerir:
Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
Ve diyelim ki, iPhone kelimesinin dosyada kaç kez geçtiğini saymak istiyorum. İşte denedim.
cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
kesinlikle çalışıyor ama unix'deki 'wc' komutu konusunda kafam karıştı. Gibi bir şey denersem fark nedir:
cut -f 1 Tweet_Data | grep -c "iPhone"
bunun yerine nerede -c kullanılıyor? Bunların her ikisi de tweet'lerle dolu büyük bir dosyada farklı sonuçlar veriyor ve nasıl çalıştığı konusunda kafam karıştı. Hangi yöntem, oluşumu saymanın doğru yoludur?
cut -f1
burada fazla iş yapamayan sekmelere göre kesim yapıyor. Bunun sanawc -l
gerçekten doğru sayıyı verdiğinden emin misin? Burada 2 gösterir, ancak "iPhone" un 3 örneğini sayarım.