İçe aktardığım tweetlerin bir kısmı okudukları yerde bu sorunu yaşıyor
b'I posted a new photo to Facebook'
Bunun bbir bayt olduğunu gösterir. Ancak bu sorunlu oluyor çünkü yazmakta olduğum CSV dosyalarımda, dosyalar bkaybolmuyor ve gelecekteki koda müdahale ediyor.
Bu böneki metin satırlarımdan kaldırmanın basit bir yolu var mı ?
Unutmayın, utf-8'de kodlanmış metinlere ihtiyacım var gibi görünüyor veya tweepy bunları web'den çekerken sorun yaşıyor.
İşte analiz ettiğim bağlantı içeriği:
https://www.dropbox.com/s/sjmsbuhrghj7abt/new_tweets.txt?dl=0
new_tweets = 'content in the link'
Kod Denemesi
outtweets = [[tweet.text.encode("utf-8").decode("utf-8")] for tweet in new_tweets]
print(outtweets)
Hata
UnicodeEncodeError Traceback (most recent call last)
<ipython-input-21-6019064596bf> in <module>()
1 for screen_name in user_list:
----> 2 get_all_tweets(screen_name,"instance file")
<ipython-input-19-e473b4771186> in get_all_tweets(screen_name, mode)
99 with open(os.path.join(save_location,'%s.instance' % screen_name), 'w') as f:
100 writer = csv.writer(f)
--> 101 writer.writerows(outtweets)
102 else:
103 with open(os.path.join(save_location,'%s.csv' % screen_name), 'w') as f:
C:\Users\Stan Shunpike\Anaconda3\lib\encodings\cp1252.py in encode(self, input, final)
17 class IncrementalEncoder(codecs.IncrementalEncoder):
18 def encode(self, input, final=False):
---> 19 return codecs.charmap_encode(input,self.errors,encoding_table)[0]
20
21 class IncrementalDecoder(codecs.IncrementalDecoder):
UnicodeEncodeError: 'charmap' codec can't encode characters in position 64-65: character maps to <undefined>