Halka açık sosyal ağ veri kümeleri / API'leri


26

Herkese açık veri setleri listemizin bir uzantısı olarak , herkese açık sosyal ağ veri setleri / tarama API'leri listesinin olup olmadığını bilmek istiyorum. Veri kümesi / API'ye bir bağlantı ile birlikte, mevcut verilerin özellikleri eklenmişse çok iyi olurdu. Bu tür bilgiler bunlarla sınırlı olmamalıdır:

  • sosyal ağın adı;
  • ne tür kullanıcı bilgileri sağlıyor (mesajlar, profil, arkadaşlık ağı, ...);
  • Bir API üzerinden içeriğinin taranmasına izin verip vermeyeceği (ve oran: 10 / dak, 1k / ay, ...);
  • basitçe tüm veri kümesinin bir görüntüsünü sağlar.

Herhangi bir öneri ve eklenecek diğer özellikler çok açıktır.

Yanıtlar:


20

Sosyal ağlar API'leri hakkında birkaç kelime. Yaklaşık bir yıl önce araştırmacılar için popüler sosyal ağların API'lerinin bir incelemesini yazdım. Ne yazık ki, Rusça. İşte bir özeti:

Twitter ( https://dev.twitter.com/docs/api/1.1 )

  • tweet / metinler ve kullanıcılar hakkındaki hemen hemen tüm veriler mevcuttur;
  • sosyodemografik veri eksikliği;
  • harika akış API'si: gerçek zamanlı metin işleme için kullanışlıdır;
  • programlama dilleri için çok sayıda paketleyici;
  • ağ yapısının (bağlantılar) alınması mümkündür ancak zamanlıdır (1 dakikada 1 istek).

Facebook ( https://developers.facebook.com/docs/reference/api/ )

  • oran limitleri: saniyede yaklaşık 1 istek;
  • iyi belgelenmiş, sanal alan mevcut;
  • FQL (SQL benzeri) ve «normal Dinlenme» Graph API;
  • dostluk verileri ve sosyodemografik özellikler mevcut;
  • Çok fazla veri olay ufkunun ötesinde : sadece arkadaşların arkadaşlarının verileri ve arkadaşları 'az ya da çok tamamlandı; rastgele kullanıcılar hakkında neredeyse hiçbir şey araştırılamadı;
  • Bazı garip API hataları ve kimsenin umursamadığı gibi görünüyor (örneğin, FQL üzerinden kullanılabilen, ancak Graph API eşanlamlıları aracılığıyla olmayan bazı özellikler).

Instagram ( http://instagram.com/developer/ )

  • ücret limitleri: saatte 5000 talep;
  • gerçek zamanlı API (Twitter için Streaming API gibi ancak fotoğraflarla) - bağlantısı biraz zor: callback'ler kullanılır;
  • sosyodemografik veri eksikliği;
  • fotoğraflar, mevcut veriler filtreler;
  • Beklenmeyen kusurlar (örneğin, yazı / fotoğrafa sadece 150 yorum toplamak mümkündür).

Foursquare ( https://developer.foursquare.com/overview/ )

  • ücret limitleri: saatte 5000 talep;
  • jeososyal veri krallığı :)
  • gizlilik sorunları nedeniyle araştırmalardan oldukça uzak. Checkin verilerini toplamak için, bir seferde 4sq, bit.ly ve twitter API'leriyle çalışan birleşik ayrıştırıcı oluşturmanız gerekir;
  • tekrar: sosyodemografik veri eksikliği.

Google+ ( https://developers.google.com/+/api/latest/ )

  • saniyede yaklaşık 5 istek (doğrulamaya çalışın);
  • ana yöntemler: etkinlikler ve insanlar;
  • Facebook'ta olduğu gibi, rastgele kullanıcı için çok fazla kişisel veri gizlenir;
  • kullanıcı bağlantı verilerinin eksikliği.

Rekabet dışı: Rus okuyucular için sosyal ağları inceledim ve buradaki 1 numaralı ağ vk.com . Birçok dile çevrilmiş, ancak yalnızca Rusya ve diğer BDT ülkelerinde popüler. API dokümanları bağlantısı: http://vk.com/dev/ . Ve benim açımdan, homebrew sosyal medya araştırması için en iyi seçim. En azından Rusya'da. Bu yüzden:

  • fiyat limitleri: saniyede 3 istek;
  • kamuya açık metin ve medya verileri mevcut;
  • sosyodemografik veriler mevcuttur: rastgele kullanıcı kullanılabilirliği seviyesi için yaklaşık% 60-70;
  • kullanıcılar arasındaki bağlantılar da mevcuttur: rastgele kullanıcı için hemen hemen tüm dostluk verileri mevcuttur;
  • bazı özel yöntemler: örneğin, gerçek zamanlı olarak tam kullanıcı için çevrimiçi / çevrimdışı durumunu elde etmek için bir yöntem vardır ve biri onun kitlesi için program oluşturabilir.

1
Sırf muhteşem! Aslında bunun gibi bir çok cevabın içinde çözülmüş bir şey bekliyordum ve sen de hepsini aldın: D Cevap için teşekkürler. İyi iş! :)
Rubens

1
LinkedIn, YouTube, Secret kapsamını geride bıraktım. Belki başka bölgesel ağlar (QQ?). Ve onlar hakkında bilgi almaktan memnuniyet duyarız.
sobach

8

Bu başlı başına bir sosyal ağ değildir, ancak Stackexchange tüm veritabanı dökümü periyodik olarak yayınlar:

Hangi kullanıcıların birbirlerine sorduklarını ve cevapladıklarını analiz ederek bazı sosyal bilgileri çıkarabilirsiniz. Güzel bir şey, gönderiler etiketlendiğinden beri alt toplulukları kolayca analiz edebilmenizdir.


6

Kamuya açık sosyal ağ veri setlerinin iyi bir listesi Stanford Network Analysis Project web sitesinde bulunabilir:

SNAP veri kümeleri

Sitede internet sosyal ağ verileri (Facebook, Twitter, Google Plus), akademik dergiler için alıntı ağları, Amazon'dan ortak satın alma ağları ve diğer pek çok ağ türü bulunmaktadır. Yönlendirdiler, yönlendirilmediler ve iki taraflı grafikler oluşturdular ve tüm veri kümeleri sıkıştırılmış biçimde indirilebilen anlık görüntüler.


5

Almanya'dan bir örnek: Linkedin'e benzeyen ancak Almanca konuşulan ülkelerle sınırlı olan bir siteyi Xing.

Bu geliştirici merkezine bağlantı: https://dev.xing.com/overview

Erişim sağlar: Kullanıcı profilleri, Kullanıcılar arasındaki konuşmalar (kullanıcının kendisi ile sınırlı), İş ilanları, Rehber ve Rehber Rehber, şebekeden haberler ve bazı konum belirleme api.

Evet bir api var, ancak oranı hakkında bilgi bulamadım. Ama bana öyle geliyor ki, bazı bilgiler kullanıcının rızasıyla sınırlı.


4

Ağ Deposu ( http://networkrepository.com ) tonlarca sosyal ağa, web grafiğine, biyo ve beyin ağına, vb. Sahiptir. Hepsinden önemlisi, çeşitli sosyal ağları karşılaştırmak / keşfetmek için etkileşimli görsel analitik araçlara da sahiptir.


2

Bu tür bağlantıların küçük bir koleksiyonu burada bulunabilir . Birçoğu sosyal grafiklerdir.


Bu başvuru yazabilmek için çok teşekkür ederim ama sosyal ağ için bir genel kullanıma veri kümesi / API işaret etmek Yanıtları burada bekliyordum, andalso (örneğin kaynak tarafından indirme mesajların oranını veya tür bilgilerin ne ya sağlanır açıklayın kullanıcılar hakkında). Cevabınız olduğu gibi, sahip olduğumuz halka açık veri kümeleri listesine çok iyi gelecektir .
Rubens

0

Farklı sosyal medya platformlarındaki Tayca metin + duyarlılık etiketleri (olumlu, tarafsız, olumsuz).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.