Büyük ve büyük miktarlarda Twitter verilerinin silinmesi gereken bir python projesi yapıyorum. 1 milyon kullanıcı gibi bir şey ve tüm tweet'lerinin kazınması gerekiyor.Büyük miktarda tweet kazıma nasıl yapılır
Daha önce Tweepy ve Twython kullandım, ancak Twitter sınırına çok hızlı girdim.
Duyarlılık analizi şirketleri vb. Verilerini nasıl alır? Tüm bu tweetleri nasıl alırlar? Bunu bir yerde mi satın alıyorsunuz yoksa farklı proxy'ler veya benzeri şeylerle yinelenen bir şeyler mi yapıyorsunuz?
Infochimps gibi firmalar Trst rank ile nasıl bütün verileri alır? * http://www.infochimps.com/datasets/twitter-census-trst-rank
Sınırı çok hızlı bir şekilde vurursanız, çalışmanızı birçok güne dağıtmanız ve veritabanınızı daha yavaş bir şekilde oluşturmanız gerekir. Sanırım şirketler böyle yapıyor. – heltonbiker