DynamoDB tablosuna ürün yazmak için bir program yazdım. Şimdi PySpark kullanarak DynamoDB tablosundaki tüm öğeleri okumak istiyorum. Spark'de bunu yapmak için herhangi bir kütüphane var mı?Tüm öğeleri Python kullanarak bir tablodan yüklemek için Spark programından DynamoDB'ye bağlanma?
8
A
cevap
1
Sen boto3 aracılığıyla DynamoDB API parçası ve PySpark için yazılmış paralel S3 dosya işleme uygulaması gibi bir şeması olarak kullanılabilir parallel scans kullanabilirsiniz here tanımladı. Temel olarak, tüm anahtarları a-priori okumak yerine, Spark için map_func
işlevinde tarama için maksimum parça segmenti ve segment numarası ve sabit kod listesi oluşturun.
İlgili konular
- 1. Bir python projesinde tüm bağımlılıkları yüklemek için needs.txt nasıl kullanılır
- 2. Python kullanarak Apache Spark TFIDF
- 3. Linq veya lambda kullanarak X rasgele öğeleri tablodan alın C#
- 4. Oracle'a py2exe'd programından bağlanma hatası: Oracle ortam tanıtıcısı alınamadı
- 5. Python programından nasıl sinyal gönderebilirim?
- 6. Python tkinter - tüm alt öğeleri nasıl silebilirim?
- 7. Öğeleri python
- 8. Python 3 - JDBC ile bağlanma
- 9. Tüm tablodan alın VE sıralama?
- 10. Tüm Spark SQL DataType
- 11. Groovy'yi kullanarak listedeki tüm öğeleri nasıl düzeltebilirim?
- 12. Tablodan tüm kayıtları al - EclipseLink
- 13. url'yi kullanarak postgresql'e bağlanma
- 14. SQLAlchemy kullanarak veritabanına bağlanma
- 15. Tüm TabItems'i yüklemek için Force TabControl
- 16. Ortaya çıkan RDD, Spark python
- 17. PyCharm, bir Python modülünü yüklemek için doğru pipet verisini bulamıyor?
- 18. Python: Bir tablodan veri almak için XPath kullanma
- 19. netlik kullanarak bir sqlite db'ye bağlanma
- 20. Jquery, tüm öğeleri
- 21. Tüm öğeleri, sınıf özniteliği
- 22. Java'da JTA'yı kullanarak SSH'ye bağlanma
- 23. Bir dizenin tüm öğeleri için dizelerin bir listesini arama
- 24. Spark kullanarak HiveContext
- 25. Tüm Öğeleri ComboBox'tan Kaldırma?
- 26. MySQLI bağlanma paramlarını kullanarak call_user_func_array
- 27. JDBC/c3p0 kullanarak MariaDB'ye bağlanma
- 28. Python parçacığı öğeleri koleksiyona biriktirmek için
- 29. Ruby kullanarak Oracle DB'ye bağlanma
- 30. Spark 1.2.0 içindeki tüm Spark uygulayıcılarının sınıf yollarına yapılandırma dosyası nasıl eklenir?
Bunu yapabiliyor musunuz? – rabz100
Hayır, sadece boto belgelerinin kıvılcım olmadan ne yaptığını kullandım. –
Bu kodu düzeltmeyi denerdim - https://github.com/bchew/dynamodump –