Kıvılcım kümesindeki her bir düğüm için C derlenmiş modülleri (örneğin, python-Levenshtein) nasıl gönderebilirim? pyshon modüllerini pyspark'ta diğer düğümlere gönderiyor musunuz?
from pyspark import SparkContext
sc = SparkContext("local", "App Name", pyFiles=['MyFile.py', 'MyOtherFile.py'])
ama orada durumlarda
'.py' nasıl modül gemi mi hayır: Ben tek başına bir python komut dosyası (aşağıda örnek kod) kullanılarak kıvılcımla piton dosyalarını yollayabilirsiniz biliyoruz?
Bu işe yaradı! Yukarıdaki komutu kullanarak modül için yumurta dosyasını oluşturabildim ve işlem, pyFiles parametresinde yumurta dosyasını eklemek kadar kolaydı. Güzel şeyler! – mgoldwasser
PySpark'ı .egg bağımlılıklarını yüklemek için herhangi bir öneriniz var mı? * .egg dosyam diğer 3. parti kitaplıklarına bağlıysa, http://stackoverflow.com/questions/32119225/databricks-spark-egg-dependencies-not-installed-automatically – ramhiser
benzer şekilde, bu da işe yarayacak mı? – guilhermecgs