DÜZENLEME
orijinal cevap hala çalışır, ancak hantal ve biz değişkenlerin inşa PySpark kullandığı günümüzde aşağıdaki yöntemi kullanmalısınız:
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Sonra sizin gibi doğrudan PySpark çalıştırmak normalde, ancak yukarıdaki değişkenler ile bir kabuktan ziyade jupyter defterini başlatır:
Yeni bir not defteri başlatırsanız Spark'u sizin için kurmuş olursunuz. ipython profile create pyspark
kullanarak bir profil oluşturmak Hala aynı başlangıç adımlarla şeyleri ayarlayabilirsiniz
export PYSPARK_DRIVER_PYTHON_OPTS="notebook --ip='*' --no-browser"
ORİJİNAL CEVAP yani: Eğer çevreyi eşleştirmek istiyorsanız gibi Juopyter için başka seçenekler ekleyebilir ve başlangıç komut dosyasını $(ipython profile locate pyspark)/startup/
'a yerleştirin.
Sonraki, Jupyter not defterlerinde kullanılabilir hale getirmek için, $(ipython locate)/kernels/pyspark/kernel.json
dosya oluşturarak o profili kullanan bir çekirdek belirtmeniz gerekir. Önemli Bit argv
bölümünde ise
{
"display_name": "PySpark",
"language": "python",
"argv": [
"python",
"-m", "ipykernel",
"--profile=pyspark",
"-f", "{connection_file}"
],
"env": {
"PYSPARK_SUBMIT_ARGS": " --master spark://localhost:7077 --conf spark.driver.memory=20000m --conf spark.executor.memory=20000m"
}
}
: Bu gibi benim bir şey. env
bölümdeki bilgiler başlangıç komut tarafından alınır kullandığım:
import os
import sys
spark_home = '/opt/spark/'
os.environ["SPARK_HOME"] = spark_home
sys.path.insert(0, spark_home + "/python")
sys.path.insert(0, os.path.join(spark_home, 'python/lib/py4j-0.9-src.zip'))
pyspark_submit_args = os.environ.get("PYSPARK_SUBMIT_ARGS", "")
pyspark_submit_args += " pyspark-shell"
os.environ["PYSPARK_SUBMIT_ARGS"] = pyspark_submit_args
filename = os.path.join(spark_home, 'python/pyspark/shell.py')
exec(compile(open(filename, "rb").read(), filename, 'exec'))
bunu sadece artı çekirdekte tanımlanan argümanlar, ve ekleme Bağlı birine oldukça benzer görebileceğiniz gibi PySpark'ın en son sürümünde ihtiyaç duyulan pyspark-shell
argümanı.
Hamsin bu, sen jupyter notebook
işletilen bir tarayıcıda ana sayfa açmak ve şimdi bu yeni çekirdek kullanan defterleri oluşturabilir edebilirsiniz: İstediğiniz gibi
Sesler [Apache Toree] (https://github.com/apache/incubator-toree). Yine de, kurulum için biraz çaba gerektirir. –