GH geliştirme yöneticisinden Spark 1.4'ü oluşturdum ve yapı iyi gitti. Ama yaptığım zaman bin/pysparkPython 2.7.9 sürümünü alıyorum. Bunu nasıl değiştirebilirim?
GH geliştirme yöneticisinden Spark 1.4'ü oluşturdum ve yapı iyi gitti. Ama yaptığım zaman bin/pysparkPython 2.7.9 sürümünü alıyorum. Bunu nasıl değiştirebilirim?
Yanıtlar:
Sadece ortam değişkenini ayarlayın:
export PYSPARK_PYTHON=python3
bunun kalıcı bir değişiklik olmasını istiyorsanız bu satırı pyspark betiğine ekleyin.
export PYSPARK_PYTHON=python3.5Python 3.5 için
$SPARK_HOME/conf/spark-env.shböylece spark-submitaynı tercümanı da kullanır.
PYSPARK_PYTHON=python3
./bin/pyspark
IPython Not Defterinde çalıştırmak istiyorsanız şunu yazın:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
Eğer python3erişilebilir değil, bunun yerine kendisine yolunu geçmesi gerekiyor.
Aklınızda bulundurun (1.4.1 gibi) güncel belgeler outdate talimatlar bulunur. Neyse ki yamalandı .
Dosyaya bir göz atın. Shebang satırı, muhtemelen ilk uyumlu çalıştırılabilir dosyanın yolunu arayan 'env' ikilisine işaret edilmiştir.
Python'u python3 olarak değiştirebilirsiniz. Env'yi doğrudan kodlanmış python3 ikilisini kullanmak için değiştirin. Veya ikiliyi doğrudan python3 ile çalıştırın ve shebang satırını atlayın.
PYSPARK_PYTHONOrtam değişkenini ayarlamanız gerekiyor .
Jupyter Notebook için, spark-env.shdosyayı komut satırından aşağıda gösterildiği gibi düzenleyin
$ vi $SPARK_HOME/conf/spark-env.sh
Dosyanın altına gidin ve bu satırları kopyalayıp yapıştırın
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Ardından, not defterinde pyspark'ı başlatmak için aşağıdaki komutu çalıştırın
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pysparkbu durumda IPython 3 dizüstü bilgisayarı çalıştırır.