GH geliştirme yöneticisinden Spark 1.4'ü oluşturdum ve yapı iyi gitti. Ama yaptığım zaman bin/pyspark
Python 2.7.9 sürümünü alıyorum. Bunu nasıl değiştirebilirim?
GH geliştirme yöneticisinden Spark 1.4'ü oluşturdum ve yapı iyi gitti. Ama yaptığım zaman bin/pyspark
Python 2.7.9 sürümünü alıyorum. Bunu nasıl değiştirebilirim?
Yanıtlar:
Sadece ortam değişkenini ayarlayın:
export PYSPARK_PYTHON=python3
bunun kalıcı bir değişiklik olmasını istiyorsanız bu satırı pyspark betiğine ekleyin.
export PYSPARK_PYTHON=python3.5
Python 3.5 için
$SPARK_HOME/conf/spark-env.sh
böylece spark-submit
aynı tercümanı da kullanır.
PYSPARK_PYTHON=python3
./bin/pyspark
IPython Not Defterinde çalıştırmak istiyorsanız şunu yazın:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
Eğer python3
erişilebilir değil, bunun yerine kendisine yolunu geçmesi gerekiyor.
Aklınızda bulundurun (1.4.1 gibi) güncel belgeler outdate talimatlar bulunur. Neyse ki yamalandı .
Dosyaya bir göz atın. Shebang satırı, muhtemelen ilk uyumlu çalıştırılabilir dosyanın yolunu arayan 'env' ikilisine işaret edilmiştir.
Python'u python3 olarak değiştirebilirsiniz. Env'yi doğrudan kodlanmış python3 ikilisini kullanmak için değiştirin. Veya ikiliyi doğrudan python3 ile çalıştırın ve shebang satırını atlayın.
PYSPARK_PYTHON
Ortam değişkenini ayarlamanız gerekiyor .
Jupyter Notebook için, spark-env.sh
dosyayı komut satırından aşağıda gösterildiği gibi düzenleyin
$ vi $SPARK_HOME/conf/spark-env.sh
Dosyanın altına gidin ve bu satırları kopyalayıp yapıştırın
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Ardından, not defterinde pyspark'ı başlatmak için aşağıdaki komutu çalıştırın
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
bu durumda IPython 3 dizüstü bilgisayarı çalıştırır.