Ben aynı sorun var tek başına kıvılcım içinde pencerelerden . Düzeltme sürümüm şöyle: Ortam değişkenlerimi aşağıdaki gibi ayarladım
PYSPARK_SUBMIT_ARGS="pyspark-shell"
PYSPARK_DRIVER_PYTHON=jupyter
PYSPARK_DRIVER_PYTHON_OPTS='notebook' pyspark
Bu ayarla pyspark'ta bir Eylem gerçekleştirdim ve aşağıdaki istisnayı aldım:
Python in worker has different version 3.6 than that in driver 3.5, PySpark cannot run with different minor versions.
Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.
Spark- worker'in hangi python sürümünü kullandığını kontrol etmek için cmd komut isteminde aşağıdakileri tıklayın .
python --version
Python 3.6.3
bu bana Python 3.6.3'ü gösterdi . Yani açıkça kıvılcım işçi v3.6.3 olan system python kullanıyor.
Şimdi, kıvılcım sürücümü Jupyter'ı çalıştıracak şekilde ayarladığımda, PYSPARK_DRIVER_PYTHON=jupyter
jupyter'ın kullandığı python sürümünü kontrol etmem gerekiyor.
Bunu yapmak için Anaconda İstemini açın ve
python --version
Python 3.5.X :: Anaconda, Inc.
İşte jupyter piton kullanıyor var v3.5.x . Bu sürümü herhangi bir Defterde de kontrol edebilirsiniz (Yardım-> Hakkında).
Şimdi sürüm jupyter piton güncellemeniz gerekir v3.6.6 . Bunu yapmak için Anaconda İstemi'ni açın ve
conda search python
Bu size Anaconda'daki mevcut python sürümlerinin bir listesini verecektir. İstediğinizi ile yükleyin
conda install python = 3.6.3
Şimdi aynı sürüm 3.6.3'ün her iki Python kurulumuna sahibim. Spark uyumlu olmamalı ve Spark-sürücüsünde bir Action çalıştırdığımda olmadı. İstisna ortadan kalktı. Mutlu kodlamalar ...