pyspark 安裝配置【linux && win】

來源:互聯網
上載者:User

標籤:代碼   解壓   simple   pypi   自己   bsp   安裝python   com   變數   

一、windows 安裝1、下載spark    spark-2.3.1-bin-hadoop2.7.tgz2、配置spark 環境變數set SPARK_HOME=d:\spark2.3.1set PATH=%SPARK_HOME%\bin;%PATH%3、安裝python的pyspark模組pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple/ 4、下載安裝hadoop 或者 組件1)下載hadoop軟體包,並配置環境變數set HADOOP_HOME=d:\hadoopset PATH=%HADOOP_HOME%\bin;%PATH%2)下載hadoop-common-2.2.0-bin-master.zip(自己百度) 並配置環境變數下載後是檔案名稱是hadoop-common-2.2.0-bin-master.zip,隨便解壓到一個目錄,設定HADOOP_HOME環境變數,指向 d:\hadoop (解壓後的下載檔案), 並將HADOOP_HOME加到系統變數PATH中set HADOOP_HOME=d:\hadoopset PATH=%HADOOP_HOME%\bin;%PATH%二、linux 環境1、下載spark    spark-2.3.1-bin-hadoop2.7.tgz    tar -zxvf  spark-2.3.1-bin-hadoop2.7.tgz2、配置spark 環境變數vi ~/.bash_profile#將以下代碼添加到檔案中export SPARK_HOME=/tools/spark2.3.1export PATH=$SPARK_HOME/bin:$PATHexport PYTHONPATH=$SPARK_HOME/python/:$PYTHONPATH 3、安裝python的pyspark模組   pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple/ 


注釋:
1、如果想在python項目中使用spark 功能,python開發環境除了安裝pyspark 模組外,還需要同時安裝spark軟體包才能正常使用。
2、linux 環境只需要安裝jdk、spark、pyspark(python模組)即可;windows 環境還需要額外安裝hadoop組件,否則運行報錯。

 

pyspark 安裝配置【linux && win】

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.