International - English

Cart Console

Topic Center

Contact Sales

首頁 > 雲端運算 > 雲資訊

[hadoop+spark+python]大資料實戰隨手筆記

最後更新：2017-08-10 來源：互聯網

上載者：User

關鍵字大資料 PYTHON Hadoop Spark

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

1.提交任務

指令(我配置了spark-submit的環境變數)

spark-submit --class org.apache.spark.examples.SparkPi --master spark://192.168.12.233:7077 --executor-memory 10G -- total-executor-cores 10 fielname

逐條解釋如下:

(1)–class org.apache.spark.examples.SparkPi

設置運行的環境,java或者yarn

(2)–master spark://192.168.12.233:7077

設置spark服務的位址,格式為 spark:// +

(3)–executor-memory 10G

分配記憶體,這個屬性每個worker都會分配10G,根據實際情況分配

(4)–total-executor-cores 10

分配運行cpu核數,不超過總核數即可

(5)fielname

要運行的檔,相對路徑或者絕對路徑都可以,如果是python檔一定要能在命令列環境運行,requirment和包環境都要滿足才行,我一般是把專案打包寫好setup.py先編譯一遍在運行主程式

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

相關關鍵詞：

基於資源編排和 Ansible 在 VPC 下快速交付套用 05-24

基於資源編排和 Ansible 在經典網路下快速交付套用 05-24

基於資源編排在經典網路環境下快速部署高可用Dubbox服務（Redis版） 05-24

基於資源編排在專有網路環境下快速部署高可用Dubbox服務（Redis版） 05-24

基於資源編排在專有網路環境下快速部署高可用Dubbox服務（ZooKeeper版） 05-24

利用ROS搭建套用基礎套件 05-24

聯繫我們

該頁面正文內容均來源於網絡整理，並不代表阿里雲官方的觀點，該頁面所提到的產品和服務也與阿里云無關，如果該頁面內容對您造成了困擾，歡迎寫郵件給我們，收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至： info-contact@alibabacloud.com 進行舉報並提供相關證據，工作人員會在 5 個工作天內聯絡您，一經查實，本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

[hadoop+spark+python]大資料實戰隨手筆記

聯繫我們

熱門文章

推薦話題

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support