Python資料分析以及可視化

來源:互聯網
上載者:User

標籤:each   dia   parallel   種類   屬性   sns   str   分析   ==   

引入網址:https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations/notebook

 

import matplotlib.pyplot as plt

import seaborn as sns

import pandas as pd

匯入資料:

iris=pd.read_csv(‘E:\\data\\Iris.csv‘)

iris.head()

 


作長條圖:

plt.hist(iris[‘SepalLengthCm‘],bins=15)

plt.xlabel(‘SepalLengthCm‘)

plt.ylabel(‘quantity‘)

plt.title(‘distribution of SepalLengthCm‘)

plt.show()



作散佈圖:


但是這樣的圖並沒有將其中的不同種類話=花的顏色標明出來。所以我們使用另一種方式,通過Species來分類

 

小提琴圖

箱型圖:

ax=sns.boxplot(x="Species",y="SepalWidthCm",data=iris)


這裡使用jitter=True使得所有點不全落在中間的這條垂直線上

ax=sns.boxplot(x="Species",y="SepalWidthCm",data=iris)

ax=sns.stripplot(x="Species",y="SepalWidthCm",data=iris,jitter=True,edgecolor="gray")



kdeplot:單變數之間的聯絡,並通過一個核密度評估變數潛在的特徵



顯示兩個變數之間的聯絡:



通過diag_kind=‘kde‘顯示雙變數間的核密度並用其估計其特徵



boxplot_1:通過Species將變數間的各個特徵分離出來



Andrews curves:安德魯曲線使用樣本的屬性作為傅裡葉變換的係數

 



Radviz:多變數可視化,每一個特徵都在一個平面上顯示出來,樣本通過圈上的點與之像聯絡起來


parallel_coordinates通過平行座標進行多變數可視化:對於資料樣本的每一個特徵,我們通過在座標軸上設定特徵並通過畫線的方式來進行設定

Python資料分析以及可視化

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.