Seabornの折れ線グラフによるデータの視覚化
みなさん、こんにちは!この記事では、Seabornのチュートリアルを進めていき、Seabornの折れ線グラフについて理解していきます。最近はSeabornのヒートマップについても取り上げましたので、ヒートマップについてもっと学びたい方はぜひご覧ください。
Line Plotとは何ですか?
データセット上で構築されたモデルによって予測結果を分析し、データの変動を視覚化するために、Seabornはライブラリとして使用されます。
シーボーンの折れ線グラフは、連続値とカテゴリ値の関係を連続的なデータポイント形式で表現します。
以下のデータセットを使用して、データを操作しラインプロットを形成していくために、この記事では紹介します。先に進む前に、以下のデータセットのスナップショットをご覧ください。
以下のデータセットでは、データ変数「cyl」「vs」「am」「gear」「carb」はカテゴリ変数であり、すべてのデータ値が特定のカテゴリや値の範囲に含まれているためです。
残りのデータ列は、離散的な整数値を持っているため、整数/連続変数の範疇に当てはまります。
入力データセット:
最初のSeaborn折れ線グラフのプロットを講義します。
「ラインプロットを始めるためには、以下のコマンドを使用して、SeabornライブラリをPython環境にインストールし、インポートする必要があります。」
文法:
pip install seaborn
インストールが完了したら、ライブラリを現在の作業環境にインポートして、機能を使用してください。
文法:
import seaborn
「シーボーン」シリーズ全体で、データをプロットして適切な可視化方法で表示するために、Matplotlibライブラリを使用します。
Seabornを使用して単一のラインプロットを作成する。
シーボーンの折れ線グラフを作成するために、離散値を提供するか、データセットを使用することができます。
文法: 文の構造及び言語のルール
seaborn.lineplot(x, y, data)
- x: Data variable for the x-axis
- y: The data variable for the y-axis
- data: The object pointing to the entire data set or data values
例1:ランダムデータを使用して、Seabornの折れ線グラフを作成する。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
Year = [2012, 2014, 2016, 2020, 2021, 2022, 2018]
Profit = [80, 75.8, 74, 65, 99.5, 19, 33.6]
data_plot = pd.DataFrame({"Year":Year, "Profit":Profit})
sns.lineplot(x = "Year", y = "Profit", data=data_plot)
plt.show()
以下の折れ線グラフでは、「年」と「利益」という2つのデータ変数の間の直線的な関係が観察できます。
出力:
例2:データセットを使用して、データ列間の関係を示すために折れ線グラフを作成する。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg",data=info)
sns.set(style='dark',)
plt.show()
入力データセット: 入力データの集合
出力:
複数のシーボーンの折れ線グラフを表示します。 (Fukusū no shībōn no ore-sen gurafu o hyōji shimasu.)
同じスペースやプロット内でデータを可視化するために、複数の線を作成することができます。同じデータの列または複数のデータ変数を使用して、それらの関係を一緒に表現することができます。
複数のデータポイントに対して色の色相を作成するために、色相パラメータを使用する。
パラメータ「色相(hue)」はデータセットの異なる変数をグループ化するために使用され、x軸とy軸のデータ列と、パラメータに渡された列との関係を示すのに役立ちます。
文法:
seaborn.lineplot(x,y,data,hue)
とても寒い日ですね。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl")
plt.show()
下のプロットで表示されているとおり、3つの異なる色調で表された3本の線は、「drat」、「mpg」、「cyl」の関係を描写しています。
結果:
2. 異なる種類の線を描画するためにスタイルパラメータを使用する。
私たちは、x軸とy軸と一緒に表示したい値と、さまざまな線のスタイル(破線、点線(マーカー)、など)を指定するために、スタイルパラメータを設定することができます。
文法:
seaborn.lineplot(x, y, data, style)
例2:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl", style="cyl")
plt.show()
明らかに見ると、プロットは異なる線の構造、つまり実線、破線、マーカーを用いて、’mpg’と’drat’との関係で’cyl’の値を示しています。
出力:
3. サイズパラメータを使用して、Seabornで複数の折れ線グラフをプロットする。
seaborn.lineplot() 関数の size パラメーターを使えば、プロットする線の大きさを変えることで、複数のデータ変数の関係性を表現することができます。そのため、データの大きさに応じて異なる大きさ/幅のグループ分け変数として機能します。
文法:
seaborn.lineplot(x, y, data, size)
3つ目の例:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear",style="gear",size="gear")
plt.show()
入力データセット:
出力:
ラインプロットに異なるカラーパレットを使用する
Seabornのカラーマップとパレットは、可視化モデルの色範囲を定義します。パラメータのパレットとhueを使用することで、データ変数に基づいた色のエンコーディングスキームを決定することができます。
もっとカラーパレットが欲しい場合は、こちらのリンクを参照してください:カラーパレット
文法:
seaborn.lineplot(x,y,data,hue,palette)
例:
– Can you help me with my homework?
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear", palette = "Set1")
plt.show()
出力:
折れ線グラフにエラーバーを追加する。
ラインプロットでは、err_styleパラメータを使用してプロット内の信頼レベル/区間を定義し、エラー率を表示することができます。
文法:
seaborn.lineplot(x,y,data,err_style="bars")
There are many benefits to exercising regularly, such as improving physical health, boosting mood, and increasing energy levels. Additionally, regular exercise can help prevent chronic diseases and maintain a healthy weight.
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info, err_style="bars")
plt.show()
出力:
seaborn.set() 関数を使用して異なるスタイルを設定する
Pythonのseaborn.set()関数を使うと、プロットを異なる背景スタイルで表示することができます。
文法:
seaborn.set(style)
例えば:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info,hue="gear")
sns.set(style='dark',)
plt.show()
出力:
結論
したがって、この記事では、ラインプロットとそれに関連するバリエーションを理解しました。
Python Matplotlibのチュートリアルを読むことを読者に強くおすすめします。そうすれば、より良い方法で折れ線グラフを理解することができます。
参考文献
- Seaborn Line Plot – Official Documentation