RでCSVファイルをデータフレームに読み込む
Rの特定の機能の助けを借りて、CSVファイルをデータフレームに読み込むことははるかに簡単になります。
CSVファイルは何ですか? (CSVふぁいるはなんですか?)
CSVはComma, Separated, Valuesの略であります。このファイルでは、格納されている値はカンマで区切られます。このデータの格納プロセスは非常に簡単です。
なぜCSVがデータ保存に最も使用されるファイル形式なのか?
多くの企業では、データをエクセルシートに保存することが一般的な方法です。ほとんどの企業では、通常のスプレッドシート作成よりも容易なプロセスであるコンマ区切り値(CSV)としてデータを保存しています。後でデータをRの組み込みパッケージで読み込み、分析することができます。
Rは最も人気で強力な統計分析のプログラミング言語であり、CSVファイルから整理されたデータフレームにデータを読み込むための特定の機能を提供しています。
CSVファイルをデータフレームに読み込む。
短い例を見てみましょう。CSVファイルを整理されたデータフレームに読み込む方法をご紹介します。
このプロセスの最初のステップは、作業ディレクトリを取得して設定することです。CSVファイルの作業パスを選択する必要があります。
1. 作業ディレクトリを設定する
ここでは、getwd()関数を使用してデフォルトの作業ディレクトリを確認することができ、setwd()関数を使用してディレクトリを変更することもできます。
>getwd() #Shows the default working directory
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") #to set the new working Directory
> getwd() #you can see the updated working directory
---> "C:/Users/Dell/Documents/R-test data"
2. データセット/CSVファイルの取り込みと読み込み
労働パスの設定後、以下に示すデータセットまたはCSVファイルをインポートする必要があります。
> readfile <- read.csv("testdata.txt")
Rスタジオで上記のコードを実行して、以下に示すデータフレームを取得してください。
変数「readfile」のクラスをチェックするために、以下のコードを実行してください。
> class(readfile)
---> "data.frame"
上記の画像では、学生の名前、ID、学部、性別、成績などが含まれているデータフレームが表示されています。
3.CSVファイルから生徒の情報を抽出する。
データフレームを取得した後、データを分析することができます。データフレームから特定の情報を抽出することもできます。
学生が取得した最高得点を抽出するために。
>marks <- max(data$Marks.Scored) #this will give you the highest marks
#To extract the details of a student who scored the highest marks,
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) #This will
extract the details of the student who secured highest marks
> View(retval)
「化学」学科に在籍している学生の詳細を抽出するために、以下のように言い換えます。
「『化学』学科に在籍している学生の詳細を抽出するため」
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") # This will extract the student details who are in Biochemistry department
> View(retval)
結論
このプロセスを使って、read.csv(“ ”)関数を使ってRでcsvファイルを読むことができます。このチュートリアルでは、csvファイルのインポート方法、csvファイルの読み込み、データフレームから特定の情報を抽出する方法をカバーしています。
このプロジェクトでは、Rスタジオを使用しました。Rスタジオには、コンソール、エディタ、および環境など、素晴らしい機能があります。とにかく、Thinn-RやCrimsonエディタなど、他のエディタも自由に使用してください。このチュートリアルが、RでCSVファイルの読み取りとデータフレームからの情報の抽出の理解に役立つことを願っています。
さらに詳しくは、こちらをご覧ください:https://cran.r-project.org/manuals.html