RでGoogle Sheetsを読む(簡単な方法)
もし私があなたに質問をするとしたら、「スプレッドシートを使っていますか?」という質問に対して、すぐにはっきりとしたYESが返ってくるでしょう。それは、スプレッドシートが日常のビジネス操作でどれだけ人気があり役に立つものであるかを示しています。もしアナリストであるなら、スプレッドシートは非常に重要な存在です。おそらく、仕事でExcelとGoogleスプレッドシートの両方を使ったことがあるでしょう。RにはExcelシートを読み込むことができるかもしれませんが、あなたはGoogleスプレッドシートをRで読み込むことを考えたことがありますか?もしそうでなければ、一度試してみる価値があります。
Googleシートを始めよう
Googleスプレッドシートを聞いたことがありますね。Excelのようなものです。異なる種類のデータを整理、編集、分析することができます。ただし、Excelとは異なり、GoogleスプレッドシートはWebベースのスプレッドシートプログラムであり、共同作業を推奨しています。
あなたのGoogleアカウント、Googleドライブ、およびGoogleドキュメントやスライドなどの関連サービスと自動的に同期されます。Googleシートでは、毎回保存する必要はありません。各操作後にシートが更新されるオートセーブ機能が提供されています。かっこいいでしょう?
インターフェースについて話すとき、Googleシートは適度な変更を加えながらExcelに続くでしょう。シートを共有して協力することも自由です。ほとんどの場合、複数の人がリアルタイムでシート上で作業できるため、私たちの生活を簡単にします。
「Googleシートに関する情報は十分だと思いますので、新たな楽しいことに飛び込みましょう!」
RでGoogleシートを読む
「googlesheets4」というパッケージを使用してRでGoogleスプレッドシートのデータを読むことができます。このパッケージを使用すると、Rを使ってスプレッドシートにアクセスすることができます。
最初に、Rで「googlesheets4」というパッケージをインストールする必要があります。次に、ライブラリを読み込んで、さらに進む必要があります。
#Install the required package
install.packages('googlesheets4')
#Load the required library
library(googlesheets4)
それは良いですね。私たちの「googlesheets4」ライブラリは、Googleシートからデータを取得する準備が整いました。
1. 認証を設定する
Googleシートからデータを直ちに読み取ることはできません。Googleシートはウェブベースのスプレッドシートであり、それらはあなたのGoogleメールと関連付けられます。ですので、RがGoogleシートにアクセスできるように許可する必要があります。
Rにデータを読み込むには、read.csvやread.tableのような関数を使用しました。しかし、ここではファイルの種類を明示する必要はありません。ブラウザからGoogle Sheetsのリンクをコピーしてここに貼り付け、コードを実行するだけです。
以下のコードを実行すると、さらなる処理のためのインターフェースが表示されます。
#Read google sheets data into R
x <- read_sheet('https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit?usp=sharing')
Is it OK to cache OAuth access credentials in the folder
1: Yes
2: No
承認プロセスを続行するには、オプション1:「はい」を選択する必要があります。
最初のステップとして、複数のGアカウントがログインされている場合は、以下に示すようにアカウントを継続するかどうかを確認します。
- You have to select your account to authorise R to access the G sheets. This process is followed by multiple authorizations. You have to allow R to in all those steps.
- In the below picture, you will be shown the permissions you are giving to the Tidyverse API. Click “Allow” and you are done.
- After the successful authorization, you can see the completion message.
- After this, you will see a successful authorization message in the R studio as shown below.
2. Rにデータを読み込む。
承認プロセスが完了して順調に進んだのは素晴らしいですね。では、Google SheetsからRにデータを読み込む方法を見てみましょう。
#Reads data into R
df <- read_sheet('https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit?usp=sharing')
#Prints the data
df
# A tibble: 1,000 x 20
months_loan_dura~ credit_history purpose amount savings_balance employment_leng~
<chr> <dbl> <chr> <chr> <dbl> <chr>
1 < 0 DM 6 critic~ radio~ 1169 unknown
2 1 - 200 DM 48 repaid radio~ 5951 < 100 DM
3 unknown 12 critic~ educa~ 2096 < 100 DM
4 < 0 DM 42 repaid furni~ 7882 < 100 DM
5 < 0 DM 24 delayed car (~ 4870 < 100 DM
6 unknown 36 repaid educa~ 9055 unknown
7 unknown 24 repaid furni~ 2835 501 - 1000 DM
8 1 - 200 DM 36 repaid car (~ 6948 < 100 DM
9 unknown 12 repaid radio~ 3059 > 1000 DM
10 1 - 200 DM 30 critic~ car (~ 5234 < 100 DM
# ... with 990 more rows, and 14 more variables: installment_rate <chr>,
# personal_status <dbl>, other_debtors <chr>, residence_history <chr>,
# property <dbl>, age <chr>, installment_plan <dbl>, housing <chr>,
# existing_credits <chr>, default <dbl>, dependents <dbl>, telephone <dbl>,
# foreign_worker <chr>, job <chr>
ここでは、Rが関数「read_sheet」を使用してGoogleシートからデータを読み取る方法をご覧いただけます。
参照および理解のため、データフレームもこちらに追加しています。
- Once you setup the account, it will be a very easy game.
3.シートIDを使用してGoogle SheetsをRに読み込む。
シートのリンクをコピーしてデータを読む必要はありません。シートのIDをコピーして、read_sheet関数と一緒に使用するだけでデータを通常通り読むことができます。
もしシートIDを知らない場合、リンクをシートに追加して、シートIDを色で強調しました。このIDをコピーして、同じプロセスをおこなうことができます。
https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit#gid=0 のリンクをパラフレーズください。
以下に、話し合われたコードを見つけることができます。
#Reads the data with Sheet ID into R
df <- read_sheet('1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE')
#Prints the data
df
このコードは、同じ出力、つまりデータを提供します。私は、説明のためにクレジットデータを使用しましたが、この目的には任意のデータを使用することができます。今後、Google SheetsをRに読み込むことは問題ではありません。
終わりのメモ
ほとんどの組織は、業務やデータの作業にGoogleシートを使用しています。アナリストやRユーザーとしては、GoogleシートとRの操作方法を知っていると良いでしょう。この方法は非常にシンプルですので、自身のデータやシートのID/リンクで実践することができます。お仕事の中で時間を節約できる何かを学んでいただければ幸いです。以上です。Rを楽しんでください!
もっと読みましょう:Rのドキュメンテーション