Pythonでデータセットを読み込む
データセットを読み込む方法は、データセットのフォーマットとサイズによって異なります。Python では一般的に、以下の方法が利用されます。
- 開く(ひらく)
with open('dataset.txt', 'r') as file:
data = file.read()
- 日本語でネイティブに言い換えてください。オプションは1つだけです。
import csv
with open('dataset.csv', 'r') as file:
reader = csv.reader(file)
data = list(reader)
- パンダ
import pandas as pd
data = pd.read_csv('dataset.csv')
- NumPy
import numpy as np
data = np.fromfile('dataset.bin', dtype=np.float32)
- h5py
import h5py
with h5py.File('dataset.hdf5', 'r') as file:
data = file['dataset_name'][:]
上記はほんの一般的なデータセットの読み込み方法のほんの一部で、実際にはデータセットの特徴や使用しているライブラリによって、他にも多くの方法があります。