PyTorch内のLSTMとGRUの実装方法はどのようになっていますか？

12か月 ago

綾乃, 一希

1 minute

PyTorchでのLSTM（Long Short-Term Memory）とGRU（Gated Recurrent Unit）はtorch.nnモジュールを使用して実装されています。PyTorchでは、torch.nn.LSTMとtorch.nn.GRUクラスを使用してLSTMとGRUモデルを作成できます。

PyTorchのLSTMとGRUを使用する方法を示す簡単な例を以下に示します。

import torch
import torch.nn as nn

# 定义输入数据
input_size = 10
hidden_size = 20
seq_len = 5
batch_size = 3

input_data = torch.randn(seq_len, batch_size, input_size)

# 使用LSTM
lstm = nn.LSTM(input_size, hidden_size)
output, (h_n, c_n) = lstm(input_data)

print("LSTM output shape:", output.shape)
print("LSTM hidden state shape:", h_n.shape)
print("LSTM cell state shape:", c_n.shape)

# 使用GRU
gru = nn.GRU(input_size, hidden_size)
output, h_n = gru(input_data)

print("GRU output shape:", output.shape)
print("GRU hidden state shape:", h_n.shape)

上記の例では、最初に入力データの次元を定義し、torch.nn.LSTMおよびtorch.nn.GRUクラスを使用してそれぞれLSTMモデルとGRUモデルを作成しました。その後、この2つのモデルに入力データを渡し、それぞれの出力と隠れ状態の形状を出力しました。

LSTMとGRUモデルの出力の形状は、入力データの次元やモデルのパラメータ設定によって異なる可能性があります。通常、出力の形状には、シーケンスの長さ、バッチサイズ、隠れユニット数などの情報が含まれます。