如何在PyTorch中实现混合精度训练 - GPU

在PyTorch中实现混合精度训练，可以使用NVIDIA的Automatic Mixed Precision (AMP)库。AMP库可以自动管理模型参数和梯度的精度，从而提高训练速度并减少显存占用。以下是使用AMP进行混合精度训练的基本步骤：

安装必要的库：

确保你已经安装了PyTorch和NVIDIA的CUDA工具包。AMP库通常与PyTorch一起提供。

pip install torch torchvision

启用CUDA：

确保你的GPU支持CUDA，并且已经安装了相应的CUDA驱动和库。

创建模型和优化器：

定义你的模型和优化器。例如：

import torch
import torch.nn as nn
import torch.optim as optim
class MyModel(nn.Module):
def __init__(self):
super(MyModel, self).__init__()
self.fc = nn.Linear(784, 10)
def forward(self, x):
x = x.view(-1, 784)
return self.fc(x)
model = MyModel().cuda()
optimizer = optim.SGD(model.parameters(), lr=0.01)

启用AMP：

使用torch.cuda.amp.autocast()上下文管理器来启用自动混合精度。同时，使用torch.cuda.amp.GradScaler()来缩放梯度，以防止梯度下溢。

scaler = torch.cuda.amp.GradScaler()
for data, target in dataloader:
data, target = data.cuda(), target.cuda()
optimizer.zero_grad()
with torch.cuda.amp.autocast():
output = model(data)
loss = nn.CrossEntropyLoss()(output, target)
scaler.scale(loss).backward()
scaler.step(optimizer)
scaler.update()

完整示例：

以下是一个完整的训练循环示例：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
# 定义模型
class MyModel(nn.Module):
def __init__(self):
super(MyModel, self).__init__()
self.fc = nn.Linear(784, 10)
def forward(self, x):
x = x.view(-1, 784)
return self.fc(x)
# 数据加载器
transform = transforms.Compose([transforms.ToTensor()])
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
# 模型和优化器
model = MyModel().cuda()
optimizer = optim.SGD(model.parameters(), lr=0.01)
# 启用AMP
scaler = torch.cuda.amp.GradScaler()
# 训练循环
for epoch in range(5):
model.train()
for data, target in train_loader:
data, target = data.cuda(), target.cuda()
optimizer.zero_grad()
with torch.cuda.amp.autocast():
output = model(data)
loss = nn.CrossEntropyLoss()(output, target)
scaler.scale(loss).backward()
scaler.step(optimizer)
scaler.update()
print(f'Epoch {epoch+1}, Loss: {loss.item()}')

通过以上步骤，你可以在PyTorch中实现混合精度训练，从而提高训练效率和减少显存占用。