# импортируем пайторч и создадим двумерный массив. Синтаксис аналогичен нумпаю:
import torch
x = torch.Tensor(2, 3)

print(x)

tensor([[3.9168e-02, 1.1706e-19, 1.3563e-19],
        [1.3563e-19, 1.3563e-19, 1.2686e+31]])

# мы можем создать тензор и из нумпай массива
import numpy as np
x = torch.Tensor(np.random.random((2, 3)))

print(x)

tensor([[0.5341, 0.3995, 0.7401],
        [0.1817, 0.7504, 0.4476]])

# все основные операции аналогичны с нумпаем

x = torch.ones(2,3)
y = torch.ones(2,3) * 2
print(x + y)

tensor([[3., 3., 3.],
        [3., 3., 3.]])

# аналогично и индексирование

y[:,1] = y[:,1] + 1
print(y)

tensor([[2., 3., 2.],
        [2., 3., 2.]])

from torch.autograd import Variable

# создадим дифференцируемую переменную
x = Variable(torch.ones(2, 2) * 2, requires_grad=True)

# создадим новую переменную, являющуюся результатом некоторых операций на x
z = 2 * (x * x) + 5 * x

z.backward(torch.ones(2, 2))

x.grad

tensor([[13., 13.],
        [13., 13.]])

from tqdm import tqdm


def sigmoid(x):
    return 1 / (1 + torch.exp(-x))


def mse_loss(y_true, y_pred):
    return ((y_true - y_pred) ** 2).mean()


class NeuralNetwork:
    def __init__(self, layers_sizes, bias=True):
        self.bias = bias
        self.len = len(layers_sizes)-1
        self.weights = []
        for i in range(self.len):
            layer = [Variable(torch.rand(layers_sizes[i], layers_sizes[i+1]), requires_grad=True)]
            if bias:
                layer.append(Variable(torch.rand(1, layers_sizes[i+1]), requires_grad=True))
            self.weights.append(layer)

    def forward(self, x):
        for i in range(self.len):
            x = x @ self.weights[i][0]
            if self.bias:
                x += self.weights[i][1]
            x = sigmoid(x)
        return x

    def train(self, train_data, valid_data, criterion, epochs, lr):
        X_train, y_train = train_data
        X_valid, y_valid = valid_data

        X_train, y_train = Variable(X_train, requires_grad=True), Variable(y_train, requires_grad=True)
        X_valid, y_valid = Variable(X_valid, requires_grad=True), Variable(y_valid, requires_grad=True)
        for e in tqdm(range(epochs)):
            out = self.forward(X_train)
            loss = criterion(y_train, out)

            loss.backward()
            for i in range(self.len):
                with torch.no_grad():
                    self.weights[i][0] -= self.weights[i][0].grad.data * lr
                    self.weights[i][0].grad = None
                    if self.bias:
                        self.weights[i][1] -= self.weights[i][1].grad.data * lr
                        self.weights[i][1].grad = None

        train_loss = loss.item()
        valid_loss = criterion(y_valid, self.forward(X_valid)).item()
        print(f"Train loss: {round(train_loss, 4)} | Valid loss: {round(valid_loss, 4)}")

from sklearn.datasets import load_diabetes
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split

data = load_diabetes(as_frame=True, scaled=False)
X, y = data["data"], data["target"].values.reshape((-1, 1))
scaler_X = MinMaxScaler().fit(X)
scaler_y = MinMaxScaler().fit(y)
X = scaler_X.transform(X)
y = scaler_y.transform(y)

X_train, X_valid, y_train, y_valid = train_test_split(X, y, test_size=0.2, random_state=42)

X_train = torch.Tensor(X_train)
y_train = torch.Tensor(y_train)

X_valid = torch.Tensor(X_valid)
y_valid = torch.Tensor(y_valid)

model = NeuralNetwork([10, 8, 1])

model.train((X_train, y_train), (X_valid, y_valid), mse_loss, 10000, 0.1)

100%|██████████| 10000/10000 [00:24<00:00, 401.19it/s]

Train loss: 0.0296 | Valid loss: 0.0271

preds = model.forward(X_valid)
mape = (abs(preds - y_valid) / y_valid).mean().item()
print("Ошибка модели по метрике MAPE:", round(mape, 3))

Ошибка модели по метрике MAPE: 0.632

# также воспользуемся готовыми датасетами из библиотеки sklearn

from sklearn.datasets import load_digits

digits = load_digits()
print(digits.data.shape)

(1797, 64)

# выведем для примера изображение

import matplotlib.pyplot as plt

plt.imshow(digits.images[700])

<matplotlib.image.AxesImage at 0x79678dbda440>

from torch.utils.data import Dataset, DataLoader

class DigitsDataset(Dataset):
    def __init__(self, images, targets):
        self.X = images
        self.y = targets

    def __getitem__(self, idx):
        X, y = self.X[idx], self.y[idx]
        X = X.flatten() # сгладим картинку в один вектор
        X /= 16 # приведем значение пикселей в диапазон от 0 до 1
        return torch.FloatTensor(X), torch.tensor(y).long()

    def __len__(self):
        return len(self.X)

X, y = digits.data, digits.target

X_train, X_valid, y_train, y_valid = train_test_split(X, y, test_size=0.2, random_state=42)
train_dataset, valid_dataset = DigitsDataset(X_train, y_train), DigitsDataset(X_valid, y_valid)

# создадим dataloader - объект специального класса, позволяющий удобно осуществлять батчирование данных и итерироваться по датасету

train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)
valid_loader = DataLoader(valid_dataset, batch_size=16, shuffle=True)

from IPython.display import clear_output
import time

def train(model, train_loader, valid_loader, criterion, optimizer, epochs):
    total_train_loss, total_train_acc = [], []
    total_valid_loss, total_valid_acc = [], []
    for ep in tqdm(range(epochs)):
        model.train()
        train_acc, valid_acc = [], []
        train_loss, valid_loss = [], []

        for imgs, labels in train_loader:
            optimizer.zero_grad()

            imgs = imgs
            labels = labels

            y_pred = model(imgs).float()

            loss = criterion(y_pred, labels)
            loss.backward()

            train_loss.append(loss.item())
            train_acc.append((y_pred.argmax(1) == labels).sum().item() / len(imgs))

            optimizer.step()

        model.eval()

        with torch.no_grad():
            for imgs, labels in valid_loader:
                imgs = imgs
                labels = labels

                y_pred = model(imgs)
                loss = criterion(y_pred, labels).item()

                valid_loss.append(loss)
                valid_acc.append((y_pred.argmax(1) == labels).sum().item() / len(imgs))

        if (ep-1) % 20 == 0:
            print(f"Epoch {ep} | Train acc: {round(np.mean(train_acc), 3)} | Valid acc: {round(np.mean(valid_acc), 3)}")

from torch import nn

model = nn.Sequential(
    nn.Linear(64, 128),
    nn.ReLU(),
    nn.Linear(128, 256),
    nn.ReLU(),
    nn.Linear(256, 64),
    nn.ReLU(),
    nn.Linear(64, 10),
    nn.Sigmoid()
)

model = model

from torch.optim import SGD

optimizer = SGD(model.parameters(), lr=5e-4, momentum=0.95)
criterion = nn.CrossEntropyLoss()

train(model, train_loader, valid_loader, criterion, optimizer, 200)

  1%|          | 2/200 [00:00<01:37,  2.03it/s]

Epoch 1 | Train acc: 0.094 | Valid acc: 0.073

 11%|█         | 22/200 [00:06<00:38,  4.66it/s]

Epoch 21 | Train acc: 0.257 | Valid acc: 0.198

 21%|██        | 42/200 [00:11<00:34,  4.55it/s]

Epoch 41 | Train acc: 0.295 | Valid acc: 0.261

 31%|███       | 62/200 [00:16<00:46,  2.97it/s]

Epoch 61 | Train acc: 0.558 | Valid acc: 0.505

 41%|████      | 82/200 [00:21<00:28,  4.10it/s]

Epoch 81 | Train acc: 0.794 | Valid acc: 0.821

Урок 5 - Pytorch и практика обучения нейронных сетей¶

О библиотеке PyTorch¶

Автодифференцирование¶

Более специализированные инструменты¶

Итоги марафона¶