Feedforward Neural Networks for Univariate Time Series Forecasting¶

In this notebook, we build a feedforward neural network using pytorch to forecast $\sin$ function as a time series.

In [ ]:

                
                    Copied!
                    
import dataclasses
import math
import dataclasses
import math

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
import os
from functools import cached_property
from typing import Dict, List, Tuple

import lightning as L
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import torch
from lightning.pytorch.callbacks.early_stopping import EarlyStopping
from loguru import logger
from torch import nn
from torch.utils.data import DataLoader, Dataset
from ts_dl_utils.datasets.pendulum import Pendulum, PendulumDataModule
from ts_dl_utils.evaluation.evaluator import Evaluator
from ts_dl_utils.naive_forecasters.last_observation import LastObservationForecaster
import os
from functools import cached_property
from typing import Dict, List, Tuple

import lightning as L
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import torch
from lightning.pytorch.callbacks.early_stopping import EarlyStopping
from loguru import logger
from torch import nn
from torch.utils.data import DataLoader, Dataset
from ts_dl_utils.datasets.pendulum import Pendulum, PendulumDataModule
from ts_dl_utils.evaluation.evaluator import Evaluator
from ts_dl_utils.naive_forecasters.last_observation import LastObservationForecaster

Data¶

We create a dataset that models a damped pendulum. The pendulum is modelled as a damped harmonic oscillator, i.e.,

$$ \theta(t) = \theta(0) \cos(2 \pi t / p)\exp(-\beta t), $$

where $\theta(t)$ is the angle of the pendulum at time $t$. The period $p$ is calculated using

$$ p = 2 \pi \sqrt(L / g), $$

with $L$ being the length of the pendulum and $g$ being the surface gravity.

In [ ]:

                
                    Copied!
                    
pen = Pendulum(length=100)
pen = Pendulum(length=100)

In [ ]:

                
                    Copied!
                    
df = pd.DataFrame(pen(10, 400, initial_angle=1, beta=0.001))
df = pd.DataFrame(pen(10, 400, initial_angle=1, beta=0.001))

In [ ]:

                
                    Copied!
                    
df["theta"] = df["theta"] + 2
df["theta"] = df["theta"] + 2

Since the damping constant is very small, the data generated is mostly a sin wave.

In [ ]:

                
                    Copied!
                    
_, ax = plt.subplots(figsize=(10, 6.18))

df.plot(x="t", y="theta", ax=ax)
_, ax = plt.subplots(figsize=(10, 6.18))

df.plot(x="t", y="theta", ax=ax)

Model¶

In this section, we create the FFN model.

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
@dataclasses.dataclass
class TSFFNParams:
    """A dataclass to be served as our parameters for the model.

    :param hidden_widths: list of dimensions for the hidden layers
    """

    hidden_widths: List[int]


class TSFeedForward(nn.Module):
    """Feedforward networks for univaraite time series modeling.

    :param history_length: the length of the input history.
    :param horizon: the number of steps to be forecasted.
    :param ffn_params: the parameters for the FFN network.
    """

    def __init__(self, history_length: int, horizon: int, ffn_params: TSFFNParams):
        super().__init__()
        self.ffn_params = ffn_params
        self.history_length = history_length
        self.horizon = horizon

        self.regulate_input = nn.Linear(
            self.history_length, self.ffn_params.hidden_widths[0]
        )

        self.hidden_layers = nn.Sequential(
            *[
                self._linear_block(dim_in, dim_out)
                for dim_in, dim_out in zip(
                    self.ffn_params.hidden_widths[:-1],
                    self.ffn_params.hidden_widths[1:],
                )
            ]
        )

        self.regulate_output = nn.Linear(
            self.ffn_params.hidden_widths[-1], self.horizon
        )

    @property
    def ffn_config(self):
        return dataclasses.asdict(self.ffn_params)

    def _linear_block(self, dim_in, dim_out):
        return nn.Sequential(*[nn.Linear(dim_in, dim_out), nn.ReLU()])

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        x = self.regulate_input(x)
        x = self.hidden_layers(x)

        return self.regulate_output(x)
@dataclasses.dataclass
class TSFFNParams:
    """A dataclass to be served as our parameters for the model.

    :param hidden_widths: list of dimensions for the hidden layers
    """

    hidden_widths: List[int]


class TSFeedForward(nn.Module):
    """Feedforward networks for univaraite time series modeling.

    :param history_length: the length of the input history.
    :param horizon: the number of steps to be forecasted.
    :param ffn_params: the parameters for the FFN network.
    """

    def __init__(self, history_length: int, horizon: int, ffn_params: TSFFNParams):
        super().__init__()
        self.ffn_params = ffn_params
        self.history_length = history_length
        self.horizon = horizon

        self.regulate_input = nn.Linear(
            self.history_length, self.ffn_params.hidden_widths[0]
        )

        self.hidden_layers = nn.Sequential(
            *[
                self._linear_block(dim_in, dim_out)
                for dim_in, dim_out in zip(
                    self.ffn_params.hidden_widths[:-1],
                    self.ffn_params.hidden_widths[1:],
                )
            ]
        )

        self.regulate_output = nn.Linear(
            self.ffn_params.hidden_widths[-1], self.horizon
        )

    @property
    def ffn_config(self):
        return dataclasses.asdict(self.ffn_params)

    def _linear_block(self, dim_in, dim_out):
        return nn.Sequential(*[nn.Linear(dim_in, dim_out), nn.ReLU()])

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        x = self.regulate_input(x)
        x = self.hidden_layers(x)

        return self.regulate_output(x)

Forecasting (horizon=1)¶

We use lightning to train our model.

Training Utilities¶

In [ ]:

                
                    Copied!
                    
history_length_1_step = 100
horizon_1_step = 1

gap = 10
history_length_1_step = 100
horizon_1_step = 1

gap = 10

We will build a few utilities

To be able to feed the data into our model, we build a class (DataFrameDataset) that converts the pandas dataframe into a Dataset for pytorch.
To make the lightning training code simpler, we will build a LightningDataModule (PendulumDataModule) and a LightningModule (FFNForecaster).

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
class FFNForecaster(L.LightningModule):
    def __init__(self, ffn: nn.Module):
        super().__init__()
        self.ffn = ffn

    def configure_optimizers(self):
        optimizer = torch.optim.SGD(self.parameters(), lr=1e-3)
        return optimizer

    def training_step(self, batch, batch_idx):
        x, y = batch
        x = x.squeeze().type(self.dtype)
        y = y.squeeze(-1).type(self.dtype)

        y_hat = self.ffn(x)

        loss = nn.functional.mse_loss(y_hat, y)
        self.log_dict({"train_loss": loss}, prog_bar=True)
        return loss

    def validation_step(self, batch, batch_idx):
        x, y = batch
        x = x.squeeze().type(self.dtype)
        y = y.squeeze(-1).type(self.dtype)

        y_hat = self.ffn(x)

        loss = nn.functional.mse_loss(y_hat, y)
        self.log_dict({"val_loss": loss}, prog_bar=True)
        return loss

    def predict_step(self, batch, batch_idx):
        x, y = batch
        x = x.squeeze().type(self.dtype)
        y = y.squeeze(-1).type(self.dtype)

        y_hat = self.ffn(x)
        return x, y_hat

    def forward(self, x):
        x = x.squeeze().type(self.dtype)
        return x, self.ffn(x)
class FFNForecaster(L.LightningModule):
    def __init__(self, ffn: nn.Module):
        super().__init__()
        self.ffn = ffn

    def configure_optimizers(self):
        optimizer = torch.optim.SGD(self.parameters(), lr=1e-3)
        return optimizer

    def training_step(self, batch, batch_idx):
        x, y = batch
        x = x.squeeze().type(self.dtype)
        y = y.squeeze(-1).type(self.dtype)

        y_hat = self.ffn(x)

        loss = nn.functional.mse_loss(y_hat, y)
        self.log_dict({"train_loss": loss}, prog_bar=True)
        return loss

    def validation_step(self, batch, batch_idx):
        x, y = batch
        x = x.squeeze().type(self.dtype)
        y = y.squeeze(-1).type(self.dtype)

        y_hat = self.ffn(x)

        loss = nn.functional.mse_loss(y_hat, y)
        self.log_dict({"val_loss": loss}, prog_bar=True)
        return loss

    def predict_step(self, batch, batch_idx):
        x, y = batch
        x = x.squeeze().type(self.dtype)
        y = y.squeeze(-1).type(self.dtype)

        y_hat = self.ffn(x)
        return x, y_hat

    def forward(self, x):
        x = x.squeeze().type(self.dtype)
        return x, self.ffn(x)

Data, Model and Training¶

DataModule¶

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
pdm_1_step = PendulumDataModule(
    history_length=history_length_1_step,
    horizon=horizon_1_step,
    gap=gap,
    dataframe=df[["theta"]],
)
pdm_1_step = PendulumDataModule(
    history_length=history_length_1_step,
    horizon=horizon_1_step,
    gap=gap,
    dataframe=df[["theta"]],
)

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
fig, ax = plt.subplots(figsize=(10, 6.18))

pdm_1_step_sample = list(pdm_1_step.train_dataloader())[0]

pdm_1_step_sample_history = pdm_1_step_sample[0][0, ...].squeeze(-1).numpy()
pdm_1_step_sample_target = pdm_1_step_sample[1][0, ...].squeeze(-1).numpy()

pdm_1_step_sample_steps = np.arange(
    0, len(pdm_1_step_sample_history) + gap + len(pdm_1_step_sample_target)
)

ax.plot(
    pdm_1_step_sample_steps[: len(pdm_1_step_sample_history)],
    pdm_1_step_sample_history,
    marker=".",
    label="Input",
)

ax.plot(
    pdm_1_step_sample_steps[len(pdm_1_step_sample_history) + gap :],
    pdm_1_step_sample_target,
    "r--",
    marker="x",
    label="Target",
)
plt.legend()
fig, ax = plt.subplots(figsize=(10, 6.18))

pdm_1_step_sample = list(pdm_1_step.train_dataloader())[0]

pdm_1_step_sample_history = pdm_1_step_sample[0][0, ...].squeeze(-1).numpy()
pdm_1_step_sample_target = pdm_1_step_sample[1][0, ...].squeeze(-1).numpy()

pdm_1_step_sample_steps = np.arange(
    0, len(pdm_1_step_sample_history) + gap + len(pdm_1_step_sample_target)
)

ax.plot(
    pdm_1_step_sample_steps[: len(pdm_1_step_sample_history)],
    pdm_1_step_sample_history,
    marker=".",
    label="Input",
)

ax.plot(
    pdm_1_step_sample_steps[len(pdm_1_step_sample_history) + gap :],
    pdm_1_step_sample_target,
    "r--",
    marker="x",
    label="Target",
)
plt.legend()

LightningModule¶

In [ ]:

                
                    Copied!
                    
ts_ffn_params_1_step = TSFFNParams(hidden_widths=[512, 256, 64, 256, 512])

ts_ffn_1_step = TSFeedForward(
    history_length=history_length_1_step,
    horizon=horizon_1_step,
    ffn_params=ts_ffn_params_1_step,
)

ts_ffn_1_step
ts_ffn_params_1_step = TSFFNParams(hidden_widths=[512, 256, 64, 256, 512])

ts_ffn_1_step = TSFeedForward(
    history_length=history_length_1_step,
    horizon=horizon_1_step,
    ffn_params=ts_ffn_params_1_step,
)

ts_ffn_1_step

In [ ]:

                
                    Copied!
                    
ffn_forecaster_1_step = FFNForecaster(ffn=ts_ffn_1_step)
ffn_forecaster_1_step = FFNForecaster(ffn=ts_ffn_1_step)

Trainer¶

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
logger_1_step = L.pytorch.loggers.TensorBoardLogger(
    save_dir="lightning_logs", name="ffn_ts_1_step"
)

trainer_1_step = L.Trainer(
    precision="64",
    max_epochs=100,
    min_epochs=5,
    callbacks=[
        EarlyStopping(monitor="val_loss", mode="min", min_delta=1e-4, patience=2)
    ],
    logger=logger_1_step,
)
logger_1_step = L.pytorch.loggers.TensorBoardLogger(
    save_dir="lightning_logs", name="ffn_ts_1_step"
)

trainer_1_step = L.Trainer(
    precision="64",
    max_epochs=100,
    min_epochs=5,
    callbacks=[
        EarlyStopping(monitor="val_loss", mode="min", min_delta=1e-4, patience=2)
    ],
    logger=logger_1_step,
)

Fitting¶

In [ ]:

                
                    Copied!
                    
trainer_1_step.fit(model=ffn_forecaster_1_step, datamodule=pdm_1_step)
trainer_1_step.fit(model=ffn_forecaster_1_step, datamodule=pdm_1_step)

Retrieving Predictions¶

In [ ]:

                
                    Copied!
                    
predictions_1_step = trainer_1_step.predict(
    model=ffn_forecaster_1_step, datamodule=pdm_1_step
)
predictions_1_step = trainer_1_step.predict(
    model=ffn_forecaster_1_step, datamodule=pdm_1_step
)

Naive Forecasts¶

To understand how good our forecasts are, we take the last observations in time and use them as forecasts.

ts_LastObservationForecaster is a forecaster we have build for this purpose.

In [ ]:

                
                    Copied!
                    
trainer_naive_1_step = L.Trainer(precision="64")

lobs_forecaster_1_step = LastObservationForecaster(horizon=horizon_1_step)
lobs_1_step_predictions = trainer_naive_1_step.predict(
    model=lobs_forecaster_1_step, datamodule=pdm_1_step
)
trainer_naive_1_step = L.Trainer(precision="64")

lobs_forecaster_1_step = LastObservationForecaster(horizon=horizon_1_step)
lobs_1_step_predictions = trainer_naive_1_step.predict(
    model=lobs_forecaster_1_step, datamodule=pdm_1_step
)

Evaluations¶

In [ ]:

                
                    Copied!
                    
evaluator_1_step = Evaluator(step=0)
evaluator_1_step = Evaluator(step=0)

In [ ]:

                
                    Copied!
                    
fig, ax = plt.subplots(figsize=(10, 6.18))

ax.plot(
    evaluator_1_step.y_true(dataloader=pdm_1_step.predict_dataloader()),
    "g-",
    label="truth",
)

ax.plot(evaluator_1_step.y(predictions_1_step), "r--", label="predictions")

ax.plot(evaluator_1_step.y(lobs_1_step_predictions), "b-.", label="naive predictions")

plt.legend()
fig, ax = plt.subplots(figsize=(10, 6.18))

ax.plot(
    evaluator_1_step.y_true(dataloader=pdm_1_step.predict_dataloader()),
    "g-",
    label="truth",
)

ax.plot(evaluator_1_step.y(predictions_1_step), "r--", label="predictions")

ax.plot(evaluator_1_step.y(lobs_1_step_predictions), "b-.", label="naive predictions")

plt.legend()

In [ ]:

                
                    Copied!
                    
evaluator_1_step.metrics(predictions_1_step, pdm_1_step.predict_dataloader())
evaluator_1_step.metrics(predictions_1_step, pdm_1_step.predict_dataloader())

In [ ]:

                
                    Copied!
                    
evaluator_1_step.metrics(lobs_1_step_predictions, pdm_1_step.predict_dataloader())
evaluator_1_step.metrics(lobs_1_step_predictions, pdm_1_step.predict_dataloader())

Forecasting (horizon=3)¶

Train a Model¶

In [ ]:

                
                    Copied!
                    
history_length_m_step = 100
horizon_m_step = 3
history_length_m_step = 100
horizon_m_step = 3

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
pdm_m_step = PendulumDataModule(
    history_length=history_length_m_step,
    horizon=horizon_m_step,
    dataframe=df[["theta"]],
    gap=gap,
)
pdm_m_step = PendulumDataModule(
    history_length=history_length_m_step,
    horizon=horizon_m_step,
    dataframe=df[["theta"]],
    gap=gap,
)

In [ ]:

                
                    Copied!
                    
ts_ffn_params_m_step = TSFFNParams(hidden_widths=[512, 256, 64, 256, 512])

ts_ffn_m_step = TSFeedForward(
    history_length=history_length_m_step,
    horizon=horizon_m_step,
    ffn_params=ts_ffn_params_m_step,
)

ts_ffn_m_step
ts_ffn_params_m_step = TSFFNParams(hidden_widths=[512, 256, 64, 256, 512])

ts_ffn_m_step = TSFeedForward(
    history_length=history_length_m_step,
    horizon=horizon_m_step,
    ffn_params=ts_ffn_params_m_step,
)

ts_ffn_m_step

In [ ]:

                
                    Copied!
                    
ffn_forecaster_m_step = FFNForecaster(ffn=ts_ffn_m_step)
ffn_forecaster_m_step = FFNForecaster(ffn=ts_ffn_m_step)

In [ ]:

                
                    Copied!
                    
                        
                        
                    
                    

            
logger_m_step = L.pytorch.loggers.TensorBoardLogger(
    save_dir="lightning_logs", name="ffn_ts_m_step"
)

trainer_m_step = L.Trainer(
    precision="64",
    max_epochs=100,
    min_epochs=5,
    callbacks=[
        EarlyStopping(monitor="val_loss", mode="min", min_delta=1e-4, patience=2)
    ],
    logger=logger_m_step,
)
logger_m_step = L.pytorch.loggers.TensorBoardLogger(
    save_dir="lightning_logs", name="ffn_ts_m_step"
)

trainer_m_step = L.Trainer(
    precision="64",
    max_epochs=100,
    min_epochs=5,
    callbacks=[
        EarlyStopping(monitor="val_loss", mode="min", min_delta=1e-4, patience=2)
    ],
    logger=logger_m_step,
)

In [ ]:

                
                    Copied!
                    
trainer_m_step.fit(model=ffn_forecaster_m_step, datamodule=pdm_m_step)
trainer_m_step.fit(model=ffn_forecaster_m_step, datamodule=pdm_m_step)

In [ ]:

                
                    Copied!
                    
predictions_m_step = trainer_m_step.predict(
    model=ffn_forecaster_m_step, datamodule=pdm_m_step
)
predictions_m_step = trainer_m_step.predict(
    model=ffn_forecaster_m_step, datamodule=pdm_m_step
)

Naive Forecaster¶

In [ ]:

                
                    Copied!
                    
trainer_naive_m_step = L.Trainer(precision="64")

lobs_forecaster_m_step = LastObservationForecaster(horizon=horizon_m_step)
lobs_m_step_predictions = trainer_naive_m_step.predict(
    model=lobs_forecaster_m_step, datamodule=pdm_m_step
)
trainer_naive_m_step = L.Trainer(precision="64")

lobs_forecaster_m_step = LastObservationForecaster(horizon=horizon_m_step)
lobs_m_step_predictions = trainer_naive_m_step.predict(
    model=lobs_forecaster_m_step, datamodule=pdm_m_step
)

Evaluation¶

In [ ]:

                
                    Copied!
                    
evaluator_m_step = Evaluator(step=2, gap=gap)
evaluator_m_step = Evaluator(step=2, gap=gap)

In [ ]:

                
                    Copied!
                    
fig, ax = plt.subplots(figsize=(10, 6.18))

ax.plot(
    evaluator_m_step.y_true(dataloader=pdm_m_step.predict_dataloader()),
    "g-",
    label="truth",
)

ax.plot(evaluator_m_step.y(predictions_m_step), "r--", label="predictions")

ax.plot(evaluator_m_step.y(lobs_m_step_predictions), "b-.", label="naive predictions")

plt.legend()
fig, ax = plt.subplots(figsize=(10, 6.18))

ax.plot(
    evaluator_m_step.y_true(dataloader=pdm_m_step.predict_dataloader()),
    "g-",
    label="truth",
)

ax.plot(evaluator_m_step.y(predictions_m_step), "r--", label="predictions")

ax.plot(evaluator_m_step.y(lobs_m_step_predictions), "b-.", label="naive predictions")

plt.legend()

In [ ]:

                
                    Copied!
                    
fig, ax = plt.subplots(figsize=(10, 6.18))

for i in np.arange(0, 1000, 120):
    evaluator_m_step.plot_one_sample(ax=ax, predictions=predictions_m_step, idx=i)
fig, ax = plt.subplots(figsize=(10, 6.18))

for i in np.arange(0, 1000, 120):
    evaluator_m_step.plot_one_sample(ax=ax, predictions=predictions_m_step, idx=i)

In [ ]:

                
                    Copied!
                    
evaluator_m_step.metrics(predictions_m_step, pdm_m_step.predict_dataloader())
evaluator_m_step.metrics(predictions_m_step, pdm_m_step.predict_dataloader())

In [ ]:

                
                    Copied!
                    
evaluator_m_step.metrics(lobs_m_step_predictions, pdm_m_step.predict_dataloader())
evaluator_m_step.metrics(lobs_m_step_predictions, pdm_m_step.predict_dataloader())

Contributors: LM