added multinomial predictor to regional code no longer importing from…

… demand model
SocialFinanceDigitalLabs · Jun 24, 2024 · 455701c · 455701c
1 parent c89c093
commit 455701c
Show file tree

Hide file tree

Showing 2 changed files with 158 additions and 2 deletions.
diff --git a/ssda903/multinomial.py b/ssda903/multinomial.py
@@ -0,0 +1,157 @@
+from dataclasses import dataclass
+from datetime import date, timedelta
+from typing import Any, Iterable, Optional, Union
+
+import numpy as np
+import pandas as pd
+from demand_model.base import BaseModelPredictor, combine_rates
+from demand_model.multinomial.utils import (
+ build_transition_rates_matrix,
+ fill_missing_states,
+ populate_same_state_transition,
+)
+
+try:
+ import tqdm
+except ImportError:
+ tqdm = None
+
+
+@dataclass
+class Prediction:
+ population: pd.DataFrame
+ variance: pd.DataFrame
+ transition_rates: pd.Series
+ entry_rates: pd.Series
+
+
+@dataclass
+class NextPrediction:
+ population: np.ndarray
+ variance: np.ndarray
+
+
+class MultinomialPredictor(BaseModelPredictor):
+ def __init__(
+ self,
+ population: pd.Series,
+ transition_rates: pd.Series,
+ transition_numbers: Optional[pd.Series] = None,
+ start_date: date = date.today(),
+ rate_adjustment: Union[pd.Series, Iterable[pd.Series]] = None,
+ number_adjustment: Union[pd.Series, Iterable[pd.Series]] = None,
+ **kwargs,
+ ):
+ super().__init__(**kwargs)
+
+ # initialize rates
+ transition_rates.index.names = ["from", "to"]
+ if rate_adjustment is not None:
+ if isinstance(rate_adjustment, pd.Series):
+ rate_adjustment = [rate_adjustment]
+ for adjustment in rate_adjustment:
+ adjustment = adjustment.copy()
+ adjustment.index.names = ["from", "to"]
+ transition_rates = combine_rates(transition_rates, adjustment)
+
+ self._transition_rates = populate_same_state_transition(transition_rates)
+ self._matrix = build_transition_rates_matrix(self._transition_rates)
+
+ # initialize transition numbers
+ if transition_numbers is None:
+ self._transition_numbers = pd.Series(0, index=self._matrix.index)
+ else:
+ transition_numbers.index.names = ["from", "to"]
+
+ if number_adjustment is not None:
+ if isinstance(number_adjustment, pd.Series):
+ number_adjustment = [number_adjustment]
+ for adjustment in number_adjustment:
+ adjustment = adjustment.copy()
+ adjustment.index.names = ["from", "to"]
+ transition_numbers = combine_rates(transition_numbers, adjustment)
+
+ transition_numbers.index = transition_numbers.index.get_level_values("to")
+ self._transition_numbers = fill_missing_states(
+ transition_numbers, self._matrix.index
+ )
+
+ # initialize population
+ self._initial_population = fill_missing_states(population, self._matrix.index)
+ self._start_date = start_date
+
+ @property
+ def matrix(self) -> pd.DataFrame:
+ return self._matrix.copy()
+
+ @property
+ def transition_rates(self) -> pd.Series:
+ return self._transition_rates.copy()
+
+ @property
+ def transition_numbers(self) -> pd.Series:
+ return self._transition_numbers.copy()
+
+ @property
+ def initial_population(self) -> pd.Series:
+ return self._initial_population.copy()
+
+ @property
+ def date(self) -> date:
+ return self._start_date
+
+ def next(self, population: np.ndarray, step_days: int = 1) -> NextPrediction:
+ assert step_days > 0, "'step_days' must be greater than 0"
+ for _ in range(step_days):
+ variance = (
+ np.dot(
+ np.multiply(self.matrix.values, 1 - self.matrix.values), population
+ )
+ + self.transition_numbers.values
+ )
+ population = (
+ np.dot(self.matrix.values, population) + self.transition_numbers.values
+ )
+ return NextPrediction(population, variance)
+
+ def predict(self, steps: int = 1, step_days: int = 1, progress=False) -> Prediction:
+ predictor = self
+
+ if progress and tqdm:
+ iterator = tqdm.trange(steps)
+ set_description = iterator.set_description
+ else:
+ iterator = range(steps)
+ set_description = lambda x: None
+
+ predictions = []
+ variances = []
+ index = []
+ population = self.initial_population.values
+ for i in iterator:
+ prediction = predictor.next(population, step_days=step_days)
+ population = prediction.population
+ predictions.append(population)
+ variances.append(prediction.variance)
+
+ date = self.date + timedelta(days=(i + 1) * step_days)
+ index.append(date)
+ set_description(f"{date:%Y-%m}")
+
+ df_entry_rates = self.transition_numbers
+
+ df_transition_rates = self._transition_rates
+
+ df_predictions = pd.DataFrame(
+ predictions,
+ columns=self.initial_population.index,
+ index=index,
+ )
+ df_variances = pd.DataFrame(
+ variances,
+ columns=self.initial_population.index,
+ index=index,
+ )
+ return Prediction(
+ df_predictions, df_variances, df_transition_rates, df_entry_rates
+ )
diff --git a/ssda903/predictor.py b/ssda903/predictor.py
@@ -3,10 +3,9 @@
 
 import pandas as pd
 from dateutil.relativedelta import relativedelta
-from demand_model import MultinomialPredictor
-from demand_model.multinomial.predictor import Prediction
 
 from ssda903 import Config, PopulationStats
+from ssda903.multinomial import MultinomialPredictor, Prediction
 
 
 def predict(