From d2c15303ffaa244cc34326fdb5f8336e8d43ca94 Mon Sep 17 00:00:00 2001
From: Bram Stoeller <bram.stoeller@alliander.com>
Date: Fri, 14 Oct 2022 20:27:51 +0200
Subject: [PATCH] Lazy loading CSV files (or tables in general)

Signed-off-by: Bram Stoeller <bram.stoeller@alliander.com>
---
 .../data_stores/csv_dir_store.py                | 17 ++++++++++++-----
 1 file changed, 12 insertions(+), 5 deletions(-)

diff --git a/src/power_grid_model_io/data_stores/csv_dir_store.py b/src/power_grid_model_io/data_stores/csv_dir_store.py
index fa510b94..e442b2c5 100644
--- a/src/power_grid_model_io/data_stores/csv_dir_store.py
+++ b/src/power_grid_model_io/data_stores/csv_dir_store.py
@@ -6,7 +6,7 @@
 """
 
 from pathlib import Path
-from typing import Any, Dict, List
+from typing import Any, Callable, Dict, List
 
 import pandas as pd
 
@@ -26,17 +26,24 @@ class CsvDirStore(BaseDataStore[TabularData]):
 
     def __init__(self, dir_path: Path, **csv_kwargs):
         super().__init__()
-        self._dir_path = dir_path
+        self._dir_path = Path(dir_path)
         self._csv_kwargs: Dict[str, Any] = csv_kwargs
         self._header_rows: List[int] = [0]
 
     def load(self) -> TabularData:
         """
-        Load all CSV files in a directory as tabular data.
+        Create a lazy loader for all CSV files in a directory and store them in a TabularData instance.
         """
-        data: Dict[str, pd.DataFrame] = {}
+
+        def lazy_csv_loader(csv_path: Path) -> Callable[[], pd.DataFrame]:
+            def csv_loader():
+                return pd.read_csv(filepath_or_buffer=csv_path, header=self._header_rows, **self._csv_kwargs)
+
+            return csv_loader
+
+        data: Dict[str, Callable[[], pd.DataFrame]] = {}
         for path in self._dir_path.glob("*.csv"):
-            data[path.stem] = pd.read_csv(filepath_or_buffer=path, header=self._header_rows, **self._csv_kwargs)
+            data[path.stem] = lazy_csv_loader(path)
 
         return TabularData(**data)