diff --git a/backend/__pycache__/agent.cpython-311.pyc b/backend/__pycache__/agent.cpython-311.pyc
index 87f701a04a31d900d91fd18b6bc837516be90163..d5d2be1f7bb1a3a05b10f889cf2438e0008f0b34 100644
Binary files a/backend/__pycache__/agent.cpython-311.pyc and b/backend/__pycache__/agent.cpython-311.pyc differ
diff --git a/backend/__pycache__/environment.cpython-311.pyc b/backend/__pycache__/environment.cpython-311.pyc
index 51daa198751b4836531ffe9cc564ed462aed29b8..9bea13c82289da5144dd2bcf2091da08eca74371 100644
Binary files a/backend/__pycache__/environment.cpython-311.pyc and b/backend/__pycache__/environment.cpython-311.pyc differ
diff --git a/backend/__pycache__/simplesimmodel.cpython-311.pyc b/backend/__pycache__/simplesimmodel.cpython-311.pyc
index 7f8f062a2173a3f3440055bc14475b66274869c3..84c65e33b50af4d2fb64b408c2146308eb6bfd54 100644
Binary files a/backend/__pycache__/simplesimmodel.cpython-311.pyc and b/backend/__pycache__/simplesimmodel.cpython-311.pyc differ
diff --git a/backend/agent.py b/backend/agent.py
index 111df067c5097be66021c5d64734dcc9f66f6117..45bc575289ef14fb842231d2e88f58fb1a89df75 100644
--- a/backend/agent.py
+++ b/backend/agent.py
@@ -34,7 +34,7 @@ def q_learning(space, activities):
     mean_time = 0
 
     # Train the agent using Q-learning
-    num_episodes = 100
+    num_episodes = 10
     for episode in range(num_episodes):
         state, _ = env.reset()
         state = env.flatten_observation(state)