General fixes in code, removed delta action, fixed grasp penalty, added logic to put gripper reward in info

2026-06-01 11:21:27 +00:00 · 2025-04-09 17:04:43 +02:00
parent 02e1ed0bfb
commit 9fd4c21d4d
7 changed files with 75 additions and 65 deletions
--- a/lerobot/scripts/server/learner_server.py
+++ b/lerobot/scripts/server/learner_server.py
@@ -406,7 +406,8 @@ def add_actor_information_and_train(
                "next_state": next_observations,
                "done": done,
                "observation_feature": observation_features,
-                "next_observation_feature": next_observation_features,
+                "next_observation_feature": next_observation_features, 
+                "complementary_info": batch["complementary_info"],
            }

            # Use the forward method for critic loss (includes both main critic and grasp critic)
@@ -992,7 +993,6 @@ def initialize_offline_replay_buffer(
        device=device,
        state_keys=cfg.policy.input_features.keys(),
        action_mask=active_action_dims,
-        action_delta=cfg.env.wrapper.delta_action,
        storage_device=storage_device,
        optimize_memory=True,
        capacity=cfg.policy.offline_buffer_capacity,