[bugfix] fix type_type=rm eval trl>=0.25 (#6701)

Jintao-Huang · web-flow · commit 6cfaeaa45719 · 2025-11-21T17:09:08.000+08:00
diff --git a/swift/trainers/rlhf_trainer/reward_trainer.py b/swift/trainers/rlhf_trainer/reward_trainer.py
@@ -6,7 +6,9 @@
 import pandas as pd
 import torch
 import torch.nn as nn
+import trl
 from accelerate.utils import gather_object
+from packaging import version
 from transformers import PreTrainedModel
 from trl import RewardTrainer as HFRewardTrainer
 from trl.trainer.utils import print_rich_table
@@ -33,6 +35,10 @@ def __init__(self, *args, **kwargs):
         except ImportError:
             self.maybe_activation_offload_context = nullcontext()
         self._metrics = {'train': defaultdict(list), 'eval': defaultdict(list)}
+        if version.parse(trl.__version__) >= version.parse('0.24'):
+            # During evaluation, Trainer calls compute_loss() only if can_return_loss is True and label_names is empty.
+            self.can_return_loss = True
+            self.label_names = []
 
     def compute_loss(self,
                      model: Union[PreTrainedModel, nn.Module],