[🐛BUG] 顺序推荐模型在使用带有label标签的数据集并且使用排序评价指标(如NDCG)的时候会发生报错。 #2035

lone1yship · 2024-04-22T09:34:31Z

描述这个 bug
顺序推荐模型在使用带有label标签的数据集并且使用排序评价指标(如NDCG)的时候会发生报错

如何复现
复现这个 bug 的步骤：

引入的是mind-large-train.inter数据集
使用的是框架中的SASRec等顺序推荐模型的代码
yaml文件如下：
eval_args:
split: { 'RS': [0.8,0.1,0.1] }
order: TO
mode: labeled # 这里将模式设置成labeled是因为使用的数据集是mind，这个数据集是有标签的，是显示反馈(带标签)，所以应该使用labeled，使用不带标签的数据集的时候才使用其他三种评估方式(full,unixx,popxx)
group_by: user

load_col:
inter: ['user_id', 'item_id', 'label', 'timestamp']

预期
希望能够得知是自己参数设置的问题，还是框架本身的问题

屏幕截图

实验环境（请补全下列信息）：

操作系统: Linux
RecBole 版本:1.2.0
Python 版本:3.8.10
PyTorch 版本:1.10.1
cudatoolkit 版本:11.1.74

lone1yship · 2024-04-24T09:21:41Z

上面的BUG当评价指标换成AUC的时候是没有报错的，但是有一个问题就是当mode是labeled的时候，在验证阶段是没有负样本的，这与论文中在验证的时候需要负样本不一致。如果将mode换成uni100的话，那和框架中的API说遇到带有标签的数据应该使用labeled又有冲突。而且就算是换成了uni100进行训练，得到的结果也不对。还麻烦你们能够看看是我的问题还是框架的问题。@TayTroye

lone1yship · 2024-04-24T09:31:52Z

对于顺序推荐模型，损失函数是交叉熵损失函数，那也可以使用NDCG评价指标，SASRec和BERT4Rec等模型也是如此，这也是我发现的一个问题点。如若不对还请指正，谢谢 @TayTroye

lone1yship added the bug Something isn't working label Apr 22, 2024

zhengbw0324 assigned TayTroye Apr 22, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[🐛BUG] 顺序推荐模型在使用带有label标签的数据集并且使用排序评价指标(如NDCG)的时候会发生报错。 #2035

[🐛BUG] 顺序推荐模型在使用带有label标签的数据集并且使用排序评价指标(如NDCG)的时候会发生报错。 #2035

lone1yship commented Apr 22, 2024

lone1yship commented Apr 24, 2024

lone1yship commented Apr 24, 2024

[🐛BUG] 顺序推荐模型在使用带有label标签的数据集并且使用排序评价指标(如NDCG)的时候会发生报错。 #2035

[🐛BUG] 顺序推荐模型在使用带有label标签的数据集并且使用排序评价指标(如NDCG)的时候会发生报错。 #2035

Comments

lone1yship commented Apr 22, 2024

lone1yship commented Apr 24, 2024

lone1yship commented Apr 24, 2024