备菜前食材识别模型评估
动态列使用序号显示,鼠标悬浮可查看完整文件夹名。
80-100
60-79
40-59
<40
题库日期:
非推理模型
推理模型
小于5秒
小于10秒
提供商
发布日期
模型
总分
Tokens
单次(秒)
TPS
总成本(元)
分数规则
每张图以所在文件夹名按下划线拆分后的食材作为标准标签。
模型识别出的每个食材会做 embedding 检索,若 top4 候选中命中文件夹标签则加 1 分,否则扣 1 分。
文件夹标签中未被命中的食材按漏检处理,每个漏检再扣 1 分。
单个文件夹满分 = 标签数量 × 图片数量,页面展示分数 = 总得分 ÷ 满分后的整数百分比。