101.dev 社区
trl
话题
回复
浏览量
活动
为视觉语言多模态模型进行偏好优化
Hugging Face
trl
,
vlm
0
188
2024 年7 月 17 日
使用 DDPO 在 TRL 中微调 Stable Diffusion 模型
Hugging Face
stable-diffusion
,
trl
,
ddpo
0
497
2023 年10 月 23 日