trl
话题 | 回复 | 浏览量 | 活动 | |
---|---|---|---|---|
为视觉语言多模态模型进行偏好优化 |
![]() |
0 | 215 | 2024 年7 月 17 日 |
使用 DDPO 在 TRL 中微调 Stable Diffusion 模型 |
![]() |
0 | 526 | 2023 年10 月 23 日 |
话题 | 回复 | 浏览量 | 活动 | |
---|---|---|---|---|
为视觉语言多模态模型进行偏好优化 |
![]() |
0 | 215 | 2024 年7 月 17 日 |
使用 DDPO 在 TRL 中微调 Stable Diffusion 模型 |
![]() |
0 | 526 | 2023 年10 月 23 日 |