Hugging Face 每周速递: Chatbot Hackathon；FLAN-T5 XL 微调；构建更安全的 LLM

101 · 2023 年3 月 13 日 03:22

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」，本期 Hugging News 有哪些有趣的消息，快来看看吧！

HACKATHON 造个去瀛海威广场聚会啦！

百姓 AI 和 Hugging Face 联合推出，就在下周末。大伙儿造/燥起来呀

使用 DeepSpeed 和 HuggingFace Transformers 对 FLAN-T5 XL/XXL 进行微调

《Scaling Instruction-Finetuned Language Models》论文中发布的 FLAN-T5 是 T5 的增强版本，它已经在多种任务中进行了微调。相同参数数量下，FLAN-T5 的表现比 T5 提高了两位数。Google 已经在 Hugging Face 上开源了 5 个版本，参数范围从 80M 到 11B 不等。本文介绍了如何使用 Transformers 对其进行微调。

https://www.philschmid.de/fine-tune-flan-t5-deepspeed

Composable T2I-Adapter demo 更新了。一键风格迁移

demo: https://huggingface.co/spaces/Adapter/T2I-Adapter

阿里同学的山水画风格文生图模型

Demo: https://huggingface.co/spaces/hysts/cv_diffusion_text-to-image-synthesis_tiny

构建一个更加安全和友好的大语言模型

我们发布了一篇博文，讨论了一种名为“红队”（red-teaming）的方法，通过测试语言模型的脆弱性和潜在的有害行为，从而开发出指导模型生成的策略，以使其产生的内容更符合要求。我们探讨了红队和对抗攻击之间的相似之处和不同之处，并提供了一些红队测试的例子。希望 LLM 研究人员与我们共同合作，将红队方法应用到 LLM 的开发中，以创造一个更加安全友好的世界。

查看博客文章: https://hf.co/blog/red-teaming