Hugging Face 每周速递: Chatbot Hackathon;FLAN-T5 XL 微调;构建更安全的 LLM

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!

:rocket:HACKATHON​:rocket: 造个 :robot: 去瀛海威广场聚会啦!

百姓 AI 和 Hugging Face 联合推出,就在下周末。大伙儿造/燥起来呀

使用 DeepSpeed 和 HuggingFace Transformers 对 FLAN-T5 XL/XXL 进行微调

《Scaling Instruction-Finetuned Language Models》论文中发布的 FLAN-T5 是 T5 的增强版本,它已经在多种任务中进行了微调。相同参数数量下,FLAN-T5 的表现比 T5 提高了两位数。Google 已经在 Hugging Face 上开源了 5 个版本,参数范围从 80M 到 11B 不等。本文介绍了如何使用 Transformers 对其进行微调。

https://www.philschmid.de/fine-tune-flan-t5-deepspeed

Composable T2I-Adapter demo 更新了。一键风格迁移

demo: https://huggingface.co/spaces/Adapter/T2I-Adapter

阿里同学的山水画风格文生图模型

Demo: https://huggingface.co/spaces/hysts/cv_diffusion_text-to-image-synthesis_tiny

构建一个更加安全和友好的大语言模型

我们发布了一篇博文,讨论了一种名为“红队”(red-teaming)的方法,通过测试语言模型的脆弱性和潜在的有害行为,从而开发出指导模型生成的策略,以使其产生的内容更符合要求。我们探讨了红队和对抗攻击之间的相似之处和不同之处,并提供了一些红队测试的例子。希望 LLM 研究人员与我们共同合作,将红队方法应用到 LLM 的开发中,以创造一个更加安全友好的世界。

查看博客文章: https://hf.co/blog/red-teaming

Diffusers for Mac 1.1 发布

新版本我们提供了更好的质量、更高的性能,以及对用户界面方面的改进。你可以更快的生成更高质量的图片,以及在界面上可以做更多的配置、禁用安全检查器、显示模型下载状态等。

Diffusers 的 Mac 版本是开源的,欢迎提交问题报告或 贡献代码

在 Gradio Blocks 中使用事件监听器

你可以使用事件监听器的 every 参数定期重复运行某个事件,当客户端连接打开时,每隔指定的秒数就会运行一次该事件。如果连接关闭,事件将在下一次迭代后停止运行。请注意,这不考虑事件本身的运行时间。因此,如果一个运行时间为 1 秒且 every=5 的函数,实际上将每隔 6 秒运行一次。

查看详细文档: https://gradio.app/blocks-and-event-listeners/#running-events-continuously

ChatRWKV v2 发布

ChatRWKV v2 最新 prompt 的用户对话效果如下图

代码 https://github.com/BlinkDL/ChatRWKV

模型 https://huggingface.co/BlinkDL/rwkv-4-pile-14b/blob/main/RWKV-4-Pile-14B-20230228-ctx4096-test663.pth

运行 v2 / chat.py 就可以体验


以上就是本期的 Hugging News,期待看到大家用 AI 构建的精彩应用!