Hugging News #0731: 新课程重磅发布、用户交流群邀请你加入、真实图像编辑方法 LEDTIS 来啦！

101 · 2023 年7 月 31 日 14:12

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！

重磅更新

Hugging Face x DeepLearning.ai 免费新课程发布！

Hugging Face 与 DeepLearning.ai 共同发布了由 Hugging Face 的机器学习工程师 Apolinário Passos 授课的「使用Gradio构建生成性AI应用」免费课程，教你如何快速创建机器学习应用的演示，以便测试、迭代和与他人共享。快来查看吧！链接：Building Generative AI Applications with Gradio - DeepLearning.AI

在这门课中，你将可以做以下几件事情：

用几行代码创建一个文字总结 app，这个 app 可以用开源大语言模型对输入文本进行摘要，并在 app 中显示出来摘要。
创建一个文字描述图像的 app，使用图像到文本的转换技术，用户上传图像后，app 可以生成一段文字来描述这个图像，之后同时显示图像和文字描述。
创建一个文字生成图像的 app，通过扩散模型将文本转换成图像，然后在 app 中展示生成的图像。
结合前两课学到的内容：上传图像，为图像生成文字描述，然后使用文字描述生成新的图像。
创建一个与开源大模型 Falcon 进行对话的接口——Falcon 是 Hugging Face 的 Open LLM 榜单中排名最高的开源大语言模型。

在本课程结束时，你将掌握快速构建交互式应用和演示的能力，从而验证你的项目并加快推进项目进度。

产品更新

Hugging Face 「每日新论文」推送

小伙伴们现在可以在 Hugging Face 上设置获取有关每日新论文的通知。点击链接，选择左侧的「通知设置」，勾选「每日论文」即可。 Hugging Face – The AI community building the future.

Gradio v3.39 更新

Gradio 版本 3.39.0 刚刚发布，现在可以将 Gradio 聊天机器人部署为 Discord 机器人！

你只需要一行代码就可以创建一个运行在 Hugging Face 的推理端点上的 Llama 2 Discord 机器人具体内容可参照：gradio-discord-bots (Gradio Discord Bots)

其他的更新

可以分享生成的结果：我们的输出组件，包括视频、图像、音频和图库，现在在右上角都包含了一个“分享”图标。点击这个图标，即可将生成结果一键分享到 Hugging Face Discussions 页面！

gr.DuplicateButton：你可以在自己的 Gradio 演示中的任意位置添加自己的 gr.DuplicateButton()，让用户更轻松地在自己的设备上尝试你的演示

自动播放：我们发布了自动播放功能，允许你自动播放生成的音频或视频文件，只需在构建组件时设置 autoplay=True 即可。

新的信息和警告模态框：现在我们有 gr.Info 和 gr.Warning 模态框，可在函数内的任意位置使用，让用户实时获得函数正在处理的通知。我们所有的模态框都进行了重新设计！

更多更新可以参照：https://github.com/gradio-app/gradio/blob/main/CHANGELOG.md#3390

开源更新

LEDTIS：直观好用的真实图像编辑方法

推出 LEDTIS — 一种结合了 DDPM 反演和语义引导的特点的，直观好用的真实图像编辑方法

DDPM 代表去噪扩散概率模型（Denoising Diffusion Probabilistic Models），这是一种用于图像生成的生成模型。DDPM 反演指的是将给定的图像逆向转换为生成该图像所使用的潜在表示或代码的过程。换句话说，它是找到潜在变量的过程，当我们将这些潜在变量输入到 DDPM 模型中时，能够生成给定的图像。

在图像编辑中，语义引导是指使用语义信息或高级特征来指导编辑过程。通过语义引导，我们可以基于图像的语义内容，来提供具体的指令或约束，从而可以引导编辑过程。例如，在语义图像编辑中，可以提供例如“使天空更蓝”或“在前景中添加一棵树”之类的指令，来指导编辑过程。语义引导有助于实现更可控的编辑，确保对图像所做的更改是连贯且与符合预期的。

演示：LEDITS - a Hugging Face Space by editing-images
项目页面：LEDITS - Pipeline for editing images
arXiv 论文：[2307.00522] LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance

LEDTIS 有不少优点：

灵活多变

可以通过一个提示词来同时进行多个独立的编辑操作，并且反映多个 SEGA 概念。这里 SEGA 指的是使用生成对抗网络的语义编辑（Semantic Editing with GANs），是一种利用生成对抗网络进行语义图像编辑的技术。SEGA 概念代表图像的特定语义信息或特征，可以通过修改或控制它们来实现所需的编辑效果，例如改变颜色、添加对象或修改图像的特定元素。

互补功能

这种综合控制可以在不同情况下让 DDPM 反演和语义引导这两种方法互相弥补彼此的局限性。同时，LEDTIS 是轻量级的，由对去噪过程中 SEGA 方案的简单修改组成，既保持高效，又发挥了两种技术的编辑能力

我们在 Hugging Face 的小红书笔记里也用周董的照片做了示范： http://xhslink.com/w7lJIs

AI 生成的网络电视直播

一场由 Hugging Face 上的视频模型 Zeroscope V2 576w 创建的生成式 AI 视频直播这里所有的视频内容全部都是文本到视频的转换，没有图像或视频的输入。可以在 Hugging Face Spaces 上进行观看 AI WebTV - a Hugging Face Space by jbilcke-hf

模型地址：https://hf.co/cerspense/zeroscope_v

小游戏：涂鸦冲刺

「涂鸦冲刺」（Doodle Dash）是一个由 Transformers.js 支持的网页游戏。玩家有60秒的时间尽可能多地画出单词，同时神经网络实时尝试猜测用户正在画的内容。小编感觉这个游戏就是国内的游戏「你画我猜」，但是是你画机器猜。可以在这里体验游戏 https://xenova-doodle-dash.hf.space

欢迎加入我们的用户微信交流群

我们经常在后台收到私信希望加入 Hugging Face 的用户交流群，于是乎，它来啦——

请先我们的群聊行为守则，扫码入群即视为你认同并将遵守我们下面列出的行为守则:

请只讨论与群聊主题相关的内容，勿讨论任何违反法律和 Hugging Face 社区规定的内容
我们会非常积极的清理发送垃圾信息和违规内容的群成员，如果您认为自己被误伤，请向群主和管理员提出异议
加好友前请在群里使用 at 的方式请求其同意，任何不公开征得同意的方式群内加好友均视为违规
如果你发现自己的隐私被侵犯，请直接拨打 110 报警
当你作为群成员希望邀请其他人加入的时候，请务必转发我们的群聊行为守则给被邀请人并请对方遵守
如有违规情况，我们会将你直接清理出所有讨论群并永久禁止你参与任何我们的活动