Hugging News #0710: 体验 MusicGen、Diffusers 库发布一周年、我们的内容政策更新

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! :tada::heart_eyes:

重磅更新 :zap:

来 Hugging Face 体验 MusicGen :musical_note:: 生成你自己的音乐 :notes:

MusicGen 是一款由 Meta AI 发布的、针对音乐生成的模型,仅需输入一段文字描述以及上传一段有旋律的音乐文件(也可以选择不上传音频文件),即可生成一段 15 秒的音乐 :headphones:。文字描述举例:一首轻快愉悦的电子舞曲,节奏感强烈,鼓点跳跃有力,伴以空灵的音色,情感丰富。每分钟的节拍为 130。

MusicGen 用户可以控制音乐的节奏、调性、乐器、风格等,从而根据自己的喜好和创作需求,个性化地定制生成的音乐 :musical_keyboard::notes:。MusicGen 简单实用并且易于控制,发布后便成为 Hugging Face 上最受欢迎的项目之一 :heart_eyes:

我们很开心 Meta AI 选择将 MusicGen 的模型放到我们 Hugging Face 的模型中心里,这也十分符合我们的愿景:我们一直积极倡导开放源代码和知识共享,通过开源项目和社区贡献来推动 AI 技术的发展。我们希望让尖端的 AI 技术更加可访问和可重用,促进全球 AI 社区的合作和创新 :handshake:

在线体验:
MusicGen - a Hugging Face Space by facebook

来 Hugging Face 体验二维码艺术图生成器 :art:

欢迎来 Hugging Face 体验二维码艺术图片生成器模型。你可以放入一个二维码以及一个用于文字转化为图片的提示词(或上传自己喜欢的图片),即可生成一张充满美感可以使用的二维码 :rainbow::framed_picture::
QR Code AI Art Generator - a Hugging Face Space by huggingface-projects

开源更新 :zap:

Datasets版本更新:v2.13

Hugging Face Datasets 是一个可以轻松访问和共享用于音频,计算机视觉以及自然语言处理等任务的数据集的库,帮助你用一行代码加载数据集,并用我们强大的数据处理功能迅速处理好用于深度学习模型训练的数据 :rocket:。Datasets v2.13 版本具备直接从 Apache Spark 进行数据流处理的能力,也引入了对各种数据格式的更快速流式处理能力,包括 Parquet、JSONL、图像、音频等等 :tada:

非常感谢 Databricks 在这个项目中给予我们的合作和支持! :handshake:

Diffusers 库发布一周年啦,我们做了一个关于它的演讲 :microphone:

Hugging Face 的成员做了一个关于 Hugging Face Diffusers 库的讲座,讨论了 Diffusers 库如何作为一个模块化工具箱在科研中帮助模型的训练和推断。Diffusers 是一个用于生成图像、音频甚至分子的 3D 结构的预训练扩散模型的库,可以支持你寻找简单的推理解决方案以及训练自己的扩散模型。

讲座的 Slides 在这里下载:https://hf.link/1qxed

最佳 JAX / Diffusers 的社区项目列表 :trophy:

在谷歌云和 Hugging Face 的合作社区冲刺比赛中,大家运用 JAX 和 Diffusers 构建开源应用,探索控制 Stable Diffusion 的能力,最终展示了 26 个项目。感兴趣的小伙伴可以详细了解::point_right: https://opensource.googleblog.com/2023/06/controlling-stable-diffusion-with-jax-diffusers-and-cloud-tpus.html

产品更新 :rocket:

Hugging Face 企业版订阅 :briefcase:

Hugging Face 开放了新的为企业所设计的 Enterprise Hub 订阅选择(20 美元/用户/月),可以提供企业级安全性(SOC2 Type2)从而保护敏感数据和模型,访问控制 SSO 和优先的用户支持 :lock::busts_in_silhouette::muscle:。详情可以查看: Enterprise Hub - Hugging Face

发布 Hugging Face 徽章页面

我们发布了一系列的徽章页面供你在自己的项目里使用,包括链接到论文页面、部署到 Hugging Face Spaces、复制 Space 应用、在 Hugging Face Space 中打开,开启一个讨论帖、分享到社区、提出一个 Pull Request 请求,使用 Hugging Face 登陆和由 Hugging Face 强力驱动等。

你可以在这里查看这些徽章,并嵌入到自己的模型发布页面:
huggingface/badges · Datasets at Hugging Face

Hugging Face 内容政策已经更新

作为一个以推进开放、协作和负责任机器学习为目标的社区平台,我们会竭尽全力支持并维护一个友好的社区空间,为了实现这个目标,我们更新了我们的内容政策。由于这一政策可能会在未来有更多更新,因此我们不会在这里过多描述,你可以参考本段落结尾的内容政策页面了解更多。

简单的跟各位社区成员描述我们为何会进行这些更新,希望对大家的机器学习业务也有所启发。首先,我们发现对机器学习的产物进行监督是一个新的挑战,因为与静态内容相比,人工智能系统或模型带来的风险需要更为深入的分析才能预见可能会有的危害内容。

其次就是我们希望更“以人为本”,将用户的知情权和同意授权放在首位。机器学习使用和对信息的处理方式将会带来全新的问题,尤其是人们对于自己隐私数据的的把控能力。

让我们共同努力,建立一个开放的 AI 开源社区,成员们相互合作、真诚友好对待并且支持和成就他人,我们鼓励你与我们探讨关于这方面的话题,并通过 feedback@huggingface.co 联系我们。

详细内容政策请参考页面:
Content Policy – Hugging Face

Hugging Face Hub 讨论区自动翻译 :earth_africa:

Hugging Face Hub 的讨论区现在支持自动翻译了!只需点击翻译按钮即可将帖子进行翻译。这个功能是使用开源技术完成的,核心是三个组件:Hugging Face 的 Inference Endpoints,Meta AI 的 No Language Left Behind (NLLB) 模型,以及 fastText 语言识别模型。


以上就是本期的 Hugging News,新的一周开始了,我们一起加油! :muscle::tada: