Hugging News #0724: Llama 2 登陆 Hugging Face、AI 开源游戏竞赛获奖选手公布!

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! :tada::heart_eyes:

重点内容

:framed_picture: 道德与社会问题简报: 文生图模型中的偏见

最新一期的 Hugging Face 道德与社会“夏至”简报已经发布!这一简报对于道德与社会议题的关注非常重要,它为我们提供了一个平台来深入讨论和解决偏见问题。在本期简报中,我们详细探讨了文本生成图像系统中的偏见问题,并分享了如何应对的方法。

例如,如果训练数据主要是英文,它们可能传达相当西方化的价值观。结果我们得到了对不同或遥远文化的刻板印象。当我们比较 ERNIE ViLG (左) 和 Stable Diffusion v 2.1 (右) 对同一提示“北京的房子”的结果时,这种现象显得非常明显:house:

我们不仅调查了偏见的来源,还研究了如何检测带有偏见的输出,并进行了模型的红队测试,以及记录了测试结果。通过这些研究,我们希望能够启发更多关于如何共同解决这个问题的讨论。:thinking:

我们深信,这些工作将继续鼓励合作和创新,我们希望大家积极参与讨论,分享你们的想法和解决方案。:muscle::star2: 阅读更多,请查阅我们的完整文章:《道德与社会问题简报 #4: 文生图模型中的偏见》

让 Whisper 一步到位地转录任何语言!

我们发现了一个小窍门,让 Whisper 可以直接转录任何语言(不仅仅是英语)!:zap: 输入你的音频,即可获得另一种语言的转录结果。:fire: 但请注意:目前这个小窍门还仍是试验性的,并非完全可靠,这项任务并不是模型专门训练过的,因此在使用之前请进行充分的测试 :hugs:

我们将进行更多的基准测试,并很快与大家分享我们的发现!

Whisper 是由 OpenAI 于 2022 年底发布的模型,至今在英语和多语言基准测试中具有接近最先进的性能。:fire: 该模型经过训练,可以执行两个关键的语音识别任务::studio_microphone:

  • 将给定语言( “X” )的音频转录成文本。:memo:
  • 将音频直接翻译为英语。即将语言为 “X” 的音频转录成英语。:capital_abcd:

随着世界变得越来越紧密相连,对高质量内容的需求也越来越大。使内容(尤其是音频)更易获取的一种方式是将其转录成不同的语言,从而确保知识的传播。:zap:

从语言"X"的音频转录到另一种语言的典型工作流程如下:

  • 将语言 “X” 的音频翻译和转录成英语(Whisper 的基本功能)。
  • 将转录内容从语言"X"翻译成另一种语言(通常使用 LLM ,例如 GPT-3.5 / 4)。:earth_africa:

这种方法非常有效!然而,与任何其他过程一样,运行的步骤越多,出错的可能性就越高。我们能否实现从语言 "X "转录到语言 “Y” 的一步到位呢?:thinking:

事实证明,可以的!但是请记住:warning:,这是一种窍门,尽管在我们的测试中似乎效果非常好,但对于严肃的使用该技术,需要进行更加充分的验证!这是因为该模型并没有针对我们将要使用它的任务进行训练,因此结果可能不太可靠。

我们将在以下 GitHub 的网址中仔细说明步骤,使用英语、德语、意大利语等语言做示范。如果你想要更互动的体验来了解更多信息,可以在 GitHub 文章中的 Colab 笔记本里跟随本教程亲手操作!:man_technologist: https://github.com/Vaibhavs10/translate-with-whisper

开源更新

:hugs: Hugging Face AI 开源游戏竞赛获奖选手公布!

我们举办的 Game Jam 开源 AI 游戏挑战赛有超过来自全球 1000 多名开发者参加 :fire: 一共收录了 88 个游戏 :video_game: 而最终的获奖选手是——

【视频号】

欢迎来尝试所有本次提交的 AI 小游戏:https://itch.io/jam/open-source-ai-game-jam/entries
如果想获取 Hugging Face 的最新资讯,也欢迎关注我们的小红书账号:@Hugging Face
https:hf.link/xhs

Llama 2 登陆 Hugging Face :hugs:

Meta 刚刚发布了 LLaMa 2 :llama: 并将模型发布在了 Hugging Face Hub :rocket: 现在的模型单元和开源 LLM 榜单已经被它屠榜了 :exploding_head:

简单介绍一下 LLaMa 2 :llama: 的特点:

  • :capital_abcd: 2T Tokens 进行训练
  • :moneybag:允许商用
  • :speech_balloon: 基于聊天模式
  • 默认 4096 上下文 (可增加)
  • :abacus: 7B, 13B & 70B 三种版本
  • :rocket: LLaMa2-chat 与 ChatGPT 旗鼓相当
  • :fire: 开源!开源!开源!

欢迎大家来留言交流你的使用感受:clap:

社区活动

AI 头像变装秀最后一周冲刺!

Hugging Face 人气超高的 AI 头像变装秀即将进入尾声!在小红书的集美们热烈要求下,我们推出了一个重磅保姆级教程,手把手带你「轻松免费」生成自己的专属 AI 头像,仅需 3 分钟!

我们分享了一段 Stable Diffusion 的 Notebook 代码 :desktop_computer: https://hf.link/tx 大家可用这段代码生成自己喜欢的头像,生成头像的风格不限:sparkles:

参与方式: 在使用我们提供的代码生成头像之后,请在你的小红书发布一篇笔记 :ledger: 分享你的成果或体验,并 @Hugging Face 官方账号让我们知道。

活动时间: :alarm_clock: 活动将在 7 月 31 日 (周一) 晚上 12 点截止,届时获赞最多的 前三名 小伙伴将获得神秘小惊喜 :gift:

如果有疑问 :person_raising_hand:请随时私信或留言!可到小红书查看活动详情,或者在公众号后台回复「头像」加入活动群。

Hugging Face :hugs: ICML 2023 专区

ICML 2023 来啦!我们在 Hugging Face Spaces 建了一个专区,方便大家更好的了解本届 ICML 的新动向:

  • :star2:如果你是参会者,请认领你的论文:bookmark_tabs:上传你的模型 / 数据集 / Demo,这也可以让更多社区内的开发者认识你和你的作品
  • :star2:如果你是未来的参会者,在这里你可以同时看到感兴趣的论文 :bookmark_tabs: 模型 / 数据集,并尝试 Demo

关于本专区,如果你有更好的意见和建议,请留言让我们知道 :heart:
https://hf.co/spaces/ICML2023/ICML2023_papers

编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油! :muscle::tada: