Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型


每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!

重要更新

最新音频课程现已发布

近期,我们发布了一个音频处理课程,旨在让学员学习使用 transformers 处理音频,涵盖了包括音频数据处理技术、不同任务的 transformers 模型应用(如音频分类和语音识别)、音频 transformers 模型的架构和音频任务实践等一系列内容。通过学习这个课程,你将获得在音频数据处理方面的扎实基础,并能够将这些技术应用于各种音频相关任务中。

我们的第三四单元已经发布了,接下来的时间我们将于 6 月 28 日 发布第五单元、7 月 5 日发布第六单元,以及 7 月 12 日发布最后两个单元,如果你在 7 月底之前完成课程的学习和练习,还有机会获得官方的证书,快来学习吧! https://hf.co/learn/audio-course

邀请参与全球开源 AI 游戏开发挑战赛

还有 11 天,已经有 900 多名参与者报名!借助人工智能工具释放你的创造力,一起打破游戏开发的边界。本挑战赛将在北京时间 2023 年 7 月 8 日凌晨 1 点到 10 日凌晨 1 点间举行,限时 48 小时,查看 这篇文章 了解更多。

参与 OpenVINO™ DevCon 中国系列工作坊活动

生成式 AI 领域一直在快速发展,许多潜在应用随之而来,这些应用可以从根本上改变人机交互与协作的未来。邀请各位社区成员们参加我们和英特尔联合举办的 OpenVINO™ DevCon 中国系列工作坊活动!这是一次线上活动,时间是 6 月 30 日下午 13:30-14:50,请使用下面这个链接注册活动,或者查看我们 过去的文章 了解更多活动详细内容。

注册活动: https://huggingface.link/devcon

开源生态更新

gradio deploy 直接将你的 Gradio 应用部署到 Hugging Face!

这是把 Gradio 应用从本地部署到 🤗Spaces 的最快方法: gradio deploy,快来试试看吧!

🧨Diffusers 库支持 UniDiffuser pipeline

UniDiffuser 是清华大学朱军老师团队提出的一个为多模态设计的概率建模框架,你可以在机器之心的这篇文章里了解更多《清华朱军团队开源首个基于 Transformer 的多模态扩散大模型,文图互生、改写全拿下》,感谢社区成员 dg845 的贡献,现在你已经可以在 🧨Diffusers 中使用支持 UniDiffuser。

查看文档: https://hf.co/docs/diffusers/main/en/api/pipelines/unidiffuser 查看 UniDiffuser 开源代码: https://github.com/thu-ml/unidiffuser

PerSAM

只需提供一张包含目标物体和参考掩码的图像,PerSAM (Personalization Segment Anything Model) 就可以在其他图像或视频中准确地分割目标物体,无需额外的训练。PerSAM 旨在自动对 Segment Anything Model (SAM) 进行个性化定制,以在照片相册中自动分割特定的视觉概念,例如你的宠物狗狗。

论文页面: https://hf.co/papers/2305.03048 Space 应用: https://hf.co/spaces/justin-zk/Personalize-SAM Notebooks 链接: https://github.com/NielsRogge/Transformers-Tutorials/tree/master/PerSAM GitHub 链接: https://github.com/ZrrSkywalker/Personalize-SAM

MQA 技术: 更长的文本、更少的内存占用

由于在多头注意力机制之间共享关键矩阵和值矩阵,MQA (Multi-query attention) 可以使用更少的内存能够生成更长的文本,这个技术的出现为使用大型语言模型带来了更多的可能性,生成更长的文本变得更加高效和便捷,现在已经有两个采用了 MQA 的语言模型: StarCoder 14B 和 Falcon 7B/40B。

查看论文: https://hf.co/papers/1911.02150

开源生态压轴出场

baichuan-7B: 免费可商用大语言模型

baichuan-7B 是由百川智能开发的一个开源的大规模预训练模型。基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口长度为 4096。在标准的中文和英文权威 benchmark (C-EVAL/MMLU) 上均取得同尺寸较好的效果。

即刻体验百川-7B 模型: https://hf.co/spaces/ysharma/baichuan-7B

ChatGLM2-6B 重磅发布,荣登 Hugging Face 趋势榜单之首!

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 具有更强大的性能、更长的上下文和更高效的推理。

了解更多: https://hf.co/THUDM/chatglm2-6b


以上就是上周的 Hugging News,新的一周开始了,我们一起努力!


相關推薦

2023-06-16

能公司宣布推出 70 亿参数量的中英文预训练大模型——baichuan-7B。 baichuan-7B 是由百川智能开发的一个开源的大规模预训练模型。基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口

2023-09-08

办法》备案,并面向全社会开放服务。用户可以登录 www.baichuan-ai.com,感受百川大模型在知识问答、文本创作等领域带来的全新体验。 成立仅四个月,百川智能便相继发布了三款通用大语言模型。百川智能称,截止今日,Baichuan

2023-10-18

占比近70%,研发人员占比超80%。 目前,百川智能已发布 Baichuan-7B/13B,Baichuan2-7B/13B 四款开源可免费商用大模型及 Baichuan-53B、Baichuan2-53B 两款闭源大模型,平均每 28 天发布一款新的大模型。 公告称,Baichuan-7B/13B两款开源大模

2023-08-24

科技媒体 The Information 的报道,开源模型库公司 Hugging Face 正进行一轮新的融资,本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在推特证实了这一消息。Hugging Face 此次融资预计将筹集约

2023-08-09

PyTorch 基金会宣布 Hugging Face 已加入为首要成员。与此同时,Hugging Face 开源负责人 Lysandre Debut 也成为了 PyTorch 基金会治理委员会的一员。 Hugging Face 是一个致力于降低机器学习和深度学习入门门槛的社区和公司,其模型

2023-05-06

Hugging Face 日前联合 ServiceNow 发布了一个免费的大型语言模型 StarCoder(150 亿参数),该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copilot 和亚马逊 CodeWhisperer 等基于 AI 的编程工具。 目前像是 GitHub Copilot 这

2022-11-21

更新内容 增加授权过期提醒 增加站点是否公开访问配置 优化API基类 优化站点信息API输出脱敏 优化单章节层级显示 优化热门作者,答主和问题 优化表单数据提交体验 修正学习记录active_time拼写错误 修正后台设

2022-09-16

索前沿开发技术,不断拓展知识技能。 Google 开发者在线课程由 Google 产品团队精心打造,覆盖 10+ Google 产品或服务,包含 130 + 个在线课程,200+ 个引导式编程练习 (Codelabs) ,帮助开发者快速掌握技术知识与技能。更多课程

2023-10-24

一起寻宝 AI 时代 根据 Yahoo 新闻的报道,人工智能公司 Hugging Face 发言人在周五的一封电子邮件中写道: 中国的人工智能社区非常出色,我们希望他们能更好地访问 HF,但目前我们对于政府的法规无能为力。 The Chinese AI

2023-08-05

IBM 宣布在 Hugging Face 上开源其 watsonx.ai 地理空间基础模型 -- 基于美国国家航空航天局 (NASA) 的卫星数据构建。这将是 Hugging Face 上最大的地理空间基础模型,也是首个与 NASA 合作构建的开源 AI 基础模型。 公告指出,作为与 NASA

2023-04-02

性能是 25 倍: 目前 NGPTL++ 已经上线了在线教程、视频课程以及实战项目,此外还有一套完整的社区生态,包括面向各个领域的开源库和框架,让开发者可以轻松地构建各种应用。 NGPTL++ 其它核心特性: 语法简洁易读:NGP

2023-06-01

更新内容 增加试卷全文检索 增加课程最后学习API 增加专栏文章付费 增加专栏学习记录 增加推荐课程|文章|考试widget 加强废除兑换码功能 去除课程打赏功能 错题|收藏题增加题型过滤 考试多选题漏选不得分

2023-09-07

新内容 消费队列常驻任务增加保持数据库链接逻辑 课程和时间增加标签属性 修正邮箱注册提交按钮不可用问题 去除删除远程COS文件逻辑 优化课程课件资料相关逻辑 修正后台添加问题标签为空报错问题 修正课程最

2022-12-14

演示系统配置低(1Core,1G,1M 跑多个容器)切莫压测 课程数据来源于网络(无实质内容)切莫购买 管理后台已禁止数据提交,私密配置已过滤 桌面端演示: 前台演示 后台演示 演示账号:[email protected] / 123456 (前