要文快报!阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

博主:admin admin 2024-07-09 08:06:44 21 0条评论

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

联想发布全栈算力基础设施新品,助力AI 2.0时代加速到来

北京,2024年6月14日 - 联想今日在北京隆重发布了全栈算力基础设施新品,包括服务器、存储、数据网络和边缘计算等领域的多款重磅产品。此次新品发布,旨在为客户提供更强大、更灵活、更高效的算力基础设施,助力其在AI 2.0时代实现数字化转型和智能升级。

以大模型为特征的AI 2.0时代已经到来,对算力基础设施提出了更高的要求。 联想此次发布的全栈算力基础设施新品,正是为满足AI 2.0时代的需求而精心设计。其中,率先搭载英特尔®至强® 6能效核处理器的联想问天WR5220 G5、联想ThinkSystem SR630 V4、联想ThinkSystem SD520 V4等服务器产品,能够提供业界领先的性能和能效,满足AI大模型训练和推理等高负载计算场景的需求。

联想还推出了全新NetApp AFF A全闪系列存储产品,以及救急1110灾备一体化解决方案和联想问天100G核心交换机等新品。 这些产品能够为用户提供高可靠、高可用、高安全的存储和数据网络解决方案,助力用户构建稳定高效的数字底座。

联想集团副总裁、中国基础设施业务群总经理陈振宽表示:“AI 2.0时代,联想将继续致力于为客户提供领先的算力基础设施解决方案,助力客户释放AI潜能,实现智能化转型。”

联想“一横五纵”战略架构助力AI 2.0时代

联想此次发布的全栈算力基础设施新品,是其“一横五纵”战略架构的重要组成部分。该战略架构包括:

  • 一横: 联想万全异构智算平台,旨在面向以大模型为特征的AI 2.0时代,统一纳管异构算力,极致提升智算效率。
  • 五纵: 服务器、存储、数据网络、软件及超融合、边缘基础设施产品和方案,形成了覆盖通用计算、科学计算、智能计算和边缘计算全场景的基础设施产品组合。

联想“一横五纵”战略架构,能够为客户提供全面的算力基础设施解决方案,助力客户在AI 2.0时代实现数字化转型和智能升级。

联想全栈算力基础设施新品发布,标志着联想在AI 2.0时代迈出了重要一步。 联想将继续致力于为客户提供领先的算力基础设施解决方案,助力客户释放AI潜能,推动各行各业的智能化转型。

以下是本次发布的部分新品介绍:

  • 联想问天WR5220 G5服务器: 率先搭载英特尔®至强® 6能效核处理器,提供业界领先的性能和能效,满足AI大模型训练和推理等高负载计算场景的需求。
  • 联想ThinkSystem SR630 V4服务器: 适用于通用计算、虚拟化、高性能计算等场景,提供卓越的性能、可靠性和可扩展性。
  • 联想ThinkSystem SD520 V4服务器: 适用于存储、数据分析、备份等场景,提供高密度、高可用性和高扩展性。
  • NetApp AFF A全闪系列存储产品: 提供全闪存存储解决方案,满足企业对高性能、高可靠性和高可用性的存储需求。
  • 救急1110灾备一体化解决方案: 提供简单、快速、可靠的灾备解决方案,帮助企业保护关键业务数据。
  • 联想问天100G核心交换机: 提供高性能、高可靠性、高扩展性的核心网络解决方案,满足数据中心网络升级的需求。

联想全栈算力基础设施新品现已上市,欢迎垂询。

The End

发布于:2024-07-09 08:06:44,除非注明,否则均为正初新闻网原创文章,转载请注明出处。