微信扫一扫
关注协会公众号
当前位置: 首页>>会员专区>>会员动态
三代科学家共话大模型未来,商汤与上海AI实验室等重磅发布“书生通用大模型体系”
发布日期: 2023-08-01 09:40:33 预览次数: 88次

4位图灵奖得主,1位诺奖得主,80余位国内外院士出席,1400余位重量级嘉宾齐聚……第六届世界人工智能大会(WAIC 2023)点“燃”魔都。


640 (6).jpg


7月6日上午,大会开幕式上,商汤科技董事长兼CEO徐立博士受邀出席并主持“创想共论·智变可能”圆桌对话,与图灵奖得主、上海期智研究院院长姚期智院士,清华大学交叉信息学院助理教授袁洋,清华大学交叉信息研究院助理教授、Moonshot AI创始人杨植麟,南洋理工大学计算机科学与工程学院助理教授、DragGAN第一作者潘新钢,就人工智能的发展与突破,展开精彩对话,探讨了包括“大模型核心理论研究突破、多模态对大模型的优化、算法安全及算法的发展路线选择”等诸多前沿话题,引发广泛思考。


同时,商汤位于上海世博展览馆H2-A101的超酷AI展区也迎来火爆参观客流,大量“AI好者”惊呼amazing!下面请看一段现场报道:


▎与上海AI实验室等发布“书生通用大模型体系”


WAIC 2023大会首日,在开幕式和科学前沿全体会议上,商汤科技与上海人工智能实验室联合香港中文大学、复旦大学、上海交通大学及清华大学发布全新升级的“书生通用大模型体系”,包括:“书生·多模态”、“书生·浦语”和“书生·天际”三大基础模型,以及首个面向大模型研发与应用的全链条开源体系。


640 (7).jpg


其中,“书生·多模态”大模型无缝整合了语言、图像、视频等多种模态,包含200亿参数,使用80亿多模态样本训练。


“书生·多模态”首次实现通过自然语言定义视觉任务,实现开放世界理解,支持多模态生成和跨模态交互,并支持350万语义标签的识别和理解,覆盖开放世界常见的类别和概念。目前,书生体系在80多种多模态和视觉评测任务中性能领先。


640 (8).jpg

“书生”根据张大千《湖山清夏图》创作的七言绝句


升级后的 “书生·浦语”是国内首个正式发布的支持8K语境长度的千亿参数级语言大模型,在包含1.8万亿token的高质量语料上训练而成。


相比6月首次亮相,书生·浦语在一个月内已完成一次全面升级,包括:具备了理解长输入、展开复杂推理,以及进行长时间多轮对话的能力;支持20多种语言,还可通过表格和图表等方式汇总和呈现复杂信息;数理逻辑能力明显进步,大幅提高了数值计算、函数运算、方程求解等数理能力;可以更可靠地遵循人类指令,安全性得到明显改善。 


640.png


多维度能力全面提升,在42个主流评测集上性能明显提升,在其中35个评测集上性能超越了ChatGPT


在全面升级同时,书生·浦语还正式开源一个70亿参数的轻量级版本InternLM-7B。InternLM-7B在包含40个评测集的全维度评测中性能表现卓越、均衡,全面领先现有开源模型。特别在两个被广泛采用的基准MMLU和CEval上分别取得50.8 和52.8高分,刷新了7B量级模型世界纪录。


此外,书生·浦语还开源了贯穿数据、预训练、微调、部署和评测五大环节的全链条工具体系。

(https://github.com/InternLM)


“书生·天际”是全球首个城市级NeRF实景三维大模型,具备千亿参数,在全球首次实现对100平方公里范围进行城市实景建模,分辨率精度可达4K,并支持对全范围的高精度实时渲染以及城市级编辑、风格化转换等功能。


“书生通用大模型体系”凭借更全面的通用化能力,覆盖模态和任务更广,将为科研创新提供更好支持,更快加速产业应用的智能化进程。


▎深度参与大会,让AI发展引领未来


商汤科技连续第六年深度参与WAIC。


在上海世博展览馆和徐汇滨江分会场,商汤科技基于先进的视觉、语言、决策等大模型能力,为WAIC大会专门打造数字人AI新闻官,以逼真自然的表情、动作,并结合丰富的语料素材库和大语言模型泛化能力,为参会嘉宾提供引导服务和会议介绍。


640 (9).jpg


商汤还受邀出席“算网一体 融创未来”行业论坛,参与了中国电信大模型生态合作联盟启动仪式。同时,商汤科技副总裁林洁敏发表演讲,生动形象地回顾了人工智能发展史和最新应用,展现了人工智能绚丽多彩的创造力和想象力。


AI创新带来无限想象,商汤科技将持续快速推进新技术研发和落地应用。