【短讯】直击WAIC2023|业内顶流共话生成式AI,大模型不仅是技术基础设施,更是触达用户的产品

时间:2023-07-09 08:05:08 来源: 开利财经


(资料图片仅供参考)

7月9日讯(记者 陈美)当前,引领新一代AI浪潮的大模型开始发挥巨大影响力,并正从研究实验室走向产业界。在此背景下,2023世界人工智能大会(WAIC)启明创投论坛“生成式AI与大模型:变革与创新”顺利举行。作为中国最早关注且活跃在AI领域的创投机构之一,启明创投在芯片、底层基础软件、基础模型以及下游垂类应用等AI产业生态链领域有着深刻思考。启明创投的合伙人周志峰认为,大模型和生成式AI正引领当前最大的一波科技新浪潮,明确的信号来自Stable Diffusion、ChatGPT、Midjourney和Copilot等技术和产品显示出的爆发式用户采纳度,和其背后企业史无前例的高人均产出。周志峰称,大模型的“第一性原理”是大规模压缩人类世界所有的数字信息。“算力、算法和数据,在过去40年的累积与发展,一同推动今天生成式AI的爆发,基础架构层、模型层和应用层的企业都得到快速发展的机会。”“AI新浪潮带来新的产品形态,大模型不仅仅是技术基础设施,而是触达用户的产品——用户+模型=应用。创投视角下的+AI和AI+两种模式的公司,都在迎来快速发展。但面对产业巨头和大模型公司的边界扩张,创业企业需要寻找自己的黄金通道。”会上,周志峰表示,启明创投识别出AI 2.0已经跨过技术奇点的信号,在市场引爆点来临前提前布局了多家大模型企业。”周志峰谈到,预训练大模型是新一代人工智能应用的基础设施,训练高精度千亿中英双语稠密模型,对大模型研究和应用有重大意义。清华大学教授唐杰在演讲中谈及了AGI的发展历程,表示自2019年开始,超大规模知识图谱和超大数据的大模型,为认知智能未来提供了核心支撑。他认为,经过不断研发,2022年训练的千亿基座模型为后续研发工作提供了坚实基础。其中,ChatGLM-6B模型在开源后,至今已超过300万次下载,并被《中国人工智能大模型地图研究报告》评为大模型开源影响力第一名。未来将继续探索认知大模型的前沿,逐步解锁In-context 、环境交互与自我优化,和自反思学习等能力。而在大模型、多模态显著拉动了算力基础设施需求的这一背景下,启明创投合伙人叶冠泰与壁仞科技合伙人梁刚博士展开对话,双方探讨了高性能通用GPU如何支撑中国大模型训练与推理。梁刚博士指出:壁仞科技BR100芯片的BF16算力达到512 TFLOPS,在业界是领先的,并支持TF32、BF16、INT8等多种数据精度,其中INT8的算力可达到1024TOPS。此外,带宽方面壁仞科技自主研发的BLINK能够支持单机8卡互联,另外通过IB网卡实现多机多卡高速互联。壁仞科技SUPA的软件生态已经建成,已经支持数个大模型和训练与推理框架,并适配了多个大模型算法。不过,梁刚博士也坦言:半导体行业没有捷径可言,因此壁仞科技会持续专注于产品研发和与用户的合作,踏踏实实做事,最后用产品说话。在梁刚博士看来,倾听客户需求是重中之重,在硬件方面,壁仞科技将关注算力、显存、带宽、集群互联和安全上的需求;在软件上,壁仞科技会与合作伙伴和客户形成‘应用-优化-反馈-迭代’的循环,不断提高自己。叶冠泰则表示,大模型时代,训练千亿参数、万亿参数的模型,必不可少的就是算力,大模型参数规模的高速增长对GPU的能力不断提出更高要求。“大算力的GPU要支撑各种各样的模型,需要具备稳定性、扩展性、延迟控制、性价比等,展现出典型的“木桶理论“,而且大算力芯片的推广,需要整个上下游的生态支持。

标签:

相关文章

四川11人被骗偷渡出境“挣大钱” 主犯被判刑2年

成都4月23日电 (吴平华 黄静)近日,四川资阳市公安局临空经济区分局破获了一起11人偷越国边境案,目前...

来源:2022-04-24

全民战疫要坚持的12个健康生活细节

全民战疫,细节制胜!4月21日,上海市健康促进委员会办公室、上海市健康促进中心向全体市民发布倡议书,...

来源:2022-04-24

中国青少年儿童身心健康教育管理委员会正式成立

北京4月23日电 (记者 高凯)23日,中国青少年儿童身心健康教育管理委员会在北京会议中心正式成立。 当日...

来源:2022-04-24

吉林省遭遇“沙尘周” 局地瞬时风力超10级

长春4月23日电 (记者 郭佳)23日,狂风卷着沙土在吉林省多地肆虐。记者从吉林省气象台获悉,这是该省入...

来源:2022-04-24

青海西宁解“静”首日见闻:解“静”不解防

西宁4月23日电 题:青海西宁解“静”首日见闻:解“静”不解防 作者 祁增蓓 23日上午,位于青海省西宁...

来源:2022-04-24

精彩推送