今天,在商汤科技「大爱无疆·日日新」人工智能论坛上,我们看到升级版的「商汤日日新SenseNova」大模型体系。
而一系列模型和应用也都在最近2-3个月内实现了进一步飞速提升。
最受关注的千亿级参数的语言大模型商汤「商量SenseChat 2.0」,多项能力全面提升,而且搭建了完善的基模型体系与大小模型系统级方案。
突破了大语言模型输入长度的限制
新增地区语言支持(阿拉伯语、粤语等)
推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求
新增知识库接口,基于知识库能力优化模型幻觉
支持超长文本,能力全方位升级
在产品发布环节,商汤科技董事长兼CEO徐立,展示了「商量SenseChat 2.0」强大的超长文本理解能力。面对超过6000词的超长英文文本,不但可以准确理解,提炼、归纳中文概要。并且基于理解,它还可以通过多轮对话形式进行输出。
商量还能完美执行用户的多轮指令,例如按照顺序提出要求1、策划活动2、提供时间计划3、计划整理成表格4、处理表格,它都能够有效执行。
值得一提的是,「商量SenseChat 2.0」还能够理解表格化的信息,并准确提取其中的信息。
如果你需要一份旅行计划,也可以提供描述让「商量SenseChat 2.0」帮你进行生成,甚至可以以表格形式来展示出来。
在传统的文案生成和写作部分,「商量SenseChat 2.0」也完全不让人失望,让人不得不感叹AI的创造力。
我们看到「商量SenseChat 2.0」可以根据事件描述,提取关键信息、理解事件逻辑,并按照要求生成文案和报告。
除了作为工具使用,「商量SenseChat 2.0」还可以成为很好的伙伴,比如它能够理解隐喻。以下是面对同一个问题,商量给出的两种不同角度思考。
AI代码助手:精度超越GPT-3.5
随着在大模型体系在底层技术领域的快速迭代,商汤「日日新SenseNova」大模型体系及模型和应用,已经开始运到大量行业,包括金融、医疗、汽车、程序编写等等方面。其中AI代码助手吸能全面提升,精度超越GPT-3.5。
当我们体验「商量SenseChat 2.0」,发现它也能准确够理解和生成代码,表现出色。
可挂载知识库,专业能力过硬
除了日常办公,在专业领域大模型也是一把好手。
在金融领域,接入「商量SenseChat 2.0」大语言模型能力后,不但能提供投研分析、研报撰写等新功能。
并且挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型「大医」,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。
未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。
拥有开放世界理解,解决各种长尾问题
在商汤企业论坛上,徐立还展示了「商量SenseChat 2.0」应对开放世界的理解能力,比如能够理解各类图像信息,并且提供分析和建议。
实际业务应用中,大模型对开放世界的理解,可以用在城市管理等众多行业领域和场景,例如应对城市自行车摆放这类的长尾场景。
面对源源不断的真实世界需求,在智能涌现的全新技术浪潮下,商汤正在以大算力和大模型构建的基础上不断创新,探索人工智能规模化应用和发展的路径。
大模型的根本价值是重构生产力模式,为人工智能产业落地带来范式革新,真正实现「日日新、又日新」。