千亿大模型商量2.0现场体验!迭代3个月,代码生成精度超GPT-3.5

千亿大模型商量2.0现场体验!迭代3个月,代码生成精度超GPT-3.5

今天,在商汤科技「大爱无疆·日日新」人工智能论坛上,我们看到升级版的「商汤日日新SenseNova」大模型体系。

而一系列模型和应用也都在最近2-3个月内实现了进一步飞速提升。

最受关注的千亿级参数的语言大模型商汤「商量SenseChat 2.0」,多项能力全面提升,而且搭建了完善的基模型体系与大小模型系统级方案。

突破了大语言模型输入长度的限制

新增地区语言支持(阿拉伯语、粤语等)

推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求

新增知识库接口,基于知识库能力优化模型幻觉

支持超长文本,能力全方位升级

在产品发布环节,商汤科技董事长兼CEO徐立,展示了「商量SenseChat 2.0」强大的超长文本理解能力。面对超过6000词的超长英文文本,不但可以准确理解,提炼、归纳中文概要。并且基于理解,它还可以通过多轮对话形式进行输出。

商量还能完美执行用户的多轮指令,例如按照顺序提出要求1、策划活动2、提供时间计划3、计划整理成表格4、处理表格,它都能够有效执行。

值得一提的是,「商量SenseChat 2.0」还能够理解表格化的信息,并准确提取其中的信息。

如果你需要一份旅行计划,也可以提供描述让「商量SenseChat 2.0」帮你进行生成,甚至可以以表格形式来展示出来。

在传统的文案生成和写作部分,「商量SenseChat 2.0」也完全不让人失望,让人不得不感叹AI的创造力。

我们看到「商量SenseChat 2.0」可以根据事件描述,提取关键信息、理解事件逻辑,并按照要求生成文案和报告。

除了作为工具使用,「商量SenseChat 2.0」还可以成为很好的伙伴,比如它能够理解隐喻。以下是面对同一个问题,商量给出的两种不同角度思考。

AI代码助手:精度超越GPT-3.5

随着在大模型体系在底层技术领域的快速迭代,商汤「日日新SenseNova」大模型体系及模型和应用,已经开始运到大量行业,包括金融、医疗、汽车、程序编写等等方面。其中AI代码助手吸能全面提升,精度超越GPT-3.5。

当我们体验「商量SenseChat 2.0」,发现它也能准确够理解和生成代码,表现出色。

可挂载知识库,专业能力过硬

除了日常办公,在专业领域大模型也是一把好手。

在金融领域,接入「商量SenseChat 2.0」大语言模型能力后,不但能提供投研分析、研报撰写等新功能。

并且挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。

在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型「大医」,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。

未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。

拥有开放世界理解,解决各种长尾问题

在商汤企业论坛上,徐立还展示了「商量SenseChat 2.0」应对开放世界的理解能力,比如能够理解各类图像信息,并且提供分析和建议。

实际业务应用中,大模型对开放世界的理解,可以用在城市管理等众多行业领域和场景,例如应对城市自行车摆放这类的长尾场景。

面对源源不断的真实世界需求,在智能涌现的全新技术浪潮下,商汤正在以大算力和大模型构建的基础上不断创新,探索人工智能规模化应用和发展的路径。

大模型的根本价值是重构生产力模式,为人工智能产业落地带来范式革新,真正实现「日日新、又日新」。

新智元 新智元
0
0
发布评论
后可评论
0/1000
全部评论

暂无评论,来抢沙发

猜你喜欢 换一批
数据加载中,请稍候...