一周纵览
本周大模型厂商们依旧表现活跃。硅谷大厂方面,Meta更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GPT-4,引发众多猜测后被Mistral联合创始人证实,是此前一款公开的量化模型被泄露。字节跳动本周上线了国内版Coze,支持一键生成AI Bot,同时开放了GPT商店。另外,商汤、面壁智能、科大讯飞、百川智能等厂商本周也更新了大模型。
另外脑机接口也有了重要历史进展,马斯克的脑机接口公司Neuralink完成了公司首例人脑植入手术。据马斯克透露,患者目前恢复情况良好,目前还有数千人正在排队,首批患者将是四肢功能受损的用户。
此外,一直备受关注的苹果Vision Pro本周正式开售,OpenAI已为其上线Vision Pro版ChatGPT。
Key Points
Meta发布编程模型Code Llama 70B
Mistral CEO确认新模型性能接近GPT-4
字节Coze国内版上线,30秒即可定制AI机器人
商汤发布日日新SensNova 4.0,同时推出数据分析工具“办公小浣熊”
面壁智能发布2B模型,推理成本仅为GPT-4的1/360
科大讯飞发布全民开放大模型星火V3.5
百川智能发布Baichuan 3大模型,更好理解中文
阿里巴巴开发的自主多模态AI代理MobileAgent上线
苹果Vision Pro正式在美开售,库克称将很快登陆中国
脑机接口公司Neuralink完成首例人脑植入手术
Hugging Face推出可定制AI个人助手
苹果发布2024年Q1财报,库克称AI是“巨大的机会”
微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元
360 AI搜索移动App已上线
Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创
人形机器人初创公司Figure AI与微软、OpenAI进行融资谈判
初创公司Korea.AI完成1.5亿美元融资
OpenAI推出Vision Pro版ChatGPT
Google宣布为聊天机器人Bard升级Gemini Pro模式
Midjourney更新Niji V6模型
文心一言上线数字分身新功能
亚马逊推出AI购物助手Rufus
Shopify推出了一个基于人工智能的图像编辑器
微软发布SliceGPT,大幅降低大模型运行的资源
复旦大学发布NLP大模型论文,让大模型说出“我不知道”
大模型第一线
Meta发布编程模型Code Llama 70B
1月30日,Meta正式上线Code Llama 70B,Code Llama是基于Llama 2开发的,专门用于编程任务的版本。该模型在5000亿个字节的代码和数据基础上训练,可以处理和生成较长的代码序列,是Code Llama系列中规模最大,性能最强的版本。另外,Code Llama 70B使用了一种名为自我关注的技术来理解代码结构,适用于 Python、C++、J等多种语言。在HumanEval基准测试中,它的准确率为53% ,接近于GPT-4的67% 。
Mistral CEO确认新模型性能接近GPT-4
2月1日,Mistral联合创始人兼CEO Arthur Mensch在X上表示,引发众多猜测的“miqu-1-70b”是公司一款老模型的量化版本,曾公开训练和分发,被一位过于热心的早期客户员工泄露了。此前,一位名为“Miqu Dev”的用户在Hugging Face上传了一系列文件,组成了一个新的LLM模型“miqu-1-70b”。用户发现该模型在常见LLM任务中表现出色,跑分接近GPT-4,其来源引发了众多猜测。
字节Coze国内版上线,30秒即可定制AI机器人
2月1日,字节跳动正式上线国内版Coze,这是一款AI聊天机器人构建平台,能够快速创建、调试和优化AI聊天机器人的应用程序。支持30秒无代码生成AI Bot,并且集成了插件工具集,满足用户的个性化需求。另外,Coze也对大众开放了GPT商店,目前已上线30款Bots。2023年12月底,Coze就低调地先在海外上线了,这也是继豆包之后,字节在国内正式推出的第二款AI对话应用。
△Coze使用界面
商汤发布日日新SensNova 4.0,同时推出数据分析工具“办公小浣熊”
2月2日,商汤发布了日日新SenseNova 4.0,升级后的模型知识覆盖更全面、推理能⼒、长⽂本理解力、数字推理能⼒和代码⽣成能⼒均有提升,并⽀持跨模态交互,128K语境窗口长度。据官方数据,综合整体评测成绩水平比肩GPT-4。同时,商汤还发布了⽇⽇新·商量大语言模型Function call & Assistants API版本,支持不同模态工具调用,并基于此推出落地数据分析工具“办公小浣熊”。
面壁智能发布2B模型,推理成本仅为GPT-4的1/360
2月1日,面壁智能发布端侧大模型MiniCPM-2B,聚焦于适配端侧硬件,该模型训练数据规模近1T、参数规模仅2B。成本较低是2B模型的优势之一,目前MiniCPM-2B在CPU(比GPU计算吞吐量低)上就能跑起来,相较于用GPU才能运行的大模型,能够降低推理成本。据官方数据,MiniCPM的推理成本仅Mistral的1/100,GPT-4的1/360。
科大讯飞发布全民开放大模型星火V3.5
1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。科大讯飞称,V3.5基于全国产化算力底座飞星一号”平台打造,是首个基于全国产化算力平台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。
百川智能发布Baichuan 3大模型,更好理解中文
1月29日,百川智能发布超千亿参数的大语言模型 Baichuan 3,基于“RLHF(基于人类反馈的强化学习)、RLAIF(基于AI反馈的强化学习)以及迭代式强化学习方法,强化了对中文的理解。据官方数据,Baichuan 3在多个通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中表现良好,中文任务上超越了GPT-4,尤其擅长医疗和诗词创作。
阿里巴巴开发的自主多模态AI代理MobileAgent上线
1月31日,阿里团队上线了MobileAgent,这是一个可以模拟人类操作手机的自主多模态AI代理。同时,MobileAgent是一个纯视觉解决方案,不需要系统代码,而是通过分析图像来理解和操作手机。能够自主完成打开淘宝找帽子添加到购物车,播放音乐,自主使用导航APP等任务。
大事件
苹果Vision Pro正式在美开售,库克称将很快登陆中国
美国东部时间2月2日晚8点,苹果Vision Pro头显正式开售。苹果提供了256GB、512GB、1TB三种可选规格,其售价为3499美元。参数方面,Vision Pro头显重600–650g,可插电全天使用,也支持外接电池。首批Vision Pro将在美国上市,库克当日在接受媒体采访时表示,计划很快在中国市场上市Vision Pro。
脑机接口公司Neuralink完成首例人脑植入手术
1月30日,马斯克在社交媒体X上宣布,脑机接口公司Neuralink完成首例人脑植入手术,植入患者体内的产品名为“心灵感应”(Telepathy)。目前接种者恢复情况良好,初步结果显示,神经元尖峰检测(neuron spike detection)前景良好。Neuralink是马斯克旗下脑机接口公司,2023年美国食品药品监督管理局批准了Neuralink对其设备进行人体试验,马斯克还透露,四肢功能受损的人将是Neuralink的首批使用者。
Hugging Face推出可定制AI个人助手
2月3日,Hugging Face宣布推出可定制的AI个人助手Hugging Chat Assistants,新功能使用户可以在Hugging Chat(类似ChatGPT的开源聊天助手)中免费创建个性化AI助手,并开源了代码。同时,Hugging Face还为用户提供多种模型和框架的选择自由。
苹果发布2024年Q1财报,库克称AI是“巨大的机会”
2月1日,苹果发布24Q1财报,由于去年第四季度iPhone在华销量下降了“中等个位数”等原因,公司总收入将低于华尔街预期60亿美元,苹果股价在盘后交易中下跌3% 。同时,库克在周四的电话会议上还谈到了生成式人工智能,称这是一个“巨大的机遇,公司内部正在开展大量工作”,但他计划在今年晚些时候公开讨论这个问题。
微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元
据路透社1月31日报道,微软、谷歌母公司Alphabet、半导体公司AMD发布的财报未能“惊艳”投资者,导致人工智能AI相关企业30日收盘总市值蒸发了1900亿美元(约合1.3万亿元人民币)。其中,AMD第一季度营收未达预期,导致其股价下跌6%,Alphabet股价下跌5.6%,芯片制造商Advanced Micro股价下跌6%。
360 AI搜索移动App已上线
1月29日,360集团全新升级的大模型搜索产品”360 AI搜索”移动App日前正式上架多个安卓应用商店中,版本为1.0.0。当用户在360AI搜索中输入任何问题时,都会触发一系列复杂的处理流程,包括进行问题分析、网页检索、重新匹配排序、提取内容等流程,最终会根据用户的问题生成逻辑清晰、追根溯源的答案。(钛媒体)
融资动态
Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创
据The information 2月1日消息,Sam Altman的弟弟Jack Altman已经通过他的风投公司Alt Capital募集了1.5亿美元的风险基金,用于投资早期创业公司。该基金计划在初创企业成立后立即领导或共同领导投资,重点关注企业软件,包括人工智能初创企业。马克斯曾是Alt Capital的投资者,目前正在单独筹集自己的风险基金。
人形机器人初创公司Figure AI与微软、OpenAI进行融资谈判
据彭博社援引知情人士透露, 机器人初创公司Figure AI正在洽谈新一轮融资,由微软和OpenAI领投,本轮融资预计筹集高达5亿美元的资金。在一个正在讨论的方案中,微软投资约9500万美元,OpenAI投资500万美元,Figure AI目前还在寻找更多投资者。
初创公司Korea.AI完成1.5亿美元融资
1月30日,初创公司Korea. AI宣布完成了新一轮1.5亿美元融资,投资方包括FTV Capital、 Nvidia、 Vistara Growth、 Sweetwater PE、 NextEquity、 Nicola和Beedie。Korea. AI开发面向企业客户的对话式人工智能和GenAI产品,向企业提供无代码平台。
新玩意
OpenAI推出Vision Pro版ChatGPT
2月3日,ChatGPT官方账号在社交媒体X上宣布推出了为苹果Vision Pro定制的新版本,用户现在可以在visionOS商店中下载ChatGPT。官方视频显示,Vision Pro版ChatGPT支持聊天问答和图像生成。
Google宣布为聊天机器人Bard升级Gemini Pro模式
2月1日,Google宣布其聊天机器人Bard将在全球范围内采用Gemini Pro模式,并支持40多种语言,升级后,Bard在理解和总结内容、推理、头脑风暴、写作和计划方面表现会更好。同时,Google还发布了新的AI图像生成工具ImageFX以及音乐生成工具MusicFX。
Midjourney更新Niji V6模型
1月30日,Midjourney宣布更新Niji V6模型,Niji V6模型是专门为动漫设计的版本,目前用户已经能够在Discord上体验到Niji V6。新版本发布后,大量涌入的用户还导致Midjourney短暂宕机。根据数字生命卡兹克的测评,与Niji V5相比,Niji V6在风格化程度上有所降低,但在模型细节和质量上有大幅的提升。
△图源:数字生命卡兹克
文心一言上线数字分身新功能
2月1日,文心一言宣布将于2月2日起上线数字分身新功能,面向全体用户免费开放。新功能使用门槛较低,用户只需一张照片、录制三句语音,即可创建专属数字分身,并且支持个性化定义名称、声音、MBTI性格等。
亚马逊推出AI购物助手Rufus
2月1日,亚马逊宣布推出一款名为Rufus的AI购物助手,新工具将面向美国的一部分测试用户推出,然后在未来几周扩展到更多用户。Rufus接受过亚马逊产品目录和网络信息方面的训练,能够在聊天过程中为用户寻找产品、进行产品比较以及提供购买建议。
Shopify推出了一个基于人工智能的图像编辑器
1月31日,电商平台Shopify发布了冬季版的新功能,包括一个人工智能驱动的媒体编辑器,以增强产品图像,改进的语义搜索和更好的方式为商家展示产品的不同维度,并且支持7种编辑风格。自去年以来,包括 Meta、谷歌和亚马逊在内的许多公司已允许广告商利用生成性人工智能生成背景。
前沿研究
微软发布SliceGPT,大幅降低大模型运行的资源
1月30日,微软联合苏黎世联邦理工学院发布了论文,提出一个名为SliceGPT的方法。SliceGPT通过删除权重矩阵中的行和列来降低网络的嵌入维数,有效降低大模型所需资源,同时保持较高的模型性能。这也意味着SliceGPT可以运行在更少的GPU上,同时运行速度更快。
△SliceGPT原理
论文地址:
https://arxiv.org/abs/2401.15024
项目地址:
https://github.com/microsoft/TransformerCompression
复旦大学发布NLP大模型论文,让大模型说出“我不知道”
2月1日,复旦大学研究团队发布论文《Can AI Assistants Know What They Don’t Know?》。通过构建Idk数据集(基于现有的开放领域问题回答数据集),团队评估AI助手对某个问题的多次回答的平均准确性来确定它是否知道答案。实验结果表明,经过与Idk数据集对齐后的AI助手能够拒绝回答大多数它不知道的问题。对于它尝试回答的问题,准确率显著提高。
△Idk数据集原理
论文链接: