刘强东数字人直播首秀,“采销东哥”是如何炼成的?

刘强东数字人直播首秀,“采销东哥”是如何炼成的?

东哥带货,你买了吗?

 

只不过昨晚走进直播间的,不是刘强东本人,而是他的AI数字人。

 

4月16日6点18分,数字人东哥准时上线京东家电家居采销直播间,半个多小时里,吸引1200多万人观看。“东哥”一口气介绍了多种家电,海信、创维、TCL品牌的多款电视,以及美的、奥克斯、华凌等多款空调,期间抽奖送福利不断。

 

图片

 

近日,刘强东回应了网友喊话“请东哥出来直播”的号召,决定以数字人的形式在直播中与大家见面,并将直播首秀选择在京东家电家居和京东超市的采销直播间同时进行。直播开始前,就已有上百万网友围观。此前一天,京东官方发布了预热视频,不少网友笃定视频中不是AI,“这么多小动作,肯定是真人!”

 

 

图片

讲话时偶尔搓动手指

“采销东哥”AI数字人是如何练成的?

 

在4月16日的直播首秀中,“采销东哥”AI数字人一改刘强东以往坚忍不拔的拼搏风格,让网友们看到了他的另一面:谈笑自若,聊自己在运动、烹饪方面的心得,还对直播带货的大屏电视、一日三餐的健康搭配滔滔不绝,成为当天京东直播的“首席采销”。

 

不少网友惊叹,“采销东哥”AI数字人近乎百分百还原了东哥的表情、姿态、手势、音色,即便是数字分身也能拥有鲜活的生命力。不仅要“形似”,更要“神似”,数字人作为人类形象的模仿和延伸,这是怎么做到的?

 

“‘采销东哥’AI数字人是由京东云言犀制作的。大模型会注意捕捉和呈现东哥的习惯性表情和动作,比如在讲话时偶尔搓动手指,强调某件事时会配合更大幅度的手部动作,还有时不时地点头等。”京东相关负责人介绍说,AI数字人其实更具挑战的是声音还原,听过东哥讲话的人,对他的宿迁口音印象深刻,会发现他语速比较快,吐字比较轻,有些词语会习惯连读,他对“时间”“正是”中的“sh”发音带有重鼻音,还喜欢称呼“兄弟们”鼓舞大家的士气……

 

据了解,要让数字人说好普通话并不难,但要让“采销东哥”AI数字人说好“宿迁普通话”,学习本人的发音习惯并不容易。比如要不要加鼻音,哪里要连读,就需要大模型给出准确判断。这背后依托了京东言犀大模型对形象与声音的不断学习与训练优化。

 

京东相关负责人还透露,为了让声音更适合直播带货,以及把“兄弟们”这样的口头禅用在合适的地方,京东云言犀团队对这些细节进行了模型调优。他们起初“喂”给大模型的演讲素材,虽然充满激情、爆发力强,但过于正式。为此,他们用最新录制的闲谈作为主要素材,其中有东哥娓娓道来生动的旅行经历,再提取5分钟演讲的韵律特征灌给大模型,通过不断优化,最终塑造出“采销东哥”AI数字人亲切自然、贴近用户的声音。

 

图片

训练时被“喂”入5万小时语音数据

京东云言犀数字人已服务超4000家品牌直播间

 

“采销东哥”AI数字人诞生背后,离不开京东云言犀多年的技术深耕与积累。

 

据了解,言犀语音大模型在训练时,被“喂”入5万小时海量鲜活的语音数据,这让言犀数字人可以智能匹配不同直播风格,比如用沉稳的音色营造专业的氛围,又或者用极具感染力的声音吸引用户下单,还赋予言大姿态肢体表现。实验表明,绝大部分用户在120秒内难以察觉这是数字人。

 

言犀数字人在零配置基础上,覆盖了直播间70%的常见问询,还能借助大模型智能问答调优助手自我迭代。一方面根据商详页与脚本自动生成问答,一方面直播结束后自动补足没有覆盖的知识点,高效、实时地回答海量咨询。比如,他能像精通业务的资深导购那样,当有人提问“有没有适合女生的公路自行车”或“有没有适合大学生的手机”时,给出适合的商品推荐,应答准确率超90%。

 

令人惊讶的是,如果直播时有缺货商品,直播中控台将如同言犀数字人的“大脑”,及时调整直播话术,比如跳过缺货的商品,或为爆品增加讲解频率。还能监测直播间交互是否过于频繁,并调整交互频次和机制,确保顺利。

 

据悉,目前京东云言犀数字人已服务超4000家品牌直播间。自去年7月,京东发布言犀大模型,以其为基座,京东陆续推出了近100种创新应用,包括京东智能导购助手“京言”、医疗健康大模型“京医千询”、京东物流超脑、京东智能客服、京小智、言犀多模态数字人,通过底层算力到模型服务与AI平台的全栈技术创新,服务平台运营、专业品类知识增强、消费体验优化、决策成本降低、智能搜推、商家带货转化等场景。

 

图片

百度创始人李彦宏同日因AI亮相

 

巧合的是,同样在4月16日,百度创始人李彦宏也再次活跃在公众视线中,为自家技术应用站台。在Create2024百度AI开发者大会上,李彦宏强调了未来AI应用发展的一个重要趋势,并连发多款AI开发工具,给出“开源模型会越来越落后”的判断。

 

图片

 

李彦宏发表了“人人都是开发者”的主题演讲,他表示,AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。会上,百度正式发布文心大模型4.0的工具版。使用者可以在工具版上体验代码解释器功能,通过自然语言交互,实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效和精准的支撑。

 

李彦宏说,大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求,“这是百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”

 

图片

企业家直播成为潮流

 

其实不只是刘强东,这几年,企业家们亲自下场为自家产品站台已经渐渐成为潮流。小米集团CEO雷军今日也发文宣布:计划将于4月18日下午4点开场直播。

 

这也不是雷军第一次直播,早在两年前的小米十周年之际,雷军就开启了首场抖音直播带货,一举晒出20款小米爆品,不到2小时,支付金额破亿元。

 

就在3月14日,蔚来创始人、董事长、CEO李斌也在社交平台开启直播首秀。一场直播累计观看人数超过1000万,同时在线人数超10万。

 

360集团创始人周鸿祎更是直言,企业家都应该当网红,人们大脑已被短视频和直播格式化,企业没网红发产品都没人知道。

 

和以往大佬的直播有所不同,刘强东的这场直播采用的是数字人直播的形式,背后运用了京东云言犀自研的AI驱动大姿态数字人技术。这可能是业内首创大佬数字人直播,也让话题“数字人直播能取代真人直播吗”再次引发探讨。有网友觉得数字直播形式新颖,减少成本,也有人觉得数字人直播少了亲和力和实时互动的有趣。

元宇宙投融邦 元宇宙投融邦
0
0
发布评论
后可评论
0/1000
全部评论

暂无评论,来抢沙发

猜你喜欢 换一批
数据加载中,请稍候...