文|乐乐 。入驻
今日 ,视频手机无线蓝牙耳机(TWS)现已成为人人都用得起的多模的新产品 。 。态成
但退回到9年前,智能终端战场苹果AirPods是入驻全球榜首款实在意义上的无线蓝牙耳机。靠着自研并申请专利的视频手机Snoop监听技能,苹果处理了蓝牙耳机左右延时和能耗纷歧的多模的新问题 。由此,态成AirPods吃下了2016-2018年的智能终端战场大部分商场,直到两年后其它厂商才学会相似技能 。入驻
靠技能盈利取胜,视频手机是多模的新苹果的经典操作,也是态成今日的手机厂商们在苹果身上学到的重要一课。
关于近两年的智能终端战场手机商场来说,AI无疑便是搅动手机商场的关键技能变量。
为了找到AI技能落地的杀手级功用 ,从Agent、AI修图到AI问答,智能终端在做的作业便是在AI生态上尽或许做各式各样的加法。
在高度同质化的AI手机赛道,手机厂商们亟需找到立异的AI技能落地功用。而荣耀 ,正在悄然拿下多个首发优势。
在近期荣耀400的发布会现场,图生视频成了荣耀“吃螃蟹”的又一首发功用,这背面是协作方生数科技旗下的AI视频大模型在移动端的初次规模化落地 。
联手生数科技Vidu,荣耀打破了三大难关——坚持风格共同性、对物理国际的了解、端侧本钱紧缩,让用户免费体会“老相片复生术”。
而就在两个月前,生数科技 Vidu Q1模型刚以VBench双榜榜首的成果碾压Sora与Runway,现在就悄然钻进千万用户的口袋。
这场协作背面,一场更深层的革新正在发酵 。
当时 ,多模态正在重构智能终端的交互体会,手机正成为图生视频技能普惠的战场之一。当大模型的技能比赛从言语模型延伸到多模态,“让回忆重获生命”的图生视频,或许正是翻开群众商场的榜首把钥匙。
当图生视频在手机上跑起来。
一张由AI制造的“Live Photo”,成为了荣耀发布会现场世人评论的焦点。 。
相片中 ,一个小孩抱着窗布看向镜头浅笑。经由图生视频功用加工后,小孩抓着窗布向一边摇晃 ,头部也跟着晃动方向轻轻歪斜,脸上挂着的笑脸变成了动态 ,能看到嘴角咧起的弧度和兴起的脸颊。
在荣耀产品线总裁方飞的演示中 ,只需求点击“AI生图”功用 ,选定相应相片和生成的视频时长(3秒/5秒) ,AI就能依据图片场景生成一段流通的视频。上述事例便是由该功用生成 。
早在3月宣告向AI终端生态公司转型的荣耀,在数字系列荣耀400上落地了一系列AI才干 。光是相片一项,荣耀就上线了AI图生视频、AI去褶皱 、AI去眼镜反光 、AI去玻璃反光、图生视频等优化功用 。
看起来简略的视频演示 ,背面是图生视频技能落地智能终端的一大步:霸占了技能难点,才干让AI视频看起来无限趋近于实在。
首要,要想让视频动起来的作用契合实在国际的运转规则 ,便是视频生成模型们前期的通病。比方提示词设定成两个人打羽毛球 ,交给AI来做 ,球或许会呈现随便飞起或许不依照球拍击打轨道飞翔等问题 ,导致生成出来的著作无法运用。
当下,怎么更好地模仿物理国际规则,也成了大模型们面前的难关。就在3月份,生数科技发布的模型Vidu Q1 ,在VBench-1.0的视频质量、视频语义共同性和 VBench-2.0的常识推理 、物理了解等归纳维度上到达SOTA水平。靠着对提示词的了解力增强,Vidu能自动辨认人物动作、光影、方位联络等内容 ,让生成的视频在动态上契合物理国际规则。
此外,在风格共同性上,拿手动漫 、水墨等多种画风了解的Vidu,在坚持原图风格共同上的体现相对安稳