视觉大模型升级:让“摄像头”可以理解视频内容,并且支持文字查找

Aa
分享到:

  近日,三六零(601360.SH,下称“360”)智慧生活集团召开“360视觉云硬件生态发布会”,大会主题为“AI新时代,安防新生态”。会上透露,在360认知型通用人工智能大模型“360智脑”基础上,360视觉大模型持续进化,助力360安防产品全线升级,升级后的360视觉云在一周前已开放公测,吸引了10万企业用户注册。

  随着“360智脑”的持续升级,360视觉大模型能力不断进化,在5月版本的基础上新增三大能力:首先,360利用端边云融合,大小模型协同的方式,进一步使算法精度大幅提升35%;其次,在图片问答中360视觉大模型新增支持开放目标定位及检测,能够回答某个事物在图片中的具体位置,在“有所答”的同时还能“有所指”;最后,360视觉大模型新增跨模态检索能力,让“摄像头”可以理解视频内容,并且支持文字查找。例如,支持检索“一个站在树下的人”,相比通过标签检索的传统模式,经测算,跨模态检索能够让检索效率提升200%以上。

  在应用层,在升级后的360视觉大模型加持下,360智慧生活各个旗舰产品的智能水平均得到大幅提升。比如,360可视门铃系列产品销量长期稳居行业第一,其主力型号360可视门铃6Pro如今既能做到过滤无效误报,还能精准识别家人、朋友和陌生人,安全性进一步得到加强。此外,360户外球机6Max具备了能够无延时、无噪音,迅速捕捉关键信息的能力,同时还支持AI 技能商店,用户可以根据自己的需求自定义下载AI技能,以适应不同的需求,包括区域声光报警、口罩检测、烟雾检测、火焰检测、车辆检测等多种场景。

模型相关推荐

模型推荐资讯

模型相关资讯

推荐报告

相关图表