视觉大模型升级：让“摄像头”可以理解视频内容，并且支持文字查找

　　近日，三六零(601360.SH，下称“360”)智慧生活集团召开“360视觉云硬件生态发布会”，大会主题为“AI新时代，安防新生态”。会上透露，在360认知型通用人工智能大模型“360智脑”基础上，360视觉大模型持续进化，助力360安防产品全线升级，升级后的360视觉云在一周前已开放公测，吸引了10万企业用户注册。

　　随着“360智脑”的持续升级，360视觉大模型能力不断进化，在5月版本的基础上新增三大能力：首先，360利用端边云融合，大小模型协同的方式，进一步使算法精度大幅提升35%；其次，在图片问答中360视觉大模型新增支持开放目标定位及检测，能够回答某个事物在图片中的具体位置，在“有所答”的同时还能“有所指”；最后，360视觉大模型新增跨模态检索能力，让“摄像头”可以理解视频内容，并且支持文字查找。例如，支持检索“一个站在树下的人”，相比通过标签检索的传统模式，经测算，跨模态检索能够让检索效率提升200%以上。

　　在应用层，在升级后的360视觉大模型加持下，360智慧生活各个旗舰产品的智能水平均得到大幅提升。比如，360可视门铃系列产品销量长期稳居行业第一，其主力型号360可视门铃6Pro如今既能做到过滤无效误报，还能精准识别家人、朋友和陌生人，安全性进一步得到加强。此外，360户外球机6Max具备了能够无延时、无噪音，迅速捕捉关键信息的能力，同时还支持AI 技能商店，用户可以根据自己的需求自定义下载AI技能，以适应不同的需求，包括区域声光报警、口罩检测、烟雾检测、火焰检测、车辆检测等多种场景。