阿里AI视频识别算法新突破:可帧级解读视频
手机里存了大量的视频,想剪辑其中的精彩片段却犹如大海捞针?视频网站拥有海量视频,如何严格审核避免问题发生?
近日,在德国慕尼黑举办的计算机视觉国际顶会ECCV(European Conference on Computer Vision)上,阿里安全图灵实验室高级算法专家析策展示了最新的AI视频识别算法,其识别精度超越目前主流方法,有效提升了视频自动标签的行业精度,这一新算法已被ECCV收录。
阿里安全图灵实验室高级算法专家析策表示,为提升AI技术在实际场景中针对视频识别的精度,提出一种新的基于图(Graph)的视频建模方法,能表达含有复杂事件内容的长视频。
析策表示,这一方法的主要思路是通过“深度卷积图神经网络”(下称“DCGN”)对视频的帧、镜头、事件进行多级的建模,逐渐地从帧级、镜头级,一直到视频级进行抽象,从而获得视频全局的表达,进而进行分类。
他举例称,“比如一段美食节目视频中,包含厨师长、主持人聊天、食物、观众等内容,AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达,形成特征序列,用不用的标签进行打标,随后在通过多层次的网络对这些不同打标的内容进行关系表达,深度理解这些内容之间的关联度,将相似的节点衔接起来,最终组合出对整个视频的理解。”
烹饪节目中包含各种内容,不同内容用不同演示边框表示,最终组合出对整个视频的理解
析策表示,一个视频包含帧、镜头、场景、事件等,帧与帧、镜头与镜头间的关系十分复杂,不仅仅是前后帧的顺序关系,而目前公开的建模方法一般都无法表达如此复杂的关系,DCGN因对复杂内容的深度学习和理解进而提升识别精度。
据悉,阿里安全图灵实验室已将AI能力在内容治理、知识产权、身份认证验证和新零售安防等领域进行运用,覆盖阿里生态的淘宝、支付宝、优酷、UC等核心业务线。
近期刷爆社交网络的网红“AI鉴黄师”,每天可审核数亿张图片,识别准确率高于99.5%,技术能力便来自阿里安全图灵实验室。连视频内容都能理解了,解读一张图片岂不是小菜一碟?
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
5499元起!华为Pura70系列先锋计划开售
iPhone 16 Pro影像规格曝光:超广角将升级至4800万像素
一季度全球智能手机出货近2.9亿部 小米传音出货量同比均有大增
花旗预计“每卖一台SU7亏6800元” 小米高管回应:信息偏差较大
苹果将允许用户和第三方维修商使用二手正品零部件维修iPhone
苹果市值一夜暴涨8113亿元 据称拟升级整个Mac产品线
余承东调侃小米SU7原装手机支架设计?雷军发文回应
OpenAI超蚂蚁集团 胡润榜单上的“中国VS美国”
智己汽车因标注错误发致歉函 但致歉函中也有错误
更多
- 润开鸿发布鸿蒙应用产品 蚂蚁数科mPaaS提供支持
- 2023年营收165亿元,三七互娱拟提升分红频次至一年四次
- “AI换脸”骗走2亿港元 专家支招如何防范
- 媲美GPT4的开源模型Llama 3怎么用?亚马逊云科技官方教程已上线
- 谷雨“龙井”奶茶外卖量涨5倍,茉莉奶白等多品牌联合饿了么上线“春日收官”新品
- 《热辣滚烫》获北影节“春节档特别荣誉” 出品人侯晓楠:海外票房已破700万美元
- Qorvo 谈 Wi-Fi 7、BMS 及 Sensor Fusion 的技术革新之力
- 三年霸榜 亚马逊云科技为何成为中国AI开发平台顶流?
- 英特尔发布大型神经拟态系统Hala Point
- SHARP MultiSync王牌系列工程投影机发布
更多
- 消息称特斯拉下周将宣布在印度投资 最多30亿美元
- 特斯拉全球裁员不会影响墨西哥超级工厂建设 当地称正按计划推进
- Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练
- 消息称苹果12.9英寸版iPad Air将采用mini-LED显示屏 在5月初推出
- 从5nm制程工艺来看 台积电3nm工艺或要明年才能成为最大营收来源
- 台积电一季度营收188.7亿美元 预计二季度会更高
- 分析师称iPhone 17 Plus屏幕将略小于iPhone 15 Plus和iPhone 16 Plus
- 苹果有意代工商在印尼建厂 CEO库克称将评估可行性
- SK海力士Q1营收有望超过12万亿韩元 营业利润重回万亿韩元之上
- 消息称苹果有意在印度生产iPhone摄像头部件 同当地厂商有过接触