阿里AI视频识别算法新突破：可帧级解读视频企业易站网-企业易站网

手机里存了大量的视频，想剪辑其中的精彩片段却犹如大海捞针？视频网站拥有海量视频，如何严格审核避免问题发生？

近日，在德国慕尼黑举办的计算机视觉国际顶会ECCV（European Conference on Computer Vision）上，阿里安全图灵实验室高级算法专家析策展示了最新的AI视频识别算法，其识别精度超越目前主流方法，有效提升了视频自动标签的行业精度，这一新算法已被ECCV收录。

阿里安全图灵实验室高级算法专家析策表示，为提升AI技术在实际场景中针对视频识别的精度，提出一种新的基于图（Graph）的视频建模方法，能表达含有复杂事件内容的长视频。

析策表示，这一方法的主要思路是通过“深度卷积图神经网络”（下称“DCGN”）对视频的帧、镜头、事件进行多级的建模，逐渐地从帧级、镜头级，一直到视频级进行抽象，从而获得视频全局的表达，进而进行分类。

他举例称，“比如一段美食节目视频中，包含厨师长、主持人聊天、食物、观众等内容，AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达，形成特征序列，用不用的标签进行打标，随后在通过多层次的网络对这些不同打标的内容进行关系表达，深度理解这些内容之间的关联度，将相似的节点衔接起来，最终组合出对整个视频的理解。”

阿里AI视频识别算法新突破：可帧级解读视频

烹饪节目中包含各种内容，不同内容用不同演示边框表示，最终组合出对整个视频的理解

析策表示，一个视频包含帧、镜头、场景、事件等，帧与帧、镜头与镜头间的关系十分复杂，不仅仅是前后帧的顺序关系，而目前公开的建模方法一般都无法表达如此复杂的关系，DCGN因对复杂内容的深度学习和理解进而提升识别精度。

据悉，阿里安全图灵实验室已将AI能力在内容治理、知识产权、身份认证验证和新零售安防等领域进行运用，覆盖阿里生态的淘宝、支付宝、优酷、UC等核心业务线。

近期刷爆社交网络的网红“AI鉴黄师”，每天可审核数亿张图片，识别准确率高于99.5%，技术能力便来自阿里安全图灵实验室。连视频内容都能理解了，解读一张图片岂不是小菜一碟？

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

阿里AI视频识别算法新突破：可帧级解读视频

相关文章

空气消毒机的臭氧是否对人有害呢

马云、马化腾、李彦宏等出席世界人工智能大会

空气消毒机风机风速对净化效果的强弱有什么关联

紫外线空气消毒车适用在哪些地方，如何正确使用空气消毒车