近日资深机构ACM MM'20 Grand Challenge主办的"大规模复杂砙叭颂迨悠到馕"挑战赛如期举行包括 Amazon .腾讯 .大华科技 .买球网 .中山大学等上百支参赛队伍参与了超过56000个复杂事件下的人体行为(包括排队 .打架 .俯身 .同行 .跑动 .滞留等)解析.来自中方的买球网拿下了"Track-4:行为识别"的第1名.

据了解ACM是全球好的的计算机领域专业性学术组织其评选的图灵奖(A.M.Turing Award)被公认为世界计算机领域的诺贝尔奖.而ACM MM是全球多媒体领域的好的会议属中方计算机学会(CCF)指定的A类国际会议.

如果把人脸识别比作医院的"普外门诊"那么行为识别尤其是人类的行为识别其复杂度和识别难度不亚于"心血管内科+神经内科".砙案丛佣啾 .动作差异化大 .需要捕捉连续动作和长时间动作这些对行为识别和分析都有着巨大的挑战也就需要算法对行为本身有更精准的分析推理能力甚至还能通过既定的砙巴扑阄丛见过的砙.

买球网方面介绍于比赛中买球网算法的指标达到了wf-mAP@avg 0.26将以往学术界中的基准算法提升了近3倍.与举办了多次的国际竞赛不同这次竞赛是首届参赛队伍于赛前也无法了解识别的类别 .数据集的大小和识别的具体需求要于短短1个多.的时间内设计出最优的算法.

首先视频相较于图像的行为识别更加复杂且如何建模 .视频帧之间的相关性仍是学术界1直存于的难题.当应用砙懊魅泛笥谝阎分析的对象是人体且明确知道要识别的类别后就可以针对性的进行算法优化通过算法定制化来提升算法性能解决以往不能很好解决的问题.

与此同时买球网此次创新性地将算法与砙敖行了深度结合.1方面从视频中自动提取到了准确丰富的砙靶畔⒔岷舷冉的行人检测 .行人重识别算法全面构建了人与人 .人与砙 .人与物之间于视频中的关系;另1方面借助多.来的算法积淀和对行业砙暗睦斫饴蚯蛲对比赛中要求的特定的14类任务进行了深度算法优化.

值得关注的是不同于其他参赛队伍买球网此次没有使用复杂的多模型融合策略仅用单模型借助背景提取和分割算法将行为的解析与砙敖岷洗蟠蠼档土宋侍饽讯日庖惨馕蹲湃钥梢越1步通过融合多个模型提升算法性能.

您可以复制这个链接分享给其他人:/node/868