CVPR 2016正式开幕,一大波黑科技正在奔涌而来!
近日,2016计算机视觉和模式识别领域顶级学术会议(CVPR)于美国正式拉开序幕,内容涉及机器人、无人机、VR、AR、自动驾驶等众多领域。
近日,2016计算机视觉和模式识别领域顶级学术会议(CVPR)于美国正式拉开序幕。
CVPR是世界顶级计算机会议之一(另外两个是ICCV和ECCV),内容涉及机器人、无人机、VR、AR、自动驾驶、生物医疗、工业自动化和检测等众多领域。值得关注的是,每年的CVPR上都会涌现出各种前沿科技,吸引了不少圈内外的眼球,看看今年的CVPR都将涌现出哪些黑科技。
机器人预测人类行为
这项在视觉预测领域取得的突破性进展由MIT 的计算机科学及人工智能实验室(CSAIL)发表。运用CSAIL团队自创的“视觉表征”算法,在进行了600个小时无标签视频训练后,该系统对新视频中人们下一步动作的预测精确度高达43%,除此之外,还可以预测5秒后的世界。
详情参看镁客网文章《MIT人工智能实验室发力!让机器人告诉你5秒后的世界》
基于深度学习的手势识别:DeepHand
DeepHand(深度手势识别)是美国普林斯顿大学C Design 实验室的研究成果。该系统使用了深度学习“卷积神经网络”,通过判断手势动作的数字位置(把手指的每一个区域都定义为数字),DeepHand可以推算出其下一个手势的数字位置,进而预测手势变化的可能性。通过定位邻近区域,DeepHand还能够计算,显示摄像头中无法直接捕抓到的手势运动。
详情参看镁客网文章《无需VR外设,普林斯顿学霸用DeepHand解放你的双手》
微软全息“穿越”技术:HoloPortation
HoloPortation(全息传送)可以将活灵活现的人物全息图像投射到另一个房间,并与房间的人进行实时互动,同时解决时间与空间的距离问题。视频中出现的就是Shahram Izadi以及他女儿(的全息图像)。
人工智能成“配音员”
麻省理工学院开发出一个能够精准预测声音的算法。当研究员将一个击打物品的短视频交给算法,算法就可以生成一个打击的声音,真实到可以糊弄住观看视频的人类。
百万人脸测试:人脸识别靠谱吗?
华盛顿大学的UW团队用69万人的照片创建了一个百万图片的数据集,分别让几个团队在此基础上对自家人脸识别系统的匹配准确率进行测试。
测试结果显示谷歌的FaceNet算法识别准确率最优,在百万规模数据下达到75%的准确率,另一个与之接近的团队是俄罗斯的N-TechLab,达到73%的准确率。相比之下,其他算法在小规模数据集能达到95%以上,但是百万规模下的识别准确率下降到33%左右。
详情参看镁客网文章《华盛顿大学最新研究:人脸识别靠谱吗?》
深度学习识别YouTube的视频
迪尼斯研究院和复旦大学在CVPR 26日的大会上展示了如何用深度学习自动识别刚刚上传到YouTube视频里正在发生什么大事以及新鲜事。来帮助开发之前视频上传后丢失的大部分有潜在价值的信息。
斯坦福大学打造“懂礼貌”机器人Jackrabbot
斯坦福大学的研究人员费尽了心思制造了一个叫Jackrabbot的原型机器人,希望它能够自行在街道上行走,又不会与其他行人碰撞,或者有人迎面而来时不知往左往右。研究人员表示,未来这些走路的经验将分享给其他的机器人。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新