近来,计算机视觉范畴尖端会议ICCV 2019在韩国首尔举行,软件学院3篇论文被该会选用。此次会议的选用率约24.88%。
ICCV 的全称是 IEEE International Conference on Computer Vision,即世界计算机视觉大会,由IEEE主办,与计算机视觉形式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大尖端会议,被澳大利亚ICT学术会议排名和我国计算机学会等组织评为最高级别学术会议,在业界具有极高的点评。
简介:因为天然场景中的目标具有各种份额,因而学习丰厚的边际信息关于依据视觉的使命最重要。因为形式崩塌,依据传统的生成对立网络(GAN)的边际检测的新办法效果欠安。为了捕获丰厚的边际信息并尽或许防止形式崩塌,将GAN的学习视为一种进化优化,提出了一种称为依据差分进化的生成对立网络(DEGAN)的新办法来进行更丰厚的边际检测。特别是,在GANs结构的根底上,引入了一种改善的差分进化算法来优化生成器的输入,并经过判别器评价(差分进化进程中的)习惯度函数。在BSDS500和NYUD基准测验中的依据成果得出,论文提出的DEGAN能轻松完成最先进的功能,一起坚持快速的速度并验证其简单性、有用性与功率,其高质量成果或许使其他依据视觉的使命更好地作业。
简介:视觉联系编码独立个别间交互,在场景语义了解中有及其重要的效果。受限于易于猜测的非视觉信息,现有办法倾向于拟合计算偏好,而非真实的学习联系信息。为了推动目标联系的运用,提出针对语义了解,需求学习视觉相关联系,而且按此构建了视觉相关联系数据集(VrR-VG)。比较于现有数据,在场景图生成上,学习型和非学习型办法距离显着扩展。此外,还提出考虑联系的表明学习办法归纳单体目标、特点和联系。经过办法的特征学习,VrR-VG上学得的特征在VQA和caption上有显着提高。进一步证明了提出视觉相关联系有用的提高特征语义表达能力。
简介:获取很多丰厚标示的练习数据集,是做精确的三维人体姿势估量的根底和条件。运用人工办法获取标示尽管可行,但进程非常冗长且缓慢。文中提出了一种新的三维人体姿势估量结构,用以弥补不齐备的练习数据集。首要,运用少数有标签数据练习出一个基网络。运用这一基模型输出的较为牢靠的估量,其结构运用3D轨道补全的办法主动搜集视频序列中的标签。其次,运用主动搜集的标签进一步练习基模型,使其学习到新的姿势。在被遍及的运用的Human3.6M和MPI-INF-3DHP数据集进步行了试验;由试验可见,仅运用一小部分标签进行网络初始练习,该办法成功地使基网络从无标签视频序列中学习到新的人体姿势,令基网络的精度提高约10%。不同于之前的办法,该办法既不依赖于多视图印象,也不需求任何二维要害点标示。