• 最新论文
  • 戴上Pico G2 4K,德国Phantasialand开启VR过山车冒险沉浸式体验 FBI等召集互联网巨头开会:提前部署保明年大选安全 共创认知新百年,航美传媒拥抱未来科学,共荣共成长 铝城小学举行校园文化培训会 清扫校园,美化环境——鹿邑县博德中学开展校园卫生清洁活动_河南教育新闻网_河南省教育网 清扫校园,美化环境——鹿邑县博德中学开展校园卫生清洁活动_河南教育新闻网_河南省教育网 戴上Pico G2 4K,德国Phantasialand开启VR过山车冒险沉浸式体验 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展 园林学院调配博士生招生指标定向支持青年教师发展 一汽大众青岛工厂明年3月开建 2017年投产 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展 共创认知新百年,航美传媒拥抱未来科学,共荣共成长 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展
  • 推荐论文
  • 戴上Pico G2 4K,德国Phantasialand开启VR过山车冒险沉浸式体验 FBI等召集互联网巨头开会:提前部署保明年大选安全 共创认知新百年,航美传媒拥抱未来科学,共荣共成长 铝城小学举行校园文化培训会 清扫校园,美化环境——鹿邑县博德中学开展校园卫生清洁活动_河南教育新闻网_河南省教育网 清扫校园,美化环境——鹿邑县博德中学开展校园卫生清洁活动_河南教育新闻网_河南省教育网 戴上Pico G2 4K,德国Phantasialand开启VR过山车冒险沉浸式体验 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展 园林学院调配博士生招生指标定向支持青年教师发展 一汽大众青岛工厂明年3月开建 2017年投产 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展 共创认知新百年,航美传媒拥抱未来科学,共荣共成长 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展
  • 热门标签
  • 日期归档
  • 极链科技受邀参加CVPR2019 加速计算机视觉核心技术发展

    来源:www.bloodonthemotorway.com 发布时间:2020-01-26

    2019年6月16日至6月20日,计算机视觉与模式识别国际会议(CVPR2019)在美国长滩举行。极地链科技(Polar Chain Technology)作为连续两年的谷歌地标识别大赛冠军团队,再次受邀参赛。人工智能研究所的顾尹正,作为冠军团队代表,在当地时间16日上午的检索挑战获胜者演示会上发表了精彩的演讲。

    作为连续两年的谷歌地标识别挑战赛冠军,极地链科技的人工智能团队在会上分享了他们在这场比赛中遇到的困难和获胜的计划。

    这场比赛和去年的:

    1一样困难。类别数量极不均衡,为:个,平均每个类别20.35个样本,但不到20个类别有150,000个类别,几乎占总数的3/4,其中近19,000个类别只有一个样本。

    2。由于没有人工清洁,训练集中同一类别的许多图片没有共同之处,或者同一地标的图片出现在不同类别中;

    3。测试集中有很多令人不安的图片。

    本次比赛使用的方法大致如下(更详细的介绍将应组织者的要求以论文的形式上传到arxiv):

    由于今年类别总数超过20万,我们直接放弃了有线电视新闻网分类网络的培训,选择检索方法作为中心思想,包括以下两个模型和三个步骤。

    Model 1:全局检索模型。对于基于在清洁训练集中训练的全局特征的检索模型(总共830,000个,110,000个类别),主干选择五个基本模型:Resnet-101、Resnext-101、Se-Resnet-101、Se-Resnext-101、SENET-154,池选择GeM、RMAC、MAC,有四种SPoC,并且每个全局池与1024维输出全连接层连接。最后一项功能由上述四个汇集输出(每个2048维)和四个拼接在一起的完整连接输出(每个1024维)组成,总计12288维。损失函数被选作对比三联体,同时进行训练。训练后,通过使用属性无监督白化将维数减少到2048。最终模型由上述五个模型(对应于五个基本网络)和开源DIR模型加权级联组成。

    model 2: localremodel。这个模型使用了谷歌最近的开源检测到检索(D2R)模型。(https://git hub . com/tendorflow/models/tree/master/research/delf)

    步骤1:使用模型1将所有118,000个测试集图片与413万个训练集图片进行比较,每个测试图片与其最近的五个训练图片保持相似性,并选择总和最高的类别作为最终预测。这一步在私人/公共列表中得分为0.25138/0.21534。

    步骤2:与步骤1相同,但这次保留前20名的训练图片,并使用模型2进行二次比较。最后,选择总分前5名最高的类别(D2R)进行二次比较,进行预测。这一步在私人/公共列表中得分为0.31870/0.26782。

    步骤3:这一步是整个过程中最关键的一步。由于采用GAP机制对比赛进行评分,如果干扰图片在排名列表中排名过高,最终结果将直接受到影响,因此我们采用以下重新排名策略。从步骤2中的等级-1测试图片开始,所有等级较低(直到等级-20000)的图片都与模型2进行比较。如果分数高于特定阈值(我们将其设置为23),此图片的排名将会提高。对所有前500张测试图片执行此操作后,对重新排序的列表重新排序两次。经过此过程后,私有/公共列表的得分为0.36787/0.31626。最后,该策略被应用于步骤1的预测(这次选择top-300,因为步骤1的分数相对较低),并且两个新的重新排序列表的顶部图片以交叉形式排序,分数为0.37606/0.32101。

    此外,我们还尝试用从模型1中提取的特征来训练MLP,并执行上面步骤3的操作。此结果在私人列表中的最终分数可以增加到0.37936,但不幸的是,由于其在公共列表中的分数为0.32100,我们没有选择此提交作为最终提交。

    计算机视觉在人工智能领域的普及是毋庸置疑的。近年来,以计算机视觉为核心的技术开发型企业赢得了大量投资者的青睐。作为最高级别的研究会议

    酱萝卜

    友情链接: