百万首页 |新闻 |产品 |分类 |供求 |商家信息 |招聘 |相册 |资讯 |知道 |商家 |随便看看
普通会员

深圳市奥纳科技有限公公司

贴片电容、安规电容、可调电容、钽电容、贴片电感(高频绕线电感、高频薄膜电感、...

产品分类
  • 暂无分类
联系方式
  • 联系人:李先生
  • 电话:0755-85293010-8006
  • 手机:13632654895
站内搜索
 
相关信息
  • 暂无资讯
正文
彩霸王五点来料 码隆科技CurriculumNet

来源:本站原创  作者:admin  更新时间:2019-06-09  浏览次数:
c?码隆科技CurriculumNet:提高噪声数据价值方法_智能_环球网
专注于人工智能技术创新的科技周报Import AI,长期关注并报道科技领域的重要事件。在最近一期周报中,码隆科技自研的CurriculumNet算法在运算机视觉技术创新领域的应用获得了Import AI的关注。  作为数万名业内专家的重要读物,Import AI一直专注于人工智能技术创新领域。其作者Jack Clark为OpenAI现任战略及传播总监,曾任Bloomberg唯一一位专注于神经网络学习领域的记者。OpenAI是众多硅谷大亨联合建立的人工智能非盈利组织,在技术界有广泛影响力。  如下是报道的中文译文:  中国计算机视觉创业公司码隆科技于近期开源了基于弱监督学习的CurriculumNet代码和模型。CurriculumNet是一种可通过从互联网上收集大量带有噪声标签的数据来训练出一个鲁棒性很强的深度神经网络模型技术,这一方法对那些缺少大型已标注数据集的研究人员十分有帮助。但是,这种从互联网上按照标签语义收集来的数据往往带有大量噪声。因此,四海图库彩图,若要在这些数据上训练出高性能的深度神经网络模型,研究人员需要面临着从噪声中提取足够多有用信息的挑战。  CurriculumNet:研究人员在WebVision数据库上训练他们的模型结构,该数据库包含了超过2,400,000张带有噪声标签的图像。他们的方法是在整个数据集上训练一个Inception_v2模型,之后研究所有图像映射到的特征空间;此后,CurriculumNet将这些图像分组,根据特征空间中所有图像的相似程度将每个类聚成三个子集。接着,他们开始使用具有相似图像特点的子集用于模型训练,再混合到噪声较大的子集中训练。通过高质量的标注数据迭代学习分类器,随后添加具有噪声的数据来加强分类器,研究人员表示这种增加噪声数据训练的方式不仅能提高模型的性能还能增强其泛化能力。  测试效果:研究员用CurriculumNet测试了四个基准:WebVision、ImageNet、Clothing1M和Food101。他们发现,管家婆马报资料,使用最大量的噪声数据训练的系统比那些没有噪声数据训练的系统甚至有着更高的准确度。这一方法使WebVision上的错误率减少了多个百分点(“这些进步对于如此大规模的挑战是至关重要的,”研究人员表示)。更进一步,CurriculumNet在WebVision上的准确度最高,而且训练数据越多(例如结合ImageNet和WebVision的数据集进行训练时),性能越好。  码隆科技在四个公开数据集中的实验结果  训练模型在WebVision和ImageNet上合集的效果  技术意义:类似于CurriculumNet的系统很好地展现了研究人员可以如何利用标注不佳的数据,结合前沿训练理念来,提高低质量标注数据的价值。这样的方法就类似于在自然资源中提取有用物质时所采取的“萃取”手法,很有现实意义。 相关新闻 Anki发布家用智能机器人Vector 功能齐全爱搞怪2018-11-02 14:28 2018百度世界大会智能生活论坛:让小度无处不在2018-11-02 09:22 挪威邮政试用派件机器人 降低最后一公里人力成本2018-11-02 08:49 双11物流尽出黑科技 未来可能没“人”送快递2018-11-02 08:38 亲测169元小度智能音箱Pro:更值得入手 音乐最全2018-11-01 20:19