加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于噪声标签学习的众包获取标签数据清洗方法

发明专利有效专利
  • 申请号:
    CN202110645466.7
  • IPC分类号:G06F30/27;G06N3/04;G06N3/08;G06F111/08;G06F119/10
  • 申请日期:
    2021-06-10
  • 申请人:
    南京大学
著录项信息
专利名称一种基于噪声标签学习的众包获取标签数据清洗方法
申请号CN202110645466.7申请日期2021-06-10
法律状态实质审查申报国家中国
公开/公告日2021-09-07公开/公告号CN113361201A
优先权暂无优先权号暂无
主分类号G06F30/27IPC分类号G;0;6;F;3;0;/;2;7;;;G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8;;;G;0;6;F;1;1;1;/;0;8;;;G;0;6;F;1;1;9;/;1;0查看分类表>
申请人南京大学申请人地址
江苏省南京市栖霞区仙林大道163号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人南京大学当前权利人南京大学
发明人王崇骏;陈明猜;姜文玉;商一帆;张雷
代理机构南京瑞弘专利商标事务所(普通合伙)代理人陈建和
摘要
本发明公开了一种基于噪声标签学习的众包获取标签数据清洗方法,在模型热启动阶段,使用带有噪声的标签数据初步训练深度模型;在噪声分离阶段,通过模型对训练数据进行预测,计算噪声标签与预测类别间的损失,采用高斯混合模型拟合损失的分布,得到各个数据在属于均值较小子分布的概率,依据该概率的大小将数据分为纯净数据和噪声数据两部分;在重新训练阶段,使用有更大概率为纯净数据的一部分重新训练模型;最后根据深度模型中数据损失的大小进行噪声清洗;本发明对众包获取的带噪声标签数据进行清洗,可大幅提高众包获取数据的质量;并且结合了深度学习模型的拟合能力,可以纠正特征与标签依赖关系复杂时的噪声标签。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供