“一站式”学生社区“梦溪湖论坛”2025年春季第三讲
文章作者:文/曾子斐 吴保童 图/王玉美
责任编辑:王鑫
审核人:
文章来源:
3 月 19 日下午,西南石油大学计算机与软件学院于明理楼 B306 举办 “梦溪湖论坛” 系列讲座春季第三讲,软件工程专业在读硕士陈天霖主讲,介绍发表于 Pattern Recognition 期刊的论文及投稿历程。
讲座中,陈天霖阐释多示例学习(MIL)基本概念,即包由多个示例构成,包标签已知但示例标签未知,依包内目标示例判定包标签正负。还介绍了 MIL 算法类型及在多领域的应用,体现其广泛适用性。
论文聚焦基于代表示例选择的MIL 嵌入方法,针对现有算法选择代表示例时忽视数据分布特征差异的问题,指出传统挖掘方法在原始特征空间处理复杂数据分布有局限,而自适应密度分布挖掘技术可提取数据密度分布特征,确保包的区分能力。同时,传统嵌入 MIL 算法存在嵌入特征不平衡问题,双视角嵌入技术则能从正负角度挖掘关键信息,保持特征平衡。
此次研究提出的多示例学习的自适应密度分布挖掘与双视角嵌入算法(DPMIL),通过自适应密度分布示例选择技术,构建负代表示例集合和正代表示例集合;运用双视角嵌入技术,计算示例与代表示例距离,得到局部向量并拼接为全局视角嵌入向量,解决传统算法在示例选择和嵌入处理上的不足。
实验先进行参数分析,确定邻域半径为1.5,再通过与 4 种前沿的 9 个 MIL 算法对比,DPMIL 在多个数据集上性能良好,验证了其有效性和优越性。陈天霖还分享投稿历程,从 2023 年 11 月构思到 2024 年 10 月成功录用,历经撰写、投稿、修改、返修等阶段。讲座最后,师生围绕 DPMIL 算法多方面应用深入讨论,在热烈掌声中圆满结束,为师生带来学术启发。
更新时间:2025-03-21