威尼斯www432888机器人与信息自动化研究所 天津市智能机器人技术重点实验室
Institute of Robotics and Automatic Information System Tianjin Key Laboratory of Intelligent Robotics
2018年秋季先进机器人与人工智能系列学术讲座(第131期)
Seminar Series:Advanced Robotics & Artificial Intelligence
报告题目:KDD全过程利用缺失数据的模型与方法
报告人:张师超 教授(国家人事部海外高层次留学人才回国资助人第一批选获得者)
时间: 2018年12月7日 下午2:00-3:30 (比原计划推迟半小时开始)
地点: 人工智能南楼225(原计控楼)
个人简介:
张师超教授是国家人事部海外高层次留学人才回国资助人第一批选获得者。长期从事数据挖掘和大数据的研究,在多源数据挖掘、不完全信息挖掘、代价敏感学习和kNN分类等方面取得系列原创性研究成果。在Springer出版学术专著3部,以第一或者通信作者在国际重要学术期刊发表论文80余篇,包括Trans论文20多篇。先后主持了国家级项目共16项,获得国际会议最佳论文奖2次。先后担任TKDD、TKDE、KAIS和IEEE Intelligent Informatics Bulletin的领域编辑,国际会议ADMA指导委员会委员,PRICAI等国际会议的会议主席/程序主席或者副主席10多次。
报告摘要:
传统利用缺失数据的最佳策略是:在知识发现过程(数据预处理、数据挖掘和模式评估)中,缺失数据是在数据预处理阶段填充,在数据挖掘阶段被利用。与此不同,本报告提出在KDD过程中全程充分利用缺失数据,例如,数据预处理阶段的缺失填充中将先填充好的样本用于后续缺失样本的填充,在数据挖掘阶段有选择的利用填充的样本,在模式评估阶段考察填充的缺失样本对模式质量的影响程度。本报告介绍利用缺失数据的策略,以及由此导出的新研究课题。