数据挖掘(Data Mining)旨在从大规模、不完全、有噪声、模糊随机的数据集中自动抽取隐含的、以前未知的、具有潜在应用价值的模式或规则等有用知识的复杂过程,是一类深层次的数据分析方法,也是知识发现的关键步骤。
本报告围绕数据挖掘的概念内涵、关键技术、人才研究、应用场景、发展趋势等方面展开深入研究,主要内容包括:
一、数据挖掘基本概念、发展历程、研究进展、问题与挑战。详细介绍了数据挖掘的基本概念、发展历程、技术研究关键词图谱、研究进展,以及研究过程中面临的问题与挑战。
二、数据挖掘技术研究现状分析。分别对数据挖掘十大经典算法、统计数据分析方法、科技情报挖掘技术、社交网络与图数据挖掘技术、自然语言数据挖掘技术、多媒体数据挖掘技术、大规模数据挖掘技术、数据隐私保护和安全等方面进行了详细介绍和深入分析,并解读了 SIGKDD 会议收录的代表性论文。
三、数据挖掘领域人才现状分析。基于 AMiner 平台提供的论文和学者大数据,从学者分布、学术水平、国际合作、学者流动等维度,对国内外相关研究学者和机构进行了对比分析,总结中国科研学者队伍建设过程中的弱势环节和问题,并提出对策建议。
四、数据挖掘典型应用场景分析。分别介绍了数据挖掘技术在零售业、旅游业、物流业、医学界、金融业、电信业等不同行业的应用场景,并如何助力这些行业的发展。
最后分析了数据挖掘相关技术研究发展趋势和创新热点,以及中国的专利数据和国家自然科学基金支持情况,并展望了数据挖掘未来发展趋势。