报告题目:大数据分析与挖掘技术
报告时间:2018年11月23日 15:30
报告地点:华中师范大学2138com太阳集团(中国)有限公司918会议室
主讲人:化柏林教授
主讲人介绍:化柏林,博士,北京大学信息管理系助理教授、研究员、硕士生导师。主要从事大数据情报分析与知识抽取研究。主持国家自然科学基金项目、国家社科基金等课题5项,出版著作2部,发表论文50余篇。
(通讯员 李玉媛)2018年11月23日15:30,我院邀请北京大学化柏林教授来我院918会议室开展题为《大数据分析与挖掘方法》学术讲座。曹院长主持本次讲座,众多师生前来聆听。
随着大数据与社会经济生活的融合不断深化,以数据及所产生知识在社会各主体间流动为基础的社会生态系统正在逐步形成。基于大数据驱动的科学研究方法已逐渐成为了图书情报与档案管理学科的主要研究方法。对于我院的广大师生来说,这场学术讲座无疑是受益终身的。
化柏林教授主要围绕大数据分析思维与理念、典型领域数据分析应用、多源数据融合、大数据分析方法体系等内容展开。将整个讲座的内容分为大数据分析理念与思维、多源数据融合与清洗方法、情报用户画像与需求探测、大数据情报分析方法体系四个部分,并逐一对其进行详细讲解。
化柏林教授认为数据时代的情报分析流程主要是任务分解与需求定位、信息检索与数据采集、多源信息融合与清洗、信息分析与内容挖掘、信息展现与情报提炼以及报告撰写与情报传递。每一步流程都需要敏锐的情报意识与端正的态度。当我们对于收集到的情报数据进行分析时,采取方法也是多样化的,每种分析方法都有自己的优缺点以及适合的信息数据,所以掌握各种分析方法以及合理有效利用分析方法分析数据对于情报工作者尤为重要。
化柏林教授表示多源数据主要是指数据的来源、所属的领域、数据类型、数据内容格式、数据分析频率以及IT系统属性的不同,并表示同学们在做科学研究中,不应该只是单方面的查找数据,而应该多方面多途径的收集不同类型的数据,才能保证数据分析的准确性与可靠度。在做数据融合过程中,会面临着同型异源信息、异质异构信息以及多语种信息等不同的多源数据的融合,需要同学们有针对性的利用不同方法去做多源数据的融合处理。
化柏林教授认为大数据不仅仅是指数量多,更多是指数据类型的多样化。如何全面有效的获取数据,就离不开数据的挖掘技术。化柏林教授先向同学们介绍了数据挖掘的经典方法,同时以政府管理中的数据挖掘方法作为详细案例进行讲解。其后针对目前的社会信息情况,向我们介绍了一些挖掘大数据的新方法,并对用户画像方法以及场景分析与需求探测方法做了具体的讲解。化柏林教授认为情报工作者可以利用大数据分析用户需求,依据用户需求进行用户画像构建,从而更加精准为用户提供需求服务。
在情报方法体系这一层面上,化柏林教授从基于多维视角、基于学科来源、基于术语结构、基于方法属性、面向操作对象、基于应用主体、过程型方法体系以及面向情报任务等方面详细的讲解了情报方法体系的具体步骤以及科学方法。同时也依据新时代的情报分析的新特点,对大数据分析的新功能以及决策服务的转变进行了讲解。整个情报方法体系介绍融会贯通,让在座的师生了解了情报方法的发展以及体系结构。
最后化柏林教授对讲座内容进行了梳理总结,并给出具体案例分析与应用过程。曹院长也针对化柏林教授的讲座进行了发言总结,并鼓励大家踊跃发言,积极提出自己的疑问。化柏林教授耐心为同学们解答疑问。至此,讲座圆满结束。