内容预览:
在机器学习与模式识别领域中,传统的研究重点中包括聚类任务以及分类任务。但由于分类任务需要先验知识的支持,对标记样本有一定的依赖性,具有一定的局限性。而聚类作为基于无监督学习的模式识别方法,可以在不借助任何先验知识的条件下,即可在样本集中挖掘其内在的相似模式,进而为分类任务提供了无监督的替代方法。
聚类源于分类学,但与之又有所差异。聚类是在类别未知的样本集上进行,而分类是在已知类别标签的条件下进行的。进一步地,聚类是将对象的集合分成由类似对象组成的多个类别的方法,而进行划分的标准则是样本之间的相似性。对从属于同类的样本来说,要求其相似性尽量达到最大,而对从属于不同类的样本来说,则要求其相似性尽量降至最小。由聚类所得到的聚类簇表示一组数据对象的集合,同一个簇中的对象彼此尽可能接近,而与其他簇中的对象尽可能远离。因此,可以用“物以类聚,人以群分”来对聚类的内涵进行形象地概括。
得益于信息技术的快速发展,全球数据量呈现出爆发式增长的态势,而蕴含在海量数据中的可用信息也随之不断被挖掘利用,成为助力经济社会快速发展的强大动力。身处大数据时代的洪流之中,各行各业都在积极转变行业发展模式,利用其中宝贵的信息资源加速自身的改革创新和发展升级。而在这其中,具有海量客户资源、优质信息质量以及丰富应用场景的银行业对数据信息的挖掘利用需求尤为迫切。
作为数据挖掘中的一种重要方法,聚类算法在银行业中应用前…………
全文共1695字,仅供站内会员学习参考(会员可打开排版规范的全部文档)
新来的客人请【点此注册】加入会员
刚注册会员请【刷新页面】打开全文
未登陆用户请【登录网站】查阅文章
秘书文库--青年干部的网络秘书,职场精英的智慧文库![了解我站]