【51CTO.com原创稿件】WOT2016大数据峰会将于2016年11月25-26日在北京粤财JW万豪酒店召开。届时,数十位大数据领域一线专家、数据技术先行者将齐聚现场,在围绕机器学习、实时计算、系统架构、NoSQL技术实践等前沿技术话题展开深度交流、沟通和探讨的同时,将分享大数据领域***实践和最热门的行业应用。
51CTO记者对即将参加大会演讲的民生银行北京分行数据应用处处长郭庆进行了专访,让我们先睹为快,探听民生银行大数据产品应用实践方面的心得。
郭庆处长简介:
郭庆,银行业大数据应用领域专家。曾在中国银行总行长期负责银行卡、个人金融等相关数据仓库应用的建设,2013至2015年担任中国银行网络金融部高级经理,负责网络金融大数据建设工作。2015年底转任民生银行北京分行科技部负责人(兼任数据应用中心总经理),他主要的业务观点是“以业务驱动数据应用建设,用实践检验数据应用成果”。在他的带领下,他所在的团队在银行产品实时分析推荐、互联网数据挖掘应用等领域进行了大量研究与实践工作,并取到了较好的实用效果,获得了监管及业界的认可。
银行需求与大数据应用和能力培养要紧密结合
对于银行大数据的切实应用和落地,郭庆处长表示,从银行业务角度出发,大数据的应用一定是围绕着“获取客户、了解客户、营销客户、风险管控、内部管理”等与客户、业务相关联的场景去展开的。
他指出,中国民生银行建行20年以来,始终将业务与技术的创新作为企业生根立命之本,近年来也在探索运用数据资源更好地服务客户的方式,不断地运用数字化营销方式来获取客户,应用360度客户标签体系来了解客户;使用数学建模和机器学习等方法构建推荐引擎,进行产品实时推荐以及客户精准营销,“在创新、实践的过程中,我们很自然地将银行自身需求与应用大数据产品和培养大数据能力紧密结合在一起。”
银行大数据面临的机遇和挑战
面对科技的日新月异,银行如何应对大数据浪潮带来的机遇和挑战,郭庆处长认为,大数据给银行业带来的挑战主要在于思维、IT能力和内部机制等方面。
1、思维方面的挑战
大数据时代的来临,对我们传统的数据思维方式提出了重要挑战,需要我们跳出原来的“因果关系”的思维定式,逐渐学会洞悉全量数据,接受量化思维,并且重视彼此间的关联性,这绝不是一朝一夕所能养成的,需要不断地培养数据意识,贯彻数据驱动业务理念,通过探索与尝试加深理解、融会贯通;
2、IT能力的挑战
银行传统的IT架构需要不断革新技术,才能满足大数据方方面面的能力要求。这需要以开放的心态引进分布式存储、流式计算、机器学习等新型技术体系,需要一定时期银行IT人员不断试错容错摸索过程,需要技术能力的培养与沉淀,就如同过去银行在大型机技术方面从无到有、再到功力深厚的积累过程一样;
3、机制的挑战
凡是具备大数据常识的人,基本都能说出“亚马逊产品推荐”的经典案例,支持这种产品推荐场景研究的背后是企业文化与机制,比如能将数学科学家和人文科学家组织成研发团队。
所以,一定是在企业内部能够形成一种灵活的机制与模式,这对传统银行业来说,是一个挑战。以民生银行北京分行为例,我们在分行建立“融智计划”平台,打破业务条线间的隔阂,以科技研发为纽带,将全员创新力量凝聚一体,通过宣导数据价值取向、数据运用方法,组织一线市场与科技人员成立联合工作组,落地场景需求,快速响应市场反应。最终实现科技与业务的联动,依托创新的“融智计划”平台做出更好的产品。
在大数据时代,银行所面临的机遇则主要包括以下四个方面:
产品创新:通过采集数据,进行数据分析,寻找客户痛点,最终驱动产品创新。
精准营销:大数据让银行有机会以“千人千面”的方式认识客户,并辅以数据挖掘与分析,根据客户的不同特点来进行精准营销,节约营销成本,提高营销精准度。
风险管理:大数据让银行更容易了解客户真实的行为数据,实时掌控客户风险,利于更好地进行客户风险管理。
决策支持:大数据驱动业务决策有理有据,有数据支撑,摆脱“拍脑袋”决策的主观风险。
银行大数据应用架构应具备的技术特点
郭庆处长认为,总体来讲,在银行内部,银行大数据应用架构往往是与传统IT架构并存的,因此会形成“双峰”局面,这就需要考虑大数据架构与传统IT架构的并存融合问题,以及两者之间的效率与分工问题;同时银行大数据架构更加注重安全性,金融数据强一致性要求较高。
具体从整个数据管理与应用的链条都要做如下考虑:
数据采集层:在数据来源上,银行数据来源多,各项业务系统错综复杂,同时需要挖掘运用外部互联网数据与第三方数据;而数据形式上,结构化、非结构化、半结构化数据并存,需要整合各种形式的数据;
数据存储层:银行一般会有自己的关系型数据仓库,同时也会有分布式大数据平台。其中,互联网类、大数据分析类应用天然适合使用分布式技术构建;渠道类等对数据强一致性要求较低或无数据状态的系统适合使用分布式架构部署;金融交易类等对数据强一致性要求较高的系统由集中式转为分布式架构需进一步评估及尝试。
基于企业级数据仓库和大数据平台的定位和区别,我们认为大数据平台是互联网金融环境下对企业级数据仓库的补充,而非替代;
数据分析层:批量、实时、流式处理方式并存;使用数学建模和机器学习等方法进行数据挖掘,提升客户价值,预测客户风险;构建推荐引擎进行产品实时推荐以及客户精准营销;特别是对于非结构化数据处理需要,以我行“优房闪贷”产品为例,采用网络爬虫抓取数据,并使用语义分析进行数据解析,是基于大数据平台对非结构数据进行处理的一次有益尝试。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】