【51CTO.com原创稿件】今年是石运福加入阳光保险集团(以下简称阳光保险)第十六个年头,现任集团信息技术总监,从事IT团队管理、信息化治理等方面工作。他还曾在山东人保从事IT工作近十载,故而对保险企业运作流程非常熟悉,一直致力于打造有价值的信息化团队,引导公司进行数字化、智能化变革与转型。
科技建设之道:重视内部软实力提升 加强基层平台化建设
阳光保险在科技能力建设方面,一直本着价值发展理念,长期采用自主建设的科技发展模式,具备自主规划、研究与构建等能力。
回顾阳光保险科技发展的这十五年,堪称跌宕起伏:
- IT的起步阶段(2004-2007年),也是痛苦挣扎阶段。核心系统从开始筹建初期的美好愿望,历经开业之后风雨飘摇和业务增长期的绝望,给业务人员和IT人员带来了巨大的心理落差。
- IT的能力建设阶段(2007-2015年),可以说是8年抗战、跟随维持。IT人从绝望中挣扎出来,树起自主开发的大旗,开始逐步掌控系统,IT队伍也从40人到100人再到500人,以翻番的速度成长,系统建设逐渐重新得到业务人员的信任。
- IT的重塑阶段(2015年),新一代核心系统建设启动,历经三年建设,新一代系统顺利投产,系统的稳定性、响应能力大大提升,不仅检验了我们新一代系统的建设成果,也检验了我们这只IT队伍的能力。
在基础设施方面,公司从原有的多个小机房,逐步归拢成一个核心机房,后来自主建设两个数据中心和一个异地机房,初步实现两地三中心的架构体系。服务器主机方面,最早以传统的小型机为主,然后采用服务器虚拟化技术,接着升级至私有云,与多家公有云合作,最终形成混合云的云计算资源模式。
在软件层面,公司成立之初,受时间和能力上的限制,主要采用国外商业产品和国产商业软件为核心的业务系统架构体系,但成本高、自主性差的问题制约着科技的发展。随着公司业务发展,经过几年的耕耘和替换,更多的自主研发业务系统上线,特别是新一代核心系统的上线,标志着公司已拥有核心业务系统完全自主研发能力。
在开发语言和开发模式方面,保险行业以Java框架体系和为主,公司从2015年开始,尝试新的技术语言和框架,2020年开发团队已掌握Java、Python、Go和PHP等多种开发语言,极大地丰富了公司的技术体系。开发模式也从传统的瀑布式,转为敏捷式开发,2019年试点DEVOPS取得一定的进展,今年将大力的推广DEVOPS模式,进一步提升开发交付效率和质量。
近几年,阳光保险的IT团队已基本完成体系化建设,在科技规划与推动、业务系统建设、技术架构与创新、信息安全、大数据与人工智能,以及基础设施等方面全面发展,科技队伍多元化,人员梯队相对合理,各方面均取得长足的进步和发展。
云计算方面为例 浅谈基础性平台能力建设
当然,阳光保险在重视内部软实力提升的同时,也在同步加强基础平台化的建设,其中软件著作、专利等实现突破性进展,目前已获得近百个软件著作和专利,云计算、大数据等基础性平台能力也有显著提升。
以云计算方面为例,阳光保险在 IaaS、PaaS和SaaS层,分别采用不同的建设策略。
- IaaS层的专业性强,技术壁垒高,采取以与科技厂商合作为主的策略,获得底层平台的使用权。
- PaaS层共用性强,以技术平台为主,公司有一定的研发实力,采用厂商和自建相结合的方式,建设平台层服务。
- SaaS层以各主体的业务为主要场景,发挥公司的业务专业性,采用以自研为主的建设策略,促进业务服务共享。
作为集团化公司,阳光保险的整体云计算架构规划如下:
阳光保险在云计算架构中的IaaS层和PaaS层均有多个产品落地,这里重点介绍IaaS层容器云和PaaS层开源大数据平台。
容器云
容器云应用容器化技术,结合DevOps和微服务等相关技术,形成完整云原生能力。容器云平台底层采用K8S技术,动态调度管理容器及应用,以Jenkins为枢纽,打通开发和运维的自动化流程,实现自动集成(CI)、自动发布(CD)。降低系统建设运营成本,提高IT资源管理能力和资源供给效率,提高系统发布时效,提升系统运营质量和效率。
开源大数据平台
大数据平台以开源大数据生态(Hadoop/Spark)技术为基础,采用分布式、并发计算等技术理念,支持Lambda大数据处理架构,集实时数据处理和离线批量式数据处理于一体。在数据采集、数据存储、资源管理、计算框架、数据分析和数据展示等7大数据处理逻辑层次上,每一层均有3-5种技术组件,满足多项目群、多种架构体系的技术要求。从集团层面搭建大数据平台,为各子公司提供统一的资源平台、技术平台,各子公司以租户的方式使用大数据资源和技术,形成与传统关系型数据库的有效补充。通过大数据平台解决业务场景需求,稳步提升公司运营和数字化能力。
影响科技建设的主要因素:人的保守与技术复杂性
人的保守与技术复杂性是影响整个科技发展主要影响因素:保守是人的天性,对创新的抗拒使得团队接受新科技的阻力较大,还有新技术必然存在新风险,解决问题的过程也正是学习的过程。
人的保守
经过十几年的科技发展,业务系统已相对成熟和稳定,尽管有各种技术问题,但人的保守和惰性在作祟,运营团队以稳定为第一,不愿改变,不愿尝试新的技术和框架,成本科技发展中的一种阻碍因素。
为了解决心态和意愿上的问题,首先,要战胜自己,敢于接受不完美的自己。我们清楚地知道当前系统架构存在的问题,是在背着“技术债”奔跑。其次,牢牢把握住了解决“技术债”这条价值主线,没有因为众多需求而偏离主线。最后,相信一份耕耘一份收获,践行了“农民心态、工匠精神”所倡导的阳光文化,心无旁骛,一点一点解决问题,积少成多,遵从了从量变到质变的自然规律。
技术复杂性
现代科技架构层次多,技术复杂性高,应用场景多样,面临的难题迥异。正如容器云和大数据平台的落地过程,既有机遇又有风险。
在IaaS层,容器云作为私有云和传统虚拟化的有效技术补充,打造快速、便捷运营体系的同时,也带来了应用迁移、监控和网络安全等方面的难题。
- 在应用迁移方面,传统的虚机有独立且完整的操作环境,无论是用户还是基础服务,都提供满足应用系统运行的基础条件。但是容器模式下,单一用户使得容器启动和业务系统运维混在一起,基础运维和应用运维无法有效隔离,进而产生职责权限划分困难的问题。我们通过镜像分层标准化,集成分布式日志系统、配置平台,在DevOps流程中增加镜像检查节点等方式,提供应用运维所需的主要工具和手段,保障运维能力不倒退。基础服务上,监控插件和安全插件等一系列管理工具,以及SWAP等虚机自带的基础功能,在容器上均较难实现。运营团队在了解K8S的最佳实践后,采用Sidecar的形式,将基础通用型插件统一打包,打造成标准POD,规范容器的使用。
- 在监控方面,传统的监控体系主要面向静态数据资产管理,对容器的动态化、微量化束手无策。经过行业调研和技术研究,我们制定出容器资源动态池化和容器组标签化,以及监控数据统一汇总再加工等多套的监控方案,从平台层、容器层和应用层等多维度,采用相应的监控技术和工具,完善监控体系。
- 在网络安全方面,传统的防火墙、黑白名单等安全技术无法有效地进行网络限制和隔离,数据安全最小化原则遇到较大的挑战。在掌握容器云网络实现原理后,阳光保险采用分区隔离、反向代理等方式规划容器网络区,实现网络隔离细粒度化。
在PaaS层,大数据平台不同于传统的关系型数据库,分布式的数据存储和计算,在硬件、技术组件调优和多租户管理等方面,阳光保险缺少相应管理制度和技术能力。大数据底层采用物理机搭建,在机架设计、多副本冗余和操作系统调优等方面走了很多弯路,摸着石头过河,引入底层科技人才,找到多机架分布式设计、软件副本冗余和自动化标准化初装操作系统等一系列的办法,实现硬件资源利用率高和性能稳定等目标。
- 在技术组件调优方面,大数据技术组件多,性能参数复杂,而且不同数量级采用的技术策略和遇到的技术问题不同,10T级别数据量性能参数和100T级别的差异很大,处理方式也不同,甚至同样的策略性能表现完全相反。IT团队找资料,阅读源代码,学习核心原理,经过三轮集中式的性能优化,解决了HDFS海量小文件问题和HBASE内存溢出问题,以及KUDU时钟和性能等问题,大数据平台的核心组件逐渐趋于稳定。
- 在多租户管理方面,经常受到资源定价、资源争抢和应用开发不规范等问题的困扰。运营团队在市场上多方比价硬件成本,结合平台技术资源类型和比例等因素,最终采用小集群大机器的建设策略,完美的找到硬件成本和平台资源单价的契合点,最低的成本提供最多的资源,比公有云大数据资源单价便宜13%。通过资源池化、分组隔离和接入层等方式,大数据平台初步解决资源争抢的问题,再加上定期资源容量监控和需求征集,未雨绸缪,抢在资源不足之前,安排集群扩容,2019年规划实施三次集群扩容,规模较年初增长6倍以上。
科技建设历程给予我们的教训与启示
回首过往,阳光保险的IT队伍和系统建设同样经历了浴火重生、凤凰涅槃的过程,给予了我们很多的教训和启示。
一、牢牢把握“创造价值”主线
1、以科技创新模式 ,赋能机构与员工 ,让客户体验更有价值
企业是“盈利”组织,通过服务客户而获得回报。因此,阳光保险必须以客户为中心,通过产品、服务或业务模式上的进步来解决消费者的痛点,并依据市场反馈不断进行修正和更新。客户体验和感觉不好,早晚会弃你而去,如果机构和员工不能得到有效的支持,就很难始终如一地为客户提供持续而满意的服务。科技的直接目标就是赋能机构和员工,让客户体验更有价值;科技的长远目标就是找到服务客户的新模式,突破现有模式的束缚,为阳光保险的持续发展提供动力。
无论是科技赋能,还是模式突破,实际上都是一种价值最大化的追求和实现过程。阳光科技发展的历史也多次验证了这个事实。只要扛起“创造价值”的大旗,抓住不同时期的最大价值主线,就能抓住“牛鼻子”和问题的本质,就能够交付客户和员工认可的服务产品。
2、坚持“零BUG”原则
创造价值必然导向“价值最大化”,这就意味着取舍。要客观清醒的意识到,在朝向“价值最大化”方向奔跑的时候,是有瑕疵的,是在背着“技术债”奔跑。
在“犯罪学”上有一个理论,叫“破窗效应”。一个小区,本来干净整洁,没有犯罪事件,大家安居乐业。忽然有一天,一个窗子被打破了,但是没有人管。接下来,不好的事情接连发生,有人乱扔垃圾、随地大小便,整个环境变得脏乱差,随之而来的就是打架斗殴,最终导致犯罪事件的出现。也就是说,一个很小的坏事儿,如果不加以及时控制,就会演变成严重的恶性事件。
“童子军军规”有条规定,当你离开一个地方的时候,要让它比你来的时候更整洁干净。这样的话,童子军扎营的地方会越来越干净。一个编写良好代码的项目将激励每个人模仿行为,遵循惯例并提供具有相似质量的代码。如果项目没有“破窗”,人们就不会想要打破。
“零BUG”不是让大家的代码没有BUG,而是在BUG出现后要及时修复,必要的情况下要暂时停下来进行修复。有时候我们发现系统出了问题,为了前行和保证业务需求,经常采用数据修正的方法去解决,而不是去修复,这就如同往一台正在跑的漏油的车里面添加汽油,你能让它跑一阵子,但一天不修复,它早晚都得趴窝。
要坚持不开“破窗”,如果不能做到,至少要坚持立即修复“破窗”。一个良好的行为,最终会在整个开发团队中传播,并影响公司的所有项目。“勿以恶小而为之”,对次要行为的容忍,就有可能带来问题的蔓延,最终让整个系统陷入混乱。
二、在“归零”中战胜自我
没有“战胜自我”的决心,就没有从困境中爬起来的勇气;没有“战胜自我”的能力,就不可能突破现在的舒适区;没有“战胜自我”的勇气,就无法建立起重构的信心,更不可能获得模式的突破。
1、保持开放心态
不要螳臂当车,要相信自己的不完美,更要敞开怀抱,信任你的伙伴。自我认知决定行动境界。因为知道自己的不足,所以就有勇气接纳现实,理性寻找突破之策;因为知道不能单打独斗,就需要共享、协作。别人提供了一个服务,而且允许你拿来即用,而你仍然埋头苦干,非要造出和别人一样的新车来。这是苦劳,不是贡献,是在浪费自己的职业生涯,也是在浪费公司的资源。要有敢借别人肩膀的胸怀,更要有借给别人肩膀的能力。只有敢于站在巨人的肩膀上,精诚合作,借助合力,才能突破自己。
2、要精益求精
正如华为余承东经常挂在嘴边的,“不管做什么领域,都要对标业界标杆,甚至超越满分;如果每个人都变一点几,哪怕只有1.05, N个1.05乘起来数字也会非常大”。不需要一口吃个胖子,要做到永不满足现状,追求实现“一点点不同”。只要心无旁骛,坚信今天做的比昨天好,就能够听懂客户的声音,听懂用户的心思。不要破坏软件功能,不犯第二次同样的错误,每一行代码都要测试,每检入一次代码,要比检出的代码更简洁。只要专注,就能专业,只要专业,就能形成能力,这就是“农民心态、工匠精神”。
3、越快越好
用最小的人力成本满足构建和维护系统需求,软件应该容易被修改是软件架构的终极目标。标志就是上线速度,只有更快地交付,才能证明架构的恰当。因此,要选择最重要的需求以最快的速度交付!越快越好!
4、敢于重构
在人类的商业发展史上,很多曾经显赫一时的大企业最后都死在自己熟悉的领域。因为熟悉,所以顺手;因为顺手,所以愿意坚守;因为坚守,所以保守;因为保守,所以离死亡更近。阿里为何要去开发自己的数据库?因为一堆中国顶级工程师面对数据库的生死劫难,居然束手无策。痛定思痛,敢于重构,才会有了淘宝商业帝国的快速发展,才会有阿里云的今天。面对我们的开发现状,也是如此,面对越来越难以修改的代码,要敢于无情重构,敢于下决心重构。
总之,每一天都是起点!只要有这种战胜自我的能力和勇气,敢于归零,敢于突破,我们就能创造出更大的价值,让人们拥有更多的阳光!
保险行业科技建设现状与未来发展
近年来,保险行业加快科技发展,特别是云计算、大数据和人工智能等领域,均有不俗的表现。随着互联网的兴起,互联网渠道具有保单数量大和单笔保费低的特点,2019年国内互联网保单约400亿单,这是传统的IT系统难以支持的。以云计算、大数据和人工智能为代表的强大算力,高扩展性平台得到保险行业的青睐。保险公司纷纷加大投入,尝试云计算平台,如大型保险公司自建公有金融云,中型公司的重点建设私有云,小型保险公司上互联网公有云,保险业2018年IT硬件投入为161.4亿,这些都是保险公司的科技进步。
保险行业经营的是风险,保险本身就是遵循大数法则,业务中有大量的数据应用,精算主要参照行业和公司内部数据以及历史数据进行风险评估。在“量级”和“维度”上都不同于以往时代的计算要求,需要海量数据加工和计算的能力。另外,结构化数据和非结构化数据的处理,远远超过传统技术手段的能力范围。因此,大数据的海量数据处理能力成为当前保险行业新兴科技领域中非常重要的应用技术之一。作为最新的科技成果,人工智能正逐步发挥其商业价值。在保险行业,定价、营销、产品组合和售后服务等业务环节中,都可以应用人工智能来提升工作效率和质量。预计2022年国内保险公司在人工智能上的投入将达到94.8亿。当前,大型的保险公司以自主研发的方式,储备科技人才,累计人工智能方面的经验和成果,中小公司的进展相对落后,主要借助科技公司推动人工智能的应用。
未来,保险行业的科技发展过程中,行业监管、险企和科技公司将紧密合作,监管引领业务方向,保险企业强自身的科技能力,借助科技公司的力量,持续发展科技能力。在科技手段方面,随着5G技术、自动驾驶、基因检测等技术的成熟,保险公司在云计算、大数据和人工智能的基础上,加强上述几方面的投入和力量,以应对科技发展带来的挑战和机遇。因此,阳光科技建设始终坚持“共享、共建、共标准”,以标准化、智能化为方向,结合云计算和AI技术,全面解放人工操作,追求成本优化,提升交付效率,为阳光保险的战略类、颠覆类等重点创新项目提供基础服务支持,助力公司快速发展,实现科技赋能、科技引领业务和数字化转型。未来规划主要有三个方向:
一、致力于打造业科融合的敏捷科技团队,快速响应业务和赋能业务。
二、坚持智能化方向,大幅度提升客户服务的智能水平。
三、追求线上化闭环运作,形成扁平的组织架构,实现成本和效率的平衡。
文/阳光保险集团信息技术总监石运福
编辑/王雪燕
来源/51CTO
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】