在互聯網、大數據及云計算技術迅猛發展的當下,保險行業作為金融領域的重要成員,面臨著如何拓展渠道、及時轉變方向、如何快速創新等問題。改革、改良現有的經營管理方式、信息系統構建、數據整合分析手段等,是目前保險行業重點探索的業務提升、創新落地的方向。
作為數據整合及處理的核心──數據倉庫,既承擔著與保險核心系統及其他各個業務系統的數據ETL功能,又承擔著整合數據、分析挖掘數據等重要的數據處理功能,在當下時效性要求越來越高、數據需求變化越來越快、數據容量越來越龐大的多變形式下,傳統的數據倉庫技術架構已經無法滿足新的需求,迫切需要新一代的數據倉庫解決方案。
保險業新一代的數據倉庫采用大數據平臺(Hadoop)+分布式數據庫(MPP)的混合式架構,包括了數據采集層、大數據存儲及處理層、大數據挖掘及展示層、大數據應用層、大數據管控中心、運營及管理中心等。無論是結構化還是非結構化數據,都可以經由平臺進行實時、非實時采集,使用分布式文件系統存儲,運用基于離線、內存、實時流等不同計算引擎進行處理、運算、挖掘,最終實現數據價值的可視化及不同應用場景的數據支撐。
新一代數據倉庫解決了傳統數據倉庫無法滿足的實時流式數據處理、非結構化數據處理、海量數據計算查詢效率過低、數據無法全時在線、擴容成本偏高等技術及成本問題,全面應對了新需求:
1. 數據ETL過程加速
從源系統的數據采集開始,運用分布式、高性能、高可靠的多種技術組件進行數據ETL,讓源系統的業務數據變化以實時、準實時的方式盡快反饋到數據倉庫中;
2. 數據整合及加工高效
使用分布式內存計算等手段,輕松應對海量數據的整合及處理,提升應用層的客戶體驗,提升決策支持的時效性;
3. 數據實時處理
面對應用系統產生的大量實時數據,使用實時流式數據處理技術,在毫秒級、秒級時間內完成數據計算,實時生成結果,快速響應外部需求變化;
4. 數據減負,保護投資
新一代數倉技術可以很好地降低企業既有老數倉的負載,分離數據,保證不同價值數據的存儲及流轉,保護企業的原始投資。
為了更好的體驗,請使用豎屏瀏覽