5月28日,贵州省委常委、常务副省长谌贻琴表示,将全力支持九次方大数据公司将贵州省作为基地,打造成为中国大数据清洗领域的“大数据富士康”。同日,九次方大数据公司执行总裁王叁寿也在贵阳表示,大数据行业一定会出一个“富士康”来清洗全球的金融数据,九次方在做的正是这样一份工作。
应用大数据,数据清洗是第一步
众所周知,目前政府、银行和保险(放心保)公司内部存在大量的非结构化、不规则的数据,将这些数据采集上来,清洗成为结构化、规则的数据,是大数据产业的一个核心环节。
例如,商业银行每一分每一秒都在积累着内涵丰富的客户数据,但在大数据概念兴起之前,银行客户数据的巨大价值并没有得到充分关注,传统的数据挖掘技术在商业银行领域的应用较少。
王叁寿认为,如果想拥有大数据,商业银行就必须具备对非结构化数据的抽取、转换、清洗的处理能力,并打破结构化和非结构化数据之间的壁垒,实现信息融合。
数据清洗是大数据产业的核心环节
王叁寿认为,商业银行大数据服务体系的建设目标即是整合结构化数据库和非结构化信息库中的企业客户、小微企业、个体户大数据资源,通过信息价值挖掘、用户行为分析、智能推荐引擎等技术手段,对现有客户资源进行统一管理和利用、二次开发,使大数据信息产生最大化价值,为银行董事会、分行行长、信贷风险部门、客户服务经理提供大数据挖掘、数据分析、统一检索、信息定制等综合信息服务。
银行业内人士也表示,商业银行只有让内部的数据转化为对业务产生洞察的大数据系统,才能推动管理精细化,提升管理效率和效益,驱动经营策略的制订,在金融市场中保持竞争优势。
发展大数据产业贵州有优势
王叁寿一直认为,“除了很强的技术团队,剩下的活都是‘富士康’要干的事。”
也就是说,数据采集与录入,包括后期的数据更新、跟踪,甚至企业的面访与尽职调查,都需要大量的人工。而近期一直致力于大数据产业规划的贵州省在这方面具有得天独厚的优势。
首先,对于全国来说,贵州省的劳动力数量相对富足,劳动力成本相对较低,而且受教育程度不断提高。
其次,大数据产业发展需要大量计算机技术和数学建模技术人才。据了解,贵州省高等学校教育资源从1996年的22所增加到2010年的47所,已经翻了一倍。
最后,发展大数据产业需要电、需要地。贵州省地广人稀,且电力供应充足。
贵州省委常委、常务副省长谌贻琴(左)与九次方大数据公司执行总裁王叁寿(右)