本篇文章1684字,读完约4分钟
2020年6月30日10时42分,恒生电子旗下子公司易卜林恒生数据中心(ibrain Hang Seng Data Center)最近推出了统一的投资研究数据标准化服务——投资研究数据集市,通过其处理和生产财务数据的能力,解决了投资研究数据的一致性、及时性、准确性、及时性和权威性问题。
复杂数据资产的统一管理
数据资产是由系统生成的所有数据,包括数据表、指示器和应用编程接口,“集市”可以以统一的方式显示、搜索和管理这些众多复杂的数据资产。
恒生电子(Hang Seng Electronics)建立的投资和研究数据集市基于大数据技术,利用大数据计算、自然语言处理(nlp)、知识地图(knowledge map)等大数据技术来构建可视化资产地图。用户可以查阅资产图和数据质量报告,自动建立上下游数据之间清晰的血缘关系,方便用户追踪。
此外,还提供了资产搜索功能,用户可以自定义输入的关键词搜索,通过组合搜索和高级搜索功能,实现100%的用户搜索目标。
实时完成数据流的处理和清理
没有合格的数据,即使是最好的工程师也无法发现其价值。为了方便起见,数据应该是常规的,因此需要清理。
投资研究数据集市的模型处理模块位于整个数据流的清理和处理中,贯穿从数据源到信息接口的整个过程。其功能包括数据源管理、ods管理、edw分析、组合管理、信息集市、数据收集、数据开发和任务调度。它还支持两种开发模式,即白屏处理模式和代码开发模式,以保证整个模型处理过程的完整性,并实时完成整个过程。
其中,恒生统一信息模型是根据sdom标准和cfi国家标准构建的。信息数据模型的整体设计思路是指粘贴源层、模型层和应用层的模型设计原则,为金融机构信息数据设计统一的投资研究数据模型和应用数据模型,并对核心主题数据进行清理。
数据质量的有效控制
数据也会不服从,这就要求监控数据模型登陆的整个etl过程,及时发现数据质量问题,并对发现的问题进行处理。数据“不服从”主要包括:数据延迟、无效数据、数据缺失、重复数据和数据一致性。
为了提供高质量的投资和研究数据服务,恒生电子建立了投资和研究数据治理系统:提供可视化监控平台,提高监控和预警效率;建立一个大的数据屏幕,实时直观地显示当前的数据质量问题和数据使用情况;建立数据质量检查和提醒反馈机制;支持系统自动化监控和用户自反馈数据质量问题;实施各种数据质量检查机制;形成投资研究数据使用效率的量化指标,自动生成供应商整体质量评价结果;为敏感数据提供可视化的判断和处理平台,支持数据管理团队快速响应。
经过多年的业务积累,恒生电子总结了数千条质量检验规则,涵盖深度规则和一般规则,包括一致性检查、完整性检查和交叉检查。验证完成后,可以生成数据质量验证报告,并以大数据屏的形式出现,具有清晰的质量问题预警和质量反馈机制,数据处理性能达到S级响应。
基于一站式服务理念的数据服务平台
沟通通常是最昂贵的。因此,恒生电子建立了统一的数据服务总线,统一管理内部和外部api服务,解决了前端和三方系统之间的数据检索和利用问题。恒生数据服务引擎模块的设计理念是一站式服务,提供统一管理、统一授权和统一分发服务的功能。
数据服务不仅支持将现有的api快速注册到数据服务平台,实现统一管理和发布,还支持利用恒生夏令时网关将API服务一键式发布到API网关。用户只需要关注api本身的查询逻辑,而不需要关心运行环境等基础设施。数据服务将准备数据资源并支持灵活扩展,以降低运营和维护成本。
未来,恒生投资研究数据集市将进一步满足金融机构在股票研究、债券研究、基金研究、产品研究、战略研究、宏观研究、行业研究和市场研究等方面的发展需求,提升金融机构在研究报告撰写、股票评估、基金评估、投资池、模拟投资组合、定量筛选、信用评级、估值定价、提前风险控制和绩效归因等方面的专业能力。
除了投资数据集市,易卜林恒生数据中心还构建了生态核心产品体系,涵盖数据采集、存储、处理、分析和服务等专业产品和服务,在确保数据安全的前提下,为金融机构提供大数据处理一站式全流程解决方案。
来源:央视线
标题:恒生电子推出投研数据标准化服务“投研数据集市”
地址:http://www.yangshinews.com/ysxw/12029.html