购买与服务热线:400-810-0466

服务邮箱:Support@sugon.com

新华社大数据处理平台

客户需求

新华社多媒体数据库中的数据资源超过1.5亿条,如何更好使用和盘活这些数据资产,使之转化为新的生产力,服务于新华社战略转型,是新时期新华社信息化建设的一个历史使命。现有的文本检索系统检索精度差,基于规则的静态分词不适应业务发展需要。同时,对于历史新闻数据的语义分析,新闻文档对象之间的关系理解,都需要借助新的技术手段予以实现。另外,对于多语言的分析处理,海量多媒体资源(图像,音视频)识别和标引的需求也亟待被满足。

从业务角度上看,新华社业务种类的日益丰富,原有的IT系统已显露出诸多的不足和问题,难以对新业务和新的需求进行快速的响应和有力的支撑。另外,随着新华社新闻稿件半结构化、非结构化数据的日益增长,信息管理平台应用已面临着数据备份恢复时间长、运维成本高、存储弹性扩展能力差、存储成本高、无法满足业务多维查询的问题;文档服务平台存在海量历史数据离线检索不便、数据备份恢复时间长的问题。同时,随着近年来业务的发展,产生了结构化数据与非结构化数据整合存储与联动查询的新需求。

方案设计

曙光公司大数据一体机在解决如上问题和新需求方面较传统技术手段更有优势,并具备现实可行性。非结构化数据分析采用XData大数据智能引擎,结构化数据分析采用XData并行数据库,系统架构如图:

1562924979948473.png

客户收益

联系我们

售后服务

严正声明