汤森路透(Thomson Reuters) 公司以在新闻媒体方面的悠久历史而闻名,该公司非常注重与知名企业开展合作,加强对先进技术的利用,如Appriss公司和Praescient公司的分析技术,Palantir公司的可视化技术, Intellaegis 公司的实时数据流技术等。 近年来, 汤森路透公司致力于提供性能卓越的开源情报技术(如开源情报搜索、分析和可视化技术), 集成解决方案 (Integrated Solutions)即是其中一款主打产品。集成解决方案包括CLEAR系统到系统(CLEARSystem-to-System)和集成批处理(IntegratedBatch Processing) 两大子产品。 两者都是基于Hadoop的大数据分析系统,但存在明显区别。CLEAR系统到系统可以提供实时数据检索功能(附带分析和可视化功能),集成批处理针对数据的输入、处理和输出提供不同的程序。除此之外,两大子产品的其他工作方式都非常类似。
1.CLEAR系统到系统
CLEAR系统到系统是一款经典的大数据分析系统, 旨在集成和改进现有数据框架的性能。 该系统位于客户当前系统之上,可执行三项基本功能:提供对汤森路透 “优质内容” 数据库的访问; 将公共渠道和私有渠道的广泛数据与用户自身已有数据相集成;运用分析、可视化和目标定位数据来促进调查工作。CLEAR系统到系统的主要优势有:将新数据与已有数据相集成,基于SSL 256位加密方法进行自动化内置加密;通过识别目标的IP地址来实现定位;通过在单个搜索中自动查询新旧数据以提高工作效率。值得一提的是,CLEAR系统到系统利用合作伙伴 Intellaegis 公司的 Masterqueue 产品, 可以提供实时数据流处理能カ, 而这些数据包括来自物联网的数据。
2.集成批处理
集成批处理与CLEAR系统到系统一样,集成了执法机构现有的数据库, 使用户可以将新的数据与自身已有数据相集成。 汤森路透的数据库可以提供对数百万记录(无论是历史记录还是当前记录)的访问,并成批地将访问结果用于下一步分析。
作者:晨月
编辑:广翰楼
暂无评论