全球最大的做市商之一 Citadel Securities 通过在 Google Cloud 虚拟机上开展调查,提高了调查速度、扩大了调查规模。

Citadel Securities 是全球规模最大的做市商之一,每天的交易额超过 4,000 亿美元。该公司构建并部署了行业领先的强大定量模型,为各个市场和地区的数十万种证券资产做定价。要构建这些模型,做市场必须进行定量调查。

为了提高调查性价比,同时提升调查效率,Citadel Securities 与 Google Cloud 展开合作,构建了新一代定量调查技术平台。

Citadel Securities 的平台构建方法

Citadel Securities 雇佣了数百名定量调查人员,他们负责搜索大量市场数据,用来构建能准确识别数千种金融证券价格的模型。在将这些模型投入使用之前,调查人员必须进行测试,验证模型的性能。例如,他们可以根据过去发生的市场事件或各种模拟的市场条件来测试模型。市场条件的模拟非常复杂,可能需要数千台服务器上的几千个处理器协同工作。

若能成功构建支持这项前沿工作的定量调查平台,可实现以下两个主要目标:

  • 缩短定量调查人员需要为测试或实验投入的时间,最大限度提高调查效率

  • 提高为数据计算和存储所投入成本的效益,增加单位成本的模拟次数,提升性价比

最初,Citadel Securities 构建了一个本地数据中心,并使用定制的高性能硬件来运行复杂的数据密集型模拟。随着该公司的调查工作负载日益繁重,团队不断扩大,追求的技术也日益复杂,他们需要一个能够具备相应扩缩能力的平台。他们遇到的主要挑战是,调查所需的时间和工作量可能波动很大,这会影响所需的核心数量。

Citadel Securities 有两个选择:要么构建一个足以应对需求高峰的数据中心,以便最大限度地缩短调查处理时间;要么构建一个针对非高峰需求的数据中心,从而实现更高的性价比,不过这样可能会遇到性能瓶颈和处理时间过长的风险。

在这种情况下,Citadel Securities 于 2017 年开始与 Google Cloud 合作。他们关心的问题不是“如何将本地工作搬到云端?”,而是“怎样才能构建最高效、可扩缩且具有成本效益的调查平台?”

考虑 IT 基础设施时,Citadel Securities 关心的不再是需要购买多少台服务器,而是以下问题:每天需要进行多少次测试?什么类型的核心最适合不同的测试?调查人员应该多快获得测试结果?

提高技术平台的弹性后,调查人员可以设定对平台的要求,让技术不再对调查形成限制。

在 Google Cloud 上构建解决方案

Citadel Securities 需要为调查人员打造一个这样的平台:纵向和横向都能进行几乎无限制的扩缩,同时也能最大限度地提高资源利用效率和成本效益。通过与 Google Cloud 的工程团队合作,Citadel Securities 获得了可扩缩的基础设施,并构建了专业的工具,例如可显示作业状态的 GUI 界面,以及可分析性能和监控效率的功能。

Google Cloud 的基础设施能够基于需求进行扩缩,还能管理和修补硬件,并具有天然的安全优势,因而省去了管理内部数据中心的开销。Google Cloud 多样化的存储产品组合能够分析访问模式,并通过不同的存储类别自动转换数据,从而以经济高效的方式支持 Citadel Securities 的各种数据需求,同时还能满足高吞吐量和低延迟的要求。

Citadel Securities 战略性地将按需选用的硬件与可抢占硬件搭配使用,以执行大规模并行计算任务,并使用同一位置机架中的优质硬件,来满足需要低延迟连接的高性能集群的需求。这种方法能够优化不同工作负载的成本和性能。

由于有专用链接与 Citadel Securities 的数据中心互连,因此大量数据流入了云端。具有精细控制机制的集中式数据湖可增强团队之间的协作,从而催生更广泛的跨战略分析洞见。

通过选择适合特定工作负载的理想硬件(具有 GPU 加速、计算优化或内存优化功能),调查人员提高了工作效率。凭借近乎即时的扩缩能力,调查人员的项目无需排队等待,可以快速投入工作。先进的网络 (200 Gbps) 和位于同一位置的虚拟机可确保最佳性能,同时还能提供调查人员所需的所有分析指标。

强大的安全性(包括加密和安全状况管理)帮助该公司满足了严格的合规性要求。“默认保障安全”的设计简化了流程,可确保调查平台从一开始就受到保护。将这些工作负载迁移到 Google Cloud 后,Citadel Securities 调查平台技术团队现在无需维护物理服务器场,因此可以专注于提供差异化功能,以推动规模更大、效果更好、速度更快的调查。

实现好处

最后的结果是,Citadel Securities 实现了业务拓展。现在,该公司可以同时启动超过 100 万个核心,这让数百位定量调查员能够并行运行作业。这意味着,调查人员的作业无需排队等待,所有作业都能在提交后立即运行,从而加快了获得分析洞见的速度,提高了工作效率。以前需要很多个小时才能完成的工作负载现在只需几秒钟即可完成。

此外,Citadel Securities 的成本(以每开展一个小时调查所需的成本计算)也有了大幅下降。由于能够结合使用不同的消费模式,还能扩缩计算和存储能力,这让该公司的资源利用率(包括核心利用率及内存利用率)大幅提升,运营开销锐减,性价比大幅提高。

该公司的平台能够更好地采用前沿技术,适应新硬件要求的能力也有了大幅提高,因此,调查人员能够利用新技术和新硬件更好地完成工作。

Google Cloud 的基础设施平台不仅解决了 Citadel Securities 的成本与性能无法兼得的难题,还为该公司开辟了新的可能性,让他们能够实现以前从未实现过的调查策略。

在 Citadel Securities 不断拓展技术和市场边界的过程中,他们现在拥有了支持长期增长所必需的灵活调查平台。

相关推荐