直播预告丨中高频多因子库存储最佳实践

2022年11月30日 09:20:29   [来源:互联网]   [阅读:-]
字体:【

因子挖掘是量化交易的基础。随着历史交易数据日益增多,交易市场量化竞赛的不断升级和进化,量化投研团队开始面对数据频率高、因子数量多的场景,以10分钟线10000个因子5000个股票为例,一年的因子数据约为2.3T左右,1分钟线的数据量达到23T,3秒线的数据量将达到460T。如此量级的数据就对因子存储方案提出了很高的要求。

      那么,我们要如何解决中高频多因子数据的存储问题呢?目前行业有哪些核心挑战?


因子库存储有哪些挑战?

      庞大的数据量

      因子计算通常有3个维度,股票、因子和时间。我们做一个简单的计算,国内股票总个数按5000来算;因子个数一般机构大约为1000起,多的甚至有10000;时间频率高的是每3秒生成一次数据,频率低的也有10分钟一次——也就是说,一只股票一个因子一天会生成24到4800个tick。面对如此庞大的数据量,如何保证高效的数据写入是因子库存储的一大挑战。

      动态变化的因子库

      因子库经常会发生变化,往往需要新增因子、修改因子定义,或加入新的股票等。面对T级的因子数据,单个因子的新增、修改、删除耗时应该保证在秒级才能确保整体量化投研的效率。

      最适合金融计算的输出方式

      量化金融的多因子建模通常需要以面板数据进行截面因子分析。用户需要从海量的因子数据中尽可能高速并精准的读取数据,对齐多个因子后以面板的方式输出。这对数据库的性能提出了极大的挑战。


直播预告

      2022年12月1日晚7点半,DolphinDB 创始人周小华博士,和 DolphinDB 数据分析负责人毛忻玥,将与大家共聚直播间,围绕「高频多因子存储的最佳实践」与大家展开探讨。点击海报并长按,扫描二维码报名吧!

推荐阅读:叶紫网


相关新闻
新闻焦点
凡关乎美的东西,都离不开色彩。一直觉得,中国是个没有绚烂色彩的国家,能想起来的色彩,也都单调乏味,比如,宫墙红?也许是太熟悉了的缘故。反倒是很多[更多]
正所谓:一屋,两人,三餐,四季。最幸福的生活莫过于,平淡却温馨的日常生活。想要过上这种生活,取决于三餐离不开的餐厅。但是实际上你家的餐厅区域,餐[更多]
厨房虽小,却装着天下美食,在家里,不管是谁主厨,一个好的厨房绝对能让整个烹饪过程高效节能。空间动线//节省劳动时间//在做饭过程中,是不是总觉得[更多]
生活不止眼前的苟且,还有买房和家装,而家装的投入决定了之后生活居住的品质。相信大多数业主从拿到新家钥匙的那一刻起,脑海中对未来生活的完美憧憬和口[更多]
关于我们 | 联系我们 | XML地图 | 网站地图TXT | 版权声明
版权所有:嘉兴都市网未经授权禁止复制或建立镜像
相关作品的原创性、文中陈述文字以及内容数据庞杂本站无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本网站将立即予以删除!
中国互联网违法和不良信息举报中心 网络警察报警岗亭