模型训练和线上推理之间的数据一致性,是所有 MLOps 体系中绕不过的坎。训练时,我们用 Spark 从数据湖批量拉取数周的样本,生成特征;而在线上,模型需要毫秒级的响应,从某个键值存储中获取最新的实时特征。这两套路径,从数据源、计算引擎到
2023-10-27