电商搜索和推荐场景下的MLOps实践.pdf

电商搜索和推荐场景下的MLOps实践.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电商搜推场景下的MLOps实践 QCon 2023全球软件开发北京大会 李友科 京东-零售 自我介绍 李友科 • 京东零售 • 负责系统的风险控制、质量保障与效 率提升 QCon 2023全球软件开发北京大会 • 在电商搜推场景下,测试服务化、算 法服务化、MLOps平台化落地的核心 参与者 “You Got a Dream, You Gotta Protect It” Scene From The Pursuit of Happyness 议程  概况  规模化后,成本、效率与质量  工程实践成就算法服务化 • 低负载治理 • 算法协作 • 模型双飞轮 • 团队协作 • 特征工程效率与质量QCon 2023全球软件开发北京大会 • 模型与特征  总结 • 算法服务化 • 模型评测  从算法服务化到MLOps平台化 • 工作界面改变 • 度量与平台自我迭代 • 平台系统架构 ML在需求交付流程中的位置 大环境和趋势 : • 互联网降本增效 • 技术部门,工作价值量化,成本效率为主 电商行业 : • 存量竞争 • 用户转化率、商家可运营、流量生态 • 搜推系统核心竞争力,预测服务质量和算法迭代 QCon 2023全球软件开发北京大会 效率 流量分发 : • 模型从简单线性、树型模型到复杂的深度模型 • 业务效率持续提升 • 业务赋能、流量调控 • 快速应对业务需求 ML生命周期与MLOps QCon 2023全球软件开发北京大会 模型双飞轮 (一) • 正在AB实验的模型,迭代目标:效率提升、业务 实验模型 赋能、流量调控 • 通过AB实验挑选出,满足全量的模型。全量模型 全量模型 服务大部分流量,同时作为实验模型的对比基准 QCon 2023全球软件开发北京大会 • 对应上一个版本的全量模型,保留1-2周,对比观 Holdback模 察全量模型的业务效果 型 模型双飞轮 (二) QCon 2023全球软件开发北京大会 特征工程的效率与质量 (一) • 特征:Dump原始特征 • 效率:在线和离线并行开发算子,不需要等待算子上线,就可以开始 离线模型开发和训练。可能需要花费大量时间对齐算后特征 • 质量:如果不能保障算子质量,在线和离线算后特征不一致风险极高 QCon 2023全球软件开发北京大会 特征工程的效率与质量 (二) • 特征:Dump算后特征 • 效率:离线训练需要等待在线算子开发、特征积累。模型开发前期等 待在线Ready ,一般需要2-3周 • 质量:理论上,不存在算后特征一致性 QCon 2023全球软件开发北京大会 特征工程的效率与质量 (三) • 特征:Dump算前特征,共享算子 • 效率:在线和离线共享相同代码的算子;只需要算子开发完成,就可 以开始离线模型开发和训练 •

文档评论(0)

优选文档 + 关注
实名认证
内容提供者

专注于发布优质文档,喜欢的可以关注一下哦~

1亿VIP精品文档

相关文档