职位描述
该职位已进行加V认证,请放心投递
职责描述:
-负责大规模ai计算集群基础设施和产品在私有化场景下的设计与研发工作
-构建异构多芯计算集群,优化gpu资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率
-基于标准kubernetes技术,负责云原生ai组件研发工作,包括训练推理服务编排、gpu资源调度和混布、ai存储、高性能网络等
-基于ai计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力
-提升服务和产品的稳定性,优化服务性能和可扩展性
任职要求:
-计算机及相关专业,本科及以上学历
-熟悉kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有kubernetes开发和维护经验
-对kubeflow、volcano、pytorch、gpu芯片架构有一定了解者优先
-具备良好的沟通能力和团队协作精神,严谨的工作态度,注重工程质量,有独立解决各种系统问题的能力
-善于学习新的知识,动手能力强,有强烈的责任心,喜欢钻研技术
工作地点
地址:山西
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
百度在线网络技术(北京)有限公司
- 互联网·电子商务
- 1000人以上
- 私营·民营企业
- 北京海淀区上地十街10号百度大厦