职位描述
该职位已进行加V认证,请放心投递
职责描述:
1.负责rdma网络相关的架构设计、配置、调试、性能优化以及持续稳定性运维保障;
2.主导训练网络系统的建设、优化和运维,保障业务系统不间断运行;
3.负责对现训练集群系统、网络、容器、虚拟化维护;
4.负责突发事件的快速响应及故障排除;
任职要求:
岗位基本要求:
1、了解训练网络架构,熟悉主流llm训练流程及数据流,pod规划原则,有配置roce/ib环境经验
2、熟悉 linux系统,主流虚拟化及容器相关技术,具备python编程能力,有网络自动化项目者优先;了解k8s相关网络模型及flunel\calico等主流网络插件。
3、了解sdn相关场景,能较快学习不同厂商的sdn控制器使用,部署sdn以及排除sdn场景的网络故障;熟悉云网络相关知识,了解open stack。
4、精通网交换技术以及常用路由协议,如 ospf/is-is/bgp 等; 了解tcp/ip模型,熟悉相关协议栈,如ipv4/ipv6、tcp/udp、nat、dhcp、dns。熟悉常见vpn,如:ipsec/gre/ssl vpn的原理和使用;
5、了解sdwan工作原理,具备sdwan排障能力,具备企业sdwan整体规划、部署经验者优先;3.具有5年以上相关工作经验,计算机或相关专业本科或以上学历;
6.具备传输、网络安全产品运营维护经验者优先考虑;主流品牌路由、交换、防火墙、waf、漏扫、负载均衡器等操作、配置与管理;
7.有主流网络设备厂商工作经验,ccie证书、hcie证书者优先考虑;
8.有大型roce和ib运维经验值优先;
工作地点
地址:山西
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
百度在线网络技术(北京)有限公司
- 互联网·电子商务
- 1000人以上
- 私营·民营企业
- 北京海淀区上地十街10号百度大厦