工作职责】1、负责多模态大模型数据语料(文本、图像、视频、语音等)生产和处理,包括但不限于数据分布研究、数据获取、数据规范化、数据质量检测、打标等,确保训练数据的有效性,可用性;2、负责优化和改进现有的数据清洗和质检打标流程,提高效率和准确性;3、负责大模型相关数据工具链的开发实现及应用维护等;【岗位要求】1、本科及以上学历,计算机相关专业或数学专业,2年以上开发经验;2、扎实的编程基础,精通PYTHON,熟悉一种或多种深度学习框架(Pytorch/TensorFlow)作为加分项;3、熟悉 Linux 常用命令,掌握在 Linux 下搭建环境及开发部署测试,熟悉docker镜像操作和部署;4、在大模型、算法、数据挖掘、语音、图像处理等一个或多个领域有扎实的理论基础和丰富的实战经验优先;一、Python 开发(算法方向) 1、统本学历,2年以上Python语言开发经验 2、有图像处理、音频处理、视频处理、Pytorch、大模型、模型部署、AI算法中的任意一种经验即可; 3、有扎实的编程基础,熟悉Linux环境,熟悉Linux常用命令