【总结】降低大模型落地成本
趋境科技成立于 2023 年底,创始团队来自于清华大学计算机系高性能所,拥有超过10年的高性能计算、分布式存储、AI计算引擎优化等领域的技术积累。团队拥有 OSDI、SOSP、ASPLOS 等国际期刊一作论文数十余篇,数个创新奖项,在AI和存储相关的技术系统和软件领域,有多年学术与产业实践经验。
团队成员90%以上为硕士、50%以上为博士,均毕业于清华、新加坡国立、北航、北邮、北理等国内外知名院校,来自英特尔、百度、字节、深信服等企业,在AI和存储相关的技术系统和软件领域,有多年学术与产业实践经验。
趋境科技拥有业界初创的“以存换算”和“全系统异构协同推理架构”技术,通过释放存力作为算力的补充,降低对算力的需求;同时紧密联动 HBM/DRAM/SSD 和 CPU/GPU/NPU 全系统异构设备,突破显存容量的限制,充分释放全系统的存力和算力。这一创新方案突破了以往方案的理论优化极限,实现了整合机器所有异构算力资源的目标,使得推理吞吐量提升超过10倍,大幅降低了大模型的落地成本。
趋境科技与清华KVCache.AI团队共同发布开源项目“KTransformers”,是业界创新xing利用单个 4090 即可运行千亿大模型、完成1M超长上下文推理的高性能推理框架,一经发布引起国内外的众多反响。
趋境科技联合月之暗面Kimi、清华MADSys 实验室、9#AISoft、阿里云、华为数据存储、面壁智能等产学研力量共同发布开源项目 Mooncake,共建以 KVCache 为中心的大模型推理架构,通过以存换算的创新理念大幅度减少算力开销,显著提升推理吞吐量,推动大模型推理向更高效的推理平台方向发展。
公司官网:*
北京趋境科技有限责任公司招聘要求怎么样:趋境科技都在招什么人? 趋境科技招聘类别计算机/网络/技术类占比最多占88.2%,其次是其他(研发和技术类)占26.5%。趋境科技什么学历能进?本科占比最多占100%。工作经验趋境科技有什么要求?3-5年占比最多占61.8%,其次是1-3年占29.4%。趋境科技工作地区在哪?北京占比最多占79.4%,其次是合肥占11.8%。数据根据近一年招聘岗位分析,仅供参考。
恭喜您,提交成功!
您的编辑正在审核中,1个工作日内,会以邮件通知您结果
提交失败。