崗位職責
?
1. 負責大模型推理框架、配套軟件棧及SDK的設計、開發與維護,完成各類算子編碼、內存管理、任務調度等核心模塊開發。
?
2. 結合公司自研芯片與服務器硬件,完成主流大模型的移植、適配、部署工作,開展量化、稀疏化、剪枝等模型優化,持續提升推理吞吐、降低響應時延。
?
3. 參與大模型定制化研制與迭代,根據業務及硬件特性對模型結構、運行邏輯進行改造優化,支撐模型高效運行。
?
4. 分析推理系統運行瓶頸,定位并解決軟硬件聯調、并發調度、兼容性、穩定性等各類問題,保障線上服務穩定運轉。
?
5. 跟蹤大模型推理、異構計算、高性能計算等前沿技術,完成技術調研、方案驗證與落地;編寫相關技術文檔、接口規范及使用手冊。
?
6. 配合算法、硬件、測試等跨部門團隊完成聯調、測試與交付工作。
?
任職要求
?
1. 本科及以上學歷,計算機、人工智能、軟件工程、電子信息等相關專業。
?
2. 熟練掌握 C++、Python 編程語言,具備扎實的數據結構、算法基礎,熟悉 Linux 開發環境。
?
3. 了解大模型基本架構與推理流程,熟悉主流AI推理框架,有實際項目開發經驗者優先。
?
4. 掌握多線程、并發編程、計算機體系架構等知識,具備算子開發、模型推理調優經驗。
?
5. 具備良好的問題分析、故障排查能力,邏輯清晰,溝通協作能力強,擁有較強的自主學習能力。
?
企業招聘登記&簡歷投遞請登錄:m.yntcard.com
平臺質保,招聘靠譜,1天內快速響應推薦人選,1周可關閉職位完成交付,200萬高端人才數據庫,20年獵頭服務,覆蓋全國超110座城市。
更多上海獵頭職位資訊,請關注乾坤獵頭公司:qiankunlt