供应商需具备以下能力:
1. 具有强化学习相关项目研究经验,具有良好的工程落地与平台化能力;
2. 熟悉主流强化学习算法如DQN、 PPO、 DDPG等,熟悉Pytorch、 Tensorflow机器学习框架;
3. 扎实的的Python编程能力;
4. 针对场景持续优化控制算法,以提升系统性能、产品稳定性和智能化水平例如解决样本效率低、探索不足、奖励稀疏等问题,结合离线强化学习或分层强化学习提升效果;
5. 具有跨技术融合能力,例如结合生成式AI(如GAN、Transformer)、大语言模型(LLM)与强化学习,开发多模态交互系统或自动化决策框架。
联系人:
技术:梁宇翮/15602191856/liangyuhe@catarc.ac.cn
商务:陈菁菁/15202283735/chenjingjing@catarc.ac.cn