返回列表 发布时间:2025-03-13

学术活动预告:电智学术论坛之智能自动化学科(2025年3月13日)

【时间】2025年3月13日(周四)下午14:30 开始

【地点】线下讲座,9A103会议室

【主题】deepseek-r1模型介绍及其训练方法研究

【主讲人】苏航博士

【内容简介】

     近年来,大语言模型在文本生成、对话等任务中展现了强大能力,但在需要严格逻辑推理的场景(如数学证明、代码生成)中仍存在显著缺陷。如何提升大语言模型的复杂推理能力并保证推理过程的可解释性,成为亟待解决的关键问题。为解决此问题,推理语言模型应运而生,然而大规模的推理语言模型需要更大规模的监督学习数据和计算资源。DeepSeek-R1通过更加存粹的强化学习方法重塑了大语言模型推理能力的训练方法基准。使模型能够自主学习和发展推理行为,其第一代模型DeepSeek-R1在性能上已达到甚至超越 OpenAI 等前沿专用系统的水平,树立了新的行业基准。并且DeepSeek通过新的知识蒸馏技术,将先进的推理能力迁移到更小、更高效的模型中,使强大的人工智能变得更加易得且经济高效。这种对可扩展性和效率的双重关注,使得 DeepSeek 成为了推动国内大模型AI发展的重要力量。本次讲座将基于DeepSeek-R1的原论文内容探讨其训练方法。

   



诚挚欢迎广大师生参加。