GitHub: RenderMe-360/RenderMe-360 这是论文“ RenderMe-3 […]
2023年6月8日的文章
《A Course in Reinforcement Learning》
400+页的MIT强化学习课程免费教材,根据2019-2023的MIT强化学习课程内容整理而来,涵盖了强化学习的基本概念、方法和应用,特别是近似动态规划、神经网络、策略迭代和蒙特卡洛树搜索等技术。参考页面提供了教科书、课程材料、视频讲座和研究论文的链接,是强化学习领域重要参考资源
【推荐】大语言模型综述(中文)
地址 论述地址 作者 赵鑫,周昆*,李军毅 *,唐天一,王晓磊,侯宇蓬,闵映乾,张北辰,张君杰,董梓灿,都一凡 […]
大语言模型(LLM)微调技术笔记
Github:地址 注:本文大段摘抄自[1] 图1:大模型进化树[2] 大模型微调 在预训练后,大模型可以获得 […]