分类: AI大模型 0 条评论 如何微调Transformer《How to fine-tune a Transformer?》 但这在今天仍然有用——许多人发现微调变形金刚是出了名的棘手,也许这里的一些观察结果会有所帮助。 我们将为目前正 […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 哥伦比亚大学|使用 Transformers 预测大脑活动 使用 Transformers 预测大脑活动 标题:Predicting brain activity usi […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 Thespian: 多角色扮演游戏代理 Thespian: 多角色扮演游戏代理 标题:Thespian: Multi-Character Text R […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 清华发布SmartMoE:一键实现高性能MoE稀疏大模型分布式训练 PACMAN 实验室探索大模型分布式训练系统再出新成果。2023 年 7 月,清华大学计算机系 PACMAN […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 Google DeepMind|指导图像描述模型生成更具体的描述 Guiding Image Captioning Models Toward More Specific Ca […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 斯坦福“大型语言模型”课程 斯坦福“大型语言模型”课程:涵盖自然语言处理(NLP)领域中的大规模预训练语言模型,这些模型已经在各种任务中成 […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 文档布局分析的图方法 A Graphical Approach to Document Layout Analysis Jilin […] admin 最后编辑于 2025年2月19日 阅读更多 0 条评论 大模型Agent能力全面评测,清华伯克利发布AgentBench,AK高赞论文 AgentBench: 评估LLMs作为Agent的能力 标题:AgentBench: Evaluating […] admin 最后编辑于 2025年2月18日 阅读更多 0 条评论 AI大模型训练背后,一条数据产业链正在形成 文 / 腾讯科技 郭晓静 “大力出奇迹”、“暴力美学”,这两个词一直伴随ChatGPT的讨论出现。而“大力”和 […] admin 最后编辑于 2025年2月18日 阅读更多 0 条评论 Anthropic|基于影响函数的大型语言模型泛化研究 Studying Large Language Model Generalization with Influ […] admin 最后编辑于 2025年2月18日 阅读更多 文章分页 上一页 1 … 46 47 48 … 65 下一页