跳转至主要内容

04AI门户网

分类: AI大模型

0 条评论

如何微调Transformer《How to fine-tune a Transformer?》

但这在今天仍然有用——许多人发现微调变形金刚是出了名的棘手,也许这里的一些观察结果会有所帮助。 我们将为目前正 […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

哥伦比亚大学|使用 Transformers 预测大脑活动

使用 Transformers 预测大脑活动 标题:Predicting brain activity usi […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

Thespian: 多角色扮演游戏代理

Thespian: 多角色扮演游戏代理 标题:Thespian: Multi-Character Text R […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

清华发布SmartMoE:一键实现高性能MoE稀疏大模型分布式训练

PACMAN 实验室探索大模型分布式训练系统再出新成果。2023 年 7 月,清华大学计算机系 PACMAN […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

Google DeepMind|指导图像描述模型生成更具体的描述

Guiding Image Captioning Models Toward More Specific Ca […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

斯坦福“大型语言模型”课程

斯坦福“大型语言模型”课程:涵盖自然语言处理(NLP)领域中的大规模预训练语言模型,这些模型已经在各种任务中成 […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

文档布局分析的图方法

A Graphical Approach to Document Layout Analysis Jilin […]

admin
最后编辑于 2025年2月19日
阅读更多
0 条评论

大模型Agent能力全面评测,清华伯克利发布AgentBench,AK高赞论文

AgentBench: 评估LLMs作为Agent的能力 标题:AgentBench: Evaluating […]

admin
最后编辑于 2025年2月18日
阅读更多
0 条评论

AI大模型训练背后,一条数据产业链正在形成

文 / 腾讯科技 郭晓静 “大力出奇迹”、“暴力美学”,这两个词一直伴随ChatGPT的讨论出现。而“大力”和 […]

admin
最后编辑于 2025年2月18日
阅读更多
0 条评论

Anthropic|基于影响函数的大型语言模型泛化研究

Studying Large Language Model Generalization with Influ […]

admin
最后编辑于 2025年2月18日
阅读更多