跳转至主要内容

04AI门户网

分类: AI大模型

0 条评论

数学能力超过ChatGPT!上海交大计算大模型登开源榜首

国产数学大模型,能力已经超过了ChatGPT! 最新榜单中,上海交大GAIR实验室出品的Abel专有大模型: […]

admin
最后编辑于 2025年2月17日
阅读更多
0 条评论

LongLoRA:长上下文大语言模型的高效微调

LongLoRA: Efficient Fine-tuning of Long-Context Large L […]

admin
最后编辑于 2025年2月17日
阅读更多
0 条评论

DualToken-ViT | 超越LightViT和MobileNet v2,实现更强更快更轻量化的Backbone

点击下方卡片,关注「04AI门户网」公众号 自注意力(self-attention)视觉Transformer […]

admin
最后编辑于 2025年2月14日
阅读更多
0 条评论

耶鲁大学|教大型自然语言模型掌握生物学语言Cell2Sentence

Cell2Sentence: Teaching Large Language Models the Langu […]

admin
最后编辑于 2025年2月12日
阅读更多
0 条评论

大模型的本质及其在游戏行为分析中的应用

本期「中国游戏企业出海周周谈」直播分享游戏领域内的数据治理、游戏自动化开发、基于LLMs的行为分析新思路等干货 […]

admin
最后编辑于 2025年2月12日
阅读更多
0 条评论

Writer模型开源,可商用,共8个模型

Writer在huggingface上开源了其使用的大语言模型Palmyra,有8个型号分别是small、ba […]

admin
最后编辑于 2025年2月12日
阅读更多
0 条评论

澜舟科技与潞晨科技签署战略合作协议,联手打造更高效的企业级大模型解决方案

近日,北京澜舟科技有限公司(简称“澜舟科技”)与北京潞晨科技有限公司(简称“潞晨科技”)达成战略合作协议。此次 […]

admin
最后编辑于 2025年2月12日
阅读更多
0 条评论

大模型的最大bug!回答正确率几乎为零,GPT到Llama无一幸免

 Datawhale分享  最新:大模型,来源:机器之心 大模型的逻辑?不存在的。我让 GPT-3 和 Lla […]

admin
最后编辑于 2025年2月12日
阅读更多
0 条评论

刷榜13个暗光增强基准!清华大学联合ETH等开源Retinexformer:亮、暗都有细节 | ICCV 2023

  04AI门户网报道   编辑:LRS 【04AI门户网导读】全面超越暗光增强sota模型,Retinexf […]

admin
最后编辑于 2025年2月12日
阅读更多
0 条评论

长文本信息准确率超过ChatGPT,Meta提出降低大模型幻觉新方法

大模型的幻觉问题,又有新的解决方法了! Meta AI实验室提出了一种“分而治之”的解决方案。 有了这个方案, […]

admin
最后编辑于 2025年2月12日
阅读更多