与“llama”相关的TAG标签
MetaFAIR与加州大学伯克利分校今日联合推出全新研究成果——ActiveReading框架,首次将“主动学习”理念引入大模型训练流程。该框架让模型在阅读指定材料时,自主生成个性化的学习策略,从而实现知识的高效、深度吸收,尤其适用于大规模训练场景。具体而言,当模型接收到一篇文档时,会先自行规划“学...
据BusinessInsider报道,Meta正加速推进其人工智能模型的开发进程,计划于2025年年底前正式推出新一代Llama4.X模型,该版本在内部也被称为Llama4.5。据悉,Meta超级智能实验室(MSL)下设的“TBD”团队正主导Llama4.X的研发工作,致力于在年底前将其推进至可投入...
近日,IDC正式发布《中国AI公有云服务市场份额,2024》报告。数据显示,2024年中国AI公有云服务市场规模达到195.9亿元,百度智能云以24.6%的市场占有率稳居榜首,连续六年、累计十次领跑中国AI公有云市场。IDC《中国AI公有云服务市场份额,2024》报告报告显示,2024年中国AI公有...
英伟达RTX5090新款中国特供版上市,最新基准测试显示其游戏性能与RTX5090D持平,但生产力与AI性能最高下滑25%。GeForceRTX5090DV2在游戏与跑分测试中与RTX5090D难分伯仲,但生产力性能下降达25%,AI测试也有10%差距。超能网最新测试报告证实,新版GeForceRT...
本周,阿里巴巴接连推出三款重量级大模型,迅速包揽基础模型、编程模型与推理模型三大主流领域的全球开源榜首。最新发布的千问3非思考版基础模型,被国际权威AI研究机构ArtificialAnalysis评为“全球最智能的非思考型基础模型”;千问3推理模型性能媲美顶尖闭源模型Gemini2.5Pro与o4-...
科技媒体techpowerup报道称在几乎所有CPU形态中,AMD都做到了“全球最快”。AMD在最新的Top500超级计算机排行榜中,得益于第四代EPYC“Genoa”CPU和InstinctMI300AAIGPU的强大组合,一举斩获金牌和银牌。在AIPC方面,AMD还推出了代号为StrixHalo...
7月18日讯,寒武纪于昨日发布最新公告,宣布对2025年度向特定对象发行A股股票的方案进行调整。根据更新后的方案,公司计划发行股票数量不超过2091.75万股,募集资金总额不超过398532.73万元。寒武纪指出,扣除发行费用后的募集资金将重点投向面向大模型的芯片平台项目、面向大模型的软件平台项目,...
7月27日,移远通信正式宣布与RWKV公司达成深度战略合作,双方将基于移远的高性能算力平台,对RWKV最新模型架构进行优化与适配,携手推进大模型在终端设备上的低资源、高效率部署。此次合作成果首次在2025世界人工智能大会(WAIC)上惊艳亮相,标志着端侧大模型技术向更高效能、更广泛应用场景迈出了重要...
6月12日,全球最大的AI开源社区HuggingFace发布了最新的AI开源贡献榜,中国团队表现亮眼,阿里通义千问跻身全球第五、中国第一,DeepSeek位列第九,是前十中唯二的非美国机构。据悉,该榜单由HuggingFace官方对全球开源模型的主要机构进行评估,考察指标涵盖开源模型、数据集、开发者...
在大模型的训练中,强化学习算法一直是提升模型性能的关键。然而,其面临着计算资源要求高、训练速度慢等问题,让普通企业机构望而却步。面对行业共性难题,近日,在360数字安全集团冰刃实验室主导下,打造出“轻量化、高性能”的AI训练方案:RL-LoRA,在保持模型泛化能力的前提下,体积仅为原始全参数模型的1...
