llama_第8页_兰乔电商网

新闻⋅ 08-29 ⋅ 1681 阅读

MetaFAIR与加州大学伯克利分校今日联合推出全新研究成果——ActiveReading框架，首次将“主动学习”理念引入大模型训练流程。该框架让模型在阅读指定材料时，自主生成个性化的学习策略，从而实现知识的高效、深度吸收，尤其适用于大规模训练场景。具体而言，当模型接收到一篇文档时，会先自行规划“学...

Meta 正在全力开发 Llama 4.X，计划今年年底前发布

新闻⋅ 08-29 ⋅ 986 阅读

据BusinessInsider报道，Meta正加速推进其人工智能模型的开发进程，计划于2025年年底前正式推出新一代Llama4.X模型，该版本在内部也被称为Llama4.5。据悉，Meta超级智能实验室（MSL）下设的“TBD”团队正主导Llama4.X的研发工作，致力于在年底前将其推进至可投入...

IDC 报告：百度智能云连续六年居中国 AI 公有云市场第一

新闻⋅ 08-19 ⋅ 124 阅读

近日，IDC正式发布《中国AI公有云服务市场份额，2024》报告。数据显示，2024年中国AI公有云服务市场规模达到195.9亿元，百度智能云以24.6%的市场占有率稳居榜首，连续六年、累计十次领跑中国AI公有云市场。IDC《中国AI公有云服务市场份额，2024》报告报告显示，2024年中国AI公有...

RTX 5090 D V2新款中国特供版测试：游戏无压力但AI性能缩水

新闻⋅ 08-15 ⋅ 924 阅读

英伟达RTX5090新款中国特供版上市，最新基准测试显示其游戏性能与RTX5090D持平，但生产力与AI性能最高下滑25%。GeForceRTX5090DV2在游戏与跑分测试中与RTX5090D难分伯仲，但生产力性能下降达25%，AI测试也有10%差距。超能网最新测试报告证实，新版GeForceRT...

阿里模型三连发重磅亮相世界人工智能大会，全栈 AI 为开源开放提速

新闻⋅ 08-13 ⋅ 1073 阅读

本周，阿里巴巴接连推出三款重量级大模型，迅速包揽基础模型、编程模型与推理模型三大主流领域的全球开源榜首。最新发布的千问3非思考版基础模型，被国际权威AI研究机构ArtificialAnalysis评为“全球最智能的非思考型基础模型”；千问3推理模型性能媲美顶尖闭源模型Gemini2.5Pro与o4-...

遥遥领先 AMD称几乎在所有CPU领域做到"全球最快"

新闻⋅ 08-07 ⋅ 213 阅读

科技媒体techpowerup报道称在几乎所有CPU形态中，AMD都做到了“全球最快”。AMD在最新的Top500超级计算机排行榜中，得益于第四代EPYC“Genoa”CPU和InstinctMI300AAIGPU的强大组合，一举斩获金牌和银牌。在AIPC方面，AMD还推出了代号为StrixHalo...

寒武纪宣布将募资 39.85 亿元加码 AI 大模型芯片与软件平台

新闻⋅ 07-31 ⋅ 1744 阅读

7月18日讯，寒武纪于昨日发布最新公告，宣布对2025年度向特定对象发行A股股票的方案进行调整。根据更新后的方案，公司计划发行股票数量不超过2091.75万股，募集资金总额不超过398532.73万元。寒武纪指出，扣除发行费用后的募集资金将重点投向面向大模型的芯片平台项目、面向大模型的软件平台项目，...

端侧大模型迎来轻革命：移远通信x RWKV 打造轻量AI大脑

新闻⋅ 07-29 ⋅ 925 阅读

7月27日，移远通信正式宣布与RWKV公司达成深度战略合作，双方将基于移远的高性能算力平台，对RWKV最新模型架构进行优化与适配，携手推进大模型在终端设备上的低资源、高效率部署。此次合作成果首次在2025世界人工智能大会（WAIC）上惊艳亮相，标志着端侧大模型技术向更高效能、更广泛应用场景迈出了重要...

全球AI开源贡献榜出炉，阿里千问跻身全球前五、中国第一

新闻⋅ 06-19 ⋅ 167 阅读

6月12日，全球最大的AI开源社区HuggingFace发布了最新的AI开源贡献榜，中国团队表现亮眼，阿里通义千问跻身全球第五、中国第一，DeepSeek位列第九，是前十中唯二的非美国机构。据悉，该榜单由HuggingFace官方对全球开源模型的主要机构进行评估，考察指标涵盖开源模型、数据集、开发者...

攻克大模型训练难题！360实现全网首个开源强化学习LoRA训练方案

新闻⋅ 06-19 ⋅ 1093 阅读

在大模型的训练中，强化学习算法一直是提升模型性能的关键。然而，其面临着计算资源要求高、训练速度慢等问题，让普通企业机构望而却步。面对行业共性难题，近日，在360数字安全集团冰刃实验室主导下，打造出“轻量化、高性能”的AI训练方案：RL-LoRA，在保持模型泛化能力的前提下，体积仅为原始全参数模型的1...

与“llama”相关的TAG标签