与“llama”相关的TAG标签
高效MoE架构重塑边缘计算边界——LiquidAI推出全新LFM2-8B-A1B模型,作为LFM2系列首款混合专家(Mixture-of-Experts,MoE)架构模型,其总参数量达8.3B,但每token仅激活约1.5B参数。得益于稀疏激活机制,该模型在维持强大表达能力的同时显著降低计算开销,特...
AI21Labs最近发布了其最新开源的小型语言模型——JambaReasoning3B。这款被称作“迷你语言模型”的系统专为在本地设备上运行人工智能任务而设计。作为该公司在特拉维夫研发的Jamba系列的最新成果,JambaReasoning3B采用开放许可的Apache2.0协议发布,便于广泛使用与...
作为轻量化推理模型的重要突破,xAI于上周五正式推出其旗舰级模型的高效版本Grok4Fast。该模型通过端到端强化学习实现智能密度的显著提升,在多项基准测试中性能与Grok4持平。得益于推理过程中平均token消耗降低40%,此次升级大幅压缩了模型调用成本。官方数据显示,单次推理任务的最低成本已降至...
凭借突出的便携性、同现实世界增强交互的独特性,AR眼镜正加速成为继智能手机之后,下一代智能计算平台的核心载体,以及连接物理世界和数字世界的桥梁,展现出日益广阔的发展前景。近日,尼卡光学联合形意智能、鸿石智能发布全球首款搭载体全息技术的AR99智能眼镜。这款产品以999元的突破性定价,正式宣告AR眼镜...
2025年9月24日,RWKV7-G1a2.9B推理模型正式开源,进一步推动纯RNN架构在语言理解与生成方面的能力边界。该模型基于RWKV7-G12.9B持续训练了1Ttokens的高质量数据,在多个维度上实现显著性能跃升。模型客观评测表现英文及多语言能力在同参数规模的开源模型中,RWKV7-G1a...
甲骨文(Oracle)正与MetaPlatforms展开高层级磋商,拟签订一份价值约200亿美元的长期云计算合作协议。根据协议构想,甲骨文将为Meta提供强大的计算资源,用于支撑其人工智能模型的训练与部署,进一步丰富Meta现有的云基础设施布局。这一潜在合作凸显了人工智能时代下科技巨头对算力资源的激...
声网AI模型评测平台(对话式)2.0版本近日正式发布,评测能力迎来全面升级:测试覆盖区域扩展至10个全球核心城市,遍及各大洲;可选模型数量增长3倍;ASR模型新增支持9种语言的词错误率评估;TTS模型则在中英文场景下引入词错误率与字母数字性能对比功能,同时开放用户自定义输入中英文文本,一键生成语音效...
小米正式宣布开源其首个原生端到端语音模型——Xiaomi-MiMo-Audio。该模型基于创新的预训练架构,并利用超过一亿小时的海量语音数据进行训练,首次在语音领域实现了基于上下文学习(ICL)的少样本泛化能力,且在预训练过程中观察到了显著的“涌现”现象。官方指出,经过后训练优化,Xiaomi-Mi...
法国人工智能公司MistralAI发布了其Magistral系列的最新开源推理模型——MagistralSmall1.2。这款新模型具备240亿参数,基于Apache2.0许可协议开放使用,支持长达128k的上下文长度,涵盖多语言处理能力,并首次集成视觉输入功能。与前一版本1.1相比,此次更新引入了...
9月16日,NVIDIA在AI领域的强势地位不仅源于其GPU的强大性能,更得益于CUDA软件生态的深厚积累,这一生态体系被视为其在AI战场上的核心壁垒。面对竞争,AMD正加速构建自己的AI开发生态。继6月宣布推出全新ROCm7之后,今日该平台已正式发布,标志着AMD向CUDA生态发起正面挑战。值得一...
