与“llama”相关的TAG标签
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETHZurich)与瑞士国家超级计算中心(CSCS)携手推出了一款名为“Apertus”的大型开源语言模型。该名称源自拉丁语,意为“开放”,也正体现了该项目的核心理念。与当前主流的美国大模型如OpenAI的GPT系列、Meta的Lla...
BentoML近日推出了llm-optimizer,一个开源的LLM推理基准测试与优化工具。该工具支持多种推理框架,并可兼容任意开源大语言模型。llm-optimizer的目标是将原本繁琐的手动性能调优过程自动化。用户只需几个命令,即可集中化地运行结构化实验、施加约束条件并可视化分析结果。使用示例:...
ArmUNLOCKED峰会在上海召开。Arm在此次峰会上正式发布了面向移动端的ArmLumex计算子系统(ComputeSubsystem,CSS),包括了全新的基于Armv9.3指令集的C1系列CPU集群,以及支持新一代光线追踪技术的MaliG1GPU系列。其中,C1CPU集群均支持可扩展矩阵延伸...
OpenAI正在引领开源软件的革新浪潮,向全球展示基于NVIDIAAI构建技术的强大潜能。通过与OpenAI的紧密合作,NVIDIA已针对自家GPU对其全新的开源gpt-oss模型进行了深度优化,实现了从云端到个人电脑端的高效智能推理!OpenAI为全球数百万用户带来了前沿的人工智能模型。如今,AI...
OpenAI正积极推动开源软件的创新发展,向世界展示利用NVIDIAAI技术构建应用的巨大潜能。通过与OpenAI的合作,NVIDIA针对其全新发布的开源gpt-oss模型进行了深度优化,充分发挥NVIDIAGPU的强大性能,实现从云端到个人PC端的高效智能推理体验!OpenAI为全球数百万用户提供...
9月9日,国际权威市场调研机构英富曼(Omdia)发布《中国AI云市场,1H25》报告,报告显示,2025年上半年,中国AI云市场规模达223亿元,阿里云占比35.8%位列第一,市场份额高于2到4名的总和,凭“AI全栈”继续引领市场发展。报告认为,生成式AI(GenAI)带来AI云市场的爆发,202...
9月7日,IFA2025展会现场,铭凡发布了四款全新迷你主机,覆盖多种应用场景,实现全平台布局。G1Pro:主打迷你游戏体验,搭载AMDDragonRage平台,最高可配锐龙98945HX处理器。配备桌面级RTX50系列显卡,支持最高96GBDDR5内存,内置双PCIe4.0SSD存储槽。网络方面支...
主打隐私保护的科技企业DuckDuckGo于去年推出订阅服务,该公司近日宣布,现有订阅用户现已可免费通过其Duck.ai平台使用前沿的人工智能模型。Duck.ai的聊天功能对所有用户开放,无需付费即可体验多种主流AI模型,例如Anthropic的Claude3.5Haiku、Meta的Llama4S...
9月4日,国产GPU领域迎来新一轮爆发,又一国内厂商揭晓最新研发成果。安孚科技在互动平台上透露,旗下象帝先公司研发的全新“伏羲”架构GPU已顺利完成流片验证,该芯片在图形渲染和并行计算性能方面展现出卓越表现。据了解,自获得安孚科技投资以来,象帝先产品迭代速度显著加快。新一代伏羲架构GPU将采用先进的...
9月1日,国际权威市场研究机构沙利文(Frost&Sullivan)正式发布《中国GenAI市场洞察:企业级大模型调用全景研究,2025》报告。数据显示,2025年上半年,中国企业在大模型领域的日均总消耗量已达10.2万亿Tokens。其中,阿里通义以17.7%的市场份额位居榜首,成为最受中...
