编译/黄竣凯
人工智慧(AI)晶片巨头辉达悄悄推出了一款新的AI模型,其表现甚至优於当前最先进的AI系统,包括GPT-4o和Claude-3。这款名为Llama-3.1-Nemotron-70B-Instruct的模型,引发了业界的广泛关注。
Llama-3.1-Nemotron-70B-Instruct
根据辉达AI Developer帐号在X平台上的发布内容,Llama-3.1-Nemotron-70B-Instruct被称为「领先模型」,并且在AI 研究人员间流行知名平台Chatbot Arena中表现突出。这款模型是Meta的开源模型Llama-3.1-70B-Instruct的改进版,其中「Nemotron」部分反映了辉达的贡献,展现了其在AI技术上的领先地位。
更多新闻:Google 携手辉达 液冷技术AI伺服器将颠覆云端运算
辉达试图设计更有用的AI模型
Llama系列模型是Meta推出的开源模型,旨在提供给开发者作为基础进行开发,而辉达则基於这个基础,藉由特别选取的数据集、先进的微调技术,以及自家顶尖的AI硬体,打造出Nemotron。辉达的目标,是使其比OpenAI的ChatGPT和Anthropic的Claude-3更加「有用」,满足更多使用需求。
辉达称Nemotron表现超越现有AI
辉达表示,Nemotron的性能在多项测试中明显领先现有的尖端模型,例如GPT-4o与Claude-3。在Chatbot Arena的自动化「Hard」测试中,辉达宣称Nemotron取得了85分,这将使其成为该测试中最顶级模型。
Llama-3.1中端模型超越巨型系统
令人惊讶的是,Llama-3.1-70B只是Meta开源AI模型中的中阶版本,但它却已经能够在某些测试中,超越具备超过1万亿参数的GPT-4o,表明辉达在提高模型效率与表现上取得了显着突破。辉达此次推出的Nemotron不仅强化了AI技术的竞争格局,也展示了开源AI模型在进一步开发和优化中的巨大潜力。
参考资料:Coin Telegraph
※探索职场,透视薪资行情,请参考【科技类-职缺百科】帮助你找到最适合的舞台!