科技日报讯(记者李禾)近日,由昌大AI团队研发的模子Watt-tool-70B及Newsbang/homer-72B,登上国际知名AI排行榜榜首。此中,Watt-tool-70B是由昌大旗下Watt团队研发的旗舰模子,今朝位列BFCL Leaderboard总榜单第一。

据悉,榜单BFCL Leaderboard是由加州年夜学伯克利分校开发的评估LLM东西挪用能力基准测试平台。作为今朝年夜语言模子(LLM)最热点的研究标的目的之一,东西挪用(Function-Calling)是为了让LLM理解,并能正确利用API(运用步伐编程接口),来履行更繁杂而详细的使命。于近期宣布的最新一轮评估成果中,Watt的“多轮对于话履行能力”相较在排名第二的GPT-4o 领先11分,比排名第十的Gemini-1.5-Pro 领先近40分。
“这个模子将加快年夜模子落地‘交融’历程。”Watt有关卖力人说,还有有助在从底层数据标注到人机交互的系统化设置装备摆设,让年夜模子开端实现从“言而不行”到“能文能武”。
此外,由昌大集团NewsBang团队开发的Newsbang/homer-72B 模子位列Open LLM LeaderBoard v2榜单第一。Open LLM Leaderboard V2是由Hugging Face维护的开源语言模子评测平台进级版本,采用更周全及严酷评估尺度,对于各种开源年夜语言模子举行多维度测试及排名。Newsbang/homer-72B器重晋升模子于推理及思索方面的能力,经由过程搭配数据筛选机制等,于多个焦点评测维度,该模子机能有了年夜幅晋升。
据公然报导,2023年头,昌大集团公布All in AI战略,去年10月,结合多家高校发表了AI与持久影象方面的论文,其自研的OMNE年夜模子多智能体框架登上GAIA 基准测试排行榜榜首;其旗下的天桥脑科学研究院(TCCI)与国际学术杂志《Science》互助推出全世界AI驱动科学年夜奖,举办及撑持包括“AI+精力康健”于内的各类高程度国际集会及夏校项目,助力造就跨学科青年AI人材等。
科技日报讯(记者李禾)近日,由昌大AI团队研发的模子Watt-tool-70B及Newsbang/homer-72B,登上国际知名AI排行榜榜首。此中,Watt-tool-70B是由昌大旗下Watt团队研发的旗舰模子,今朝位列BFCL Leaderboard总榜单第一。
据悉,榜单BFCL Leaderboard是由加州年夜学伯克利分校开发的评估LLM东西挪用能力基准测试平台。作为今朝年夜语言模子(LLM)最热点的研究标的目的之一,东西挪用(Function-Calling)是为了让LLM理解,并能正确利用API(运用步伐编程接口),来履行更繁杂而详细的使命。于近期宣布的最新一轮评估成果中,Watt的“多轮对于话履行能力”相较在排名第二的GPT-4o 领先11分,比排名第十的Gemini-1.5-Pro 领先近40分。
“这个模子将加快年夜模子落地‘交融’历程。”Watt有关卖力人说,还有有助在从底层数据标注到人机交互的系统化设置装备摆设,让年夜模子开端实现从“言而不行”到“能文能武”。
此外,由昌大集团NewsBang团队开发的Newsbang/homer-72B 模子位列Open LLM LeaderBoard v2榜单第一。Open LLM Leaderboard V2是由Hugging Face维护的开源语言模子评测平台进级版本,采用更周全及严酷评估尺度,对于各种开源年夜语言模子举行多维度测试及排名。Newsbang/homer-72B器重晋升模子于推理及思索方面的能力,经由过程搭配数据筛选机制等,于多个焦点评测维度,该模子机能有了年夜幅晋升。

据公然报导,2023年头,昌大集团公布All in AI战略,去年10月,结合多家高校发表了AI与持久影象方面的论文,其自研的OMNE年夜模子多智能体框架登上GAIA 基准测试排行榜榜首;其旗下的天桥脑科学研究院(TCCI)与国际学术杂志《Science》互助推出全世界AI驱动科学年夜奖,举办及撑持包括“AI+精力康健”于内的各类高程度国际集会及夏校项目,助力造就跨学科青年AI人材等。
-球盟会