InfoQ:大语言模型综合能力测评报告(2023)

2023-06-06
金锦囊免费
开通

丨内容简介

ChatGPT 这一现象级产品横空出世,拉开了大语言模型技术蓬勃发展的序幕。但实际上,自 2017 年大语言模型诞生,OpenAI、微软、谷歌、Facebook、百度、华为等科技巨头在大语言模型领域的探索持续不断,ChatGPT 只是将大语言模型技术推进至了爆发阶段,当下大模型产品格局更是呈现出了新形势——国外基础模型积累深厚,国内应用侧优先发力。

2022年年末以来,人工智能大模型成为技术领域乃至全球创新领域最炙手可热的话题。以ChatGPT引领的大模型产品发展日新月异,有预测数据显示,到2030年,AIGC的市场规模或将超过万亿人民币。2023年国内主要厂商也相继推出自研的大语言模型产品,另外国内也推出了大量的大语言模型应用,逐步构建起基于中文语言特色的大语言模型生态。

为此InfoQ研究中心基于桌面研究、专家访谈、科学分析三个研究方法,查找了大量文献及资料,采访了10+位领域内的技术专家,同时围绕语言模型准确性、数据基础、模型和算法的能力、安全和隐私四个大维度,拆分出语义理解、语法结构、知识问答、逻辑推理、代码能力、上下文理解、语境感知、多语言能力、多模态能力、数据基础、模型和算法的能力、安全和隐私12个细分维度。

分别对ChatGPTgpt-3.5-turbo、Claude-instant、Sagegpt-3.5-turbo、天工3.5、文心一言V2.0.1、通义千问V1.0.1、讯飞星火认知大模型、Moss-16B、ChatGLM-6B、vicuna-13B进行了超过3000+道题的评测,根据测评结果发布了《大语言模型综合能力测评报告2023》。

  • 金锦囊会员,可查看全部
  • 还剩页未读,继续阅读
    • 人工智能
    • 数字化
    • 趋势
    • 战略
    • 产业互联网
    • 云计算
    http://www.jnexpert.com/questionnaire?qnr=32
    https://www.jnexpert.com/active/detail?id=291
    https://www.jnexpert.com/active/detail?id=305
    https://www.uipath.com.cn/events/agentic-automation-summit-2025-beijing?utm_source=jnexpert&utm_medium=paid_web_referral&utm_campaign=expansion&utm_team=fmk&utm_team_geo=apj
    https://chinaevent.microsoft.com/msfuturesummit?channel_id=199ce089-5233-4b6e-af22-95739db7eec0&&channel_name=Paid-channel1

    报告信息

    • 发布机构

    • 发布时间

    • 报告价格

    立即下载