AI 考生交卷,讯飞星火对阵 GPT4-o,AI 届笔杆子花落谁家?

  • 2024-06-11

  • 来源:极客公园

6 月 7 日上午,2024 高考打响第一枪,语文作文命题备受关注。今年全国高考作文 I 卷的命题是基于当下互联网和人工智能发展,AI 能解答的问题越来越多,是不是意味着人类的问题越来越少。该命题既包含辩证逻辑关系,又很考验考生的想象力,出题刁钻。有网友表示:「还好当年毕业早,现在拿到这个作文题目一时不知如何下笔。」

大模型时代, 如果让 AI 自己来解答这道题,它会给出怎样的答案?继去年 ChatGPT 掀起全球范围的大模型风暴后,科大讯飞迅速推出了自己的星火大模型,并在去年高考期间推出了 V1.5 版本,在知识问答、数学能力、多轮交互上大幅升级。搜狐科技更是对星火大模型进行过数学考题的实测,结果星火以出众能力超越了 ChatGPT。

而今年,算是大模型第二次「参加」高考了。笔者带着强烈的好奇心,专门用讯飞星火大模型和主流的 GPT4-o 进行对比评测。GPT4-o 是 OpenAI 上个月推出的新款大模型,在文本和推理等方面号称媲美 GPT-4 Turbo。而讯飞星火大模型 V3.5 在今年春季上新,支持长文本能力,可结合篇章语义快速生成结果。这两个大模型可谓是「针尖对麦芒」,咱们赶紧测一测。

首先出场的是讯飞星火大模型:

将 2024 高考作文命题输入进去后,星火以「有问题,才有机会」为题生成了一篇作文,其在开头引入了现代社会科技日新月异,人们获取信息和知识越来越便捷的事实背景,还引用了袁枚的《续诗品·尚识》中那句「学如弓弩,才如箭镞」的历史名句,说明学问的根基,需要厚实的见识来引导,从而给出人类还是要依靠自身来解决问题的论断。

全文将「问题」本身解读为催使人类进步的好奇心、推动人类前进的动力以及创新的源泉,并以古希腊哲学家柏拉图、中国现代桥梁专家茅以升和科学家解决太空问题的例子,让论据更有文采和说服力。文章还大量引用金句,比如「志不立,天下无可成之事」等,充实了文章的内涵。在老师评卷打分中,善用真实案例、历史典故和金句都是加分项。

根据目前的语文作文评分标准,讯飞星火大模型生成的这篇作文,透过现象深入本质,揭示人工智能与人类相辅相成的互助关系,并引用案例辅证论据,逻辑思维缜密,文笔通顺流畅,绝对是一篇高分作文的胚子。

接下来再看下 GPT4-o 的表现:

GPT4-o 生成的这篇作文题目是「问题会变少吗?」,标题相对肤浅直白。接着是内容,它以分段式结构阐述了人工智能与人类关系,前两段的核心是人工智能对人类的帮扶作用,主要体现在便捷的答案获取机制与便捷的知识传播效率。后两段说明了人工智能的局限与人类智慧的必要性,以及教育的转变与问题意识的培养,但字里行间缺乏深度,看起来比较空洞,「AI」味儿很浓。

对比来看,就星火大模型与 GPT4-o 生成的高考作文而言,无论是结构的连贯性、内容案例与典故的丰富度还是词藻的华丽度,星火大模型都技高一筹,这也充分说明其在中文语言理解、文本生成和逻辑推理等方面的杰出能力,算是目前最懂中文的国产大模型,尤其是有了春季上新的长文本能力加持后,讯飞星火进一步进化,成为 AI 届的「笔杆子」。

  • 推荐
  • 观点
  • IT/互联网
  • 科研/技术服务
  • 软件信息
  • CIO
  • CDO
  • 人工智能
  • 研发
  • IT

推荐

我要评论