当前位置:主页 > 聚焦 >

研究称GPT-4通过图灵测试 54%参与者将其误认为真人

时间:2024-07-08 04:27:47

  双方交替发送,每条消息限制在一定的字符数内。

  的长度人为地延迟发送。这种设置旨在模拟正常的人际交流节奏,增加实验的现实感。研究小组解释称,人类之所以不能百分之百地识别同类,是因为提问者认为AI的效率越来越高。这增加了他们将人类错误地识别为机器的可能性。

  为了深入了解影响参与者最后作出决定的定性因素,研究小组对其使用的策略和判断的理由进行了分类。36%的参与者与“对话者”进行闲聊,询问个人细节或他们的日常活动;第二类策略是社交和情感,例如询问“对话者”的意见、经历并分析判断它们的幽默感;第三类是知识和推理,包括数学、逻辑和常识问题。

  结果显示,有54%的参与者将GPT-4误认为是真人。相比之下,预先设定好回复的ELIZA只有22%的人将其认作线%,而“真人对话者”被正确辨认的比例则为67%。

  他们指出,这可能反映出参与者认为AI系统质量在不断进化,这一结果也与近年来其他类似的图灵测试呈现的情况类似。当AI系统能力很差时,真人是很容易被辨别出来的,而随着参与者对AI系统能力的信心增强,他们便更有可能将真人误认为AI。

  GPT-4和GPT-3.5在测试中的表现虽然未达到“真人对话者”的水平,但目前AI研究者普遍认为,只要有30%的回答被误认为是人类,那就算通过测试。不过也有观点认为,50%的基线更加合理,因为它更能证明人类在识别AI方面并不具有偶然性。

  在上述研究中,参与者的置信度得分和决策依据都表明他们并非随意猜测:GPT-4是人类的平均置信度为73%。

  还需要指出的是,由于研究人员在进行上述实验时,OpenAI尚未宣布新一代的旗舰模型GPT-4o。这一全新模型可以利用语音、和文本信息进行实时推理,如果参与测试,被参与者误认为人类的概率可能就会更高。

  图灵测试是由英国计算机科学家阿兰·图灵于1950年在其论文中提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等同或无法区分的智能水平。1966年,美国计算机协会还以图灵的名字设立了图灵奖,被誉为“计算机界的诺贝尔奖”,旨在奖励对计算机事业作出重要贡献的个人,每年颁发一次。

热点推荐
1 Tom Lee 欲成加密界巴菲特

消息,据Coin Bureau发推称:BitMine 公司表示其目标并非仅作为以太坊收益平台,而是希望成为类...

2 TRX巨鲸转移3.5亿枚代币

消息,据Whale Alert发推称:350,000,000 TRX从一个未知钱包转移至另一个未知钱包。...

3 一天内上涨 19%,这种领先的隐私币还应该

门罗币价格在五天内飙升了 44%,并在 1 月 12 日达到峰值,涨幅高达 19%,但随后有所回落。此...

4 XRP账本“死亡开关”修正案再度浮出水面

XRP Ledger 社区正在重新审视一项名为死亡开关的提案,旨在防止因用户不活跃或去世而导致 X...

5 银行抵制加密奖励以保利润

消息,据Coin Bureau发推称:Coinbase CEO Brian Armstrong 表示,银行正试图阻止稳定币奖励,以保护其...

6 以太坊基金会公布 x402 黑客马拉松获奖项

消息,以太坊基金会公布 x402 黑客马拉松获奖项目。其中包括 Superfluid 的 x402-sf、petersson.eth 的...

7 Ripple公司荣誉首席技术官发布跟单交易诈

Ripple荣誉首席技术官David Schwartz警告称,跟单交易存在隐患,这与Coin Metrics的Nic Carter此前提出...

8 观点:以激励驱动的DeFi将在2026年消失

消息,Eli5DeFi 在 X 平台发文表示,以激励驱动的 DeFi 模式将在 2026 年消失。DeFi 协议在激励结束...

9 香港科技大学唐博预测比特币有望 5 年内

香港科技大学金融研究院助理院长唐博预测,2030 年比特币价格将大幅上涨,有望达到每枚 1...

10 马斯克曾支持 OpenAI 筹划 100 亿美元 ICO,

消息,在 OpenAI 最新公布的内部通话记录中,埃隆马斯克曾在 2018 年初短暂支持 OpenAI 通过首次...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。