您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

GPT-4化身主考官:與ChatGPT水平相同還有

2023-04-17 13:36:55 編輯:談瑤鳳 來(lái)源:
導(dǎo)讀 GPT-4能力很強(qiáng),已經(jīng)化身為考官,在給市面上主流模型打分時(shí),給自己最高分?jǐn)?shù)95.5分,在這之后沒(méi)有90分以上的選手,連他的前輩ChatGPT也只給...

GPT-4能力很強(qiáng),已經(jīng)化身為“考官”,在給市面上主流模型打分時(shí),給自己最高分?jǐn)?shù)95.5分,在這之后沒(méi)有90分以上的選手,連他的“前輩”ChatGPT也只給了89.1分。與ChatGPT相同水平的還有谷歌Bard、Claude、UC伯克利出品的小羊駝Vicuna-13B等

GPT-4測(cè)評(píng)一共提出了10項(xiàng)能力,10道題也分別給出了出題理由觀察大型模型的能力,可以說(shuō)很全面。GPT-4出題范圍涵蓋文字,詩(shī)歌,數(shù)學(xué),實(shí)踐經(jīng)濟(jì),代碼技術(shù),科學(xué)語(yǔ)言,倫理道德等方面。對(duì)于不同的問(wèn)題GPT-4生成了相對(duì)應(yīng)的評(píng)分標(biāo)準(zhǔn),一共是100分。不同的AI對(duì)于每道題的回答都是不同的,從這些回答中去評(píng)分,只有回復(fù)更加標(biāo)準(zhǔn),分值才會(huì)更大,由此GPT-4自己打的分到了59.5分,也說(shuō)明還有進(jìn)步的空間。ChatGPT的評(píng)分僅次于GPT-4,分?jǐn)?shù)只有89.1分,沒(méi)有達(dá)到90分以上。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ   備案號(hào):

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。

郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)