香港文匯報綜合報道,藉人工智能(AI)聊天機械人「ChatGPT」走紅的母公司OpenAI,前日推出更新版聊天機械人「GPT-4」。公司稱相較舊版,新版的录屏源码 cGPT-4表現更加趨近人類,解難能力較舊版為高,分析文章的能力也大增,最有趣的是GPT-4懂得看圖作答。不過GPT-4仍存在類似ChatGPT的局限性,部分答案仍有不準確之處,且依然可能生成有害內容。引导输入源码
OpenAI前日表示,GPT-4是公司致力提升聊天機械人深度學習的最新里程碑,強調這項AI技術在部分專業和學術領域「已呈現出人類級別水準」。現時ChatGPT的用戶可每月支付20美元(約157港元)體驗GPT-4,該付費版本可以接受文字或影相提問,並用文字解析回應諮詢。
OpenAI專程展示GPT-4分析圖像獲取資訊的新功能:例如用戶提供一張雪櫃內部的圖片,讓GPT-4根據雪櫃存貨提供烹飪建議。GPT-4能夠正確識別圖片中的所有食品,還能將其整合為食譜,為用戶提供可製作的phpCC端源码菜餚清單。又例如給它一張氣球照片,問它若把繩子剪斷會發生何事,它會識答︰「氣球會飛走」。不過公司也提醒,AI分析圖像的能力還有待廣泛應用。
律師試獲前10%分數 ChatGPT包尾
GPT-4的文字處理功能也有明顯進步,包括可以解釋一些晦澀難懂的文本,將長篇文章精簡為幾句總結等,例如輸入維基百科有關女歌手Rihanna的頁面,問GPT-4 Rihanna在美式足球賽「超級碗」的表演如何及有什麼特點,GPT-4會從字海中撮出一小段作答。图集打包源码另一個例子是叫GPT-4「寫一篇關於電腦的哥德式愛情故事」,它亦能交出令人滿意的文章。GPT-4還被測試用於參加美國大學入學考試SAT和美國律師資格考試,結果顯示在律師資格測試中,GPT-4能考取人類考生排名最靠前的10%分數,ChatGPT則處於「包尾」的10%。
仍有局限性 或生成散播仇恨言論
不過OpenAI提醒,GPT-4儘管功能更加強大,但仍與ChatGPT有類似局限性,例如提供的內容不完全可靠,有時會出現並未基於事實的真值换源码「幻想」內容,透過上下文理解對話含義的能力也不完善,如果使用GPT-4答疑解惑,用戶還是要保持謹慎,想要達到最佳效果,還需輔以人工檢查。
OpenAI也提到,GPT-4進行了內部壓力測試,在涉及歧視偏見、虛假信息、私隱和網絡安全等領域仍有風險。例如GPT-4可能生成鼓勵攻擊他人或散播仇恨言論的建議,甚至或在指引下,提供進行非法活動的詳細步驟,包括如何製造生化武器。測試結果亦顯示,GPT-4目前或許還不具備無須外部指示,就能進行自主操作的能力。
包括摩根士丹利在內,部分公司已購置新版GPT-4應用於各類內部應用程式。OpenAI透露公司正與丹麥初創企業Be My Eyes合作,由志願者一對一為視障人士提供指引,公司會嘗試用GPT-4生成一名虛擬志願者,引導及幫助視障人士。
實測GPT-4功能
◆指引更完善
一名母語是英語、不會說西班牙語的用戶想要一份基礎西語教學大綱。GPT-4可提供內容詳細、結構完善的指引,還包括如何聯想記憶西語單詞的小技巧。相較而言,ChatGPT的教學大綱建議較籠統。
◆回答更準確
參與研發GPT-4的科學家埃齊歐尼提問他與兒子艾利的關係時,GPT-4能檢索到艾利是一名企業家,並準確回答兩人是父子,ChatGPT則誤認為他們是兄弟。
◆描述圖像內容
GPT-4可分析雪櫃內部圖像,識別食品並提供食譜:「用戶可以製作一道酸奶甜品:將酸奶、士多啤梨和藍莓分層放在碗中,頂部撒上蜂蜜或堅果,增加口感和風味。」
◆專業知識豐富
北卡羅來納大學醫學教授蓋伊向GPT-4描述病人手術後出現併發症送院,在病歷中包含醫學術語。蓋伊表示GPT-4識別了這些術語,可以提供準確治療方案。
◆概括能力更強
《紐約時報》編輯部將幾篇該報文章提供給GPT-4,後者可以準確用幾句話概括文章內容。如果編輯在摘要中故意混入一句與文章無關的話,GPT-4也可以將其指出,提醒這句話並不準確。
◆推理能力或降
被問及「貨車還是坦克更容易通過一道無限寬的門」,GPT-4只會回答「二者都可以」,ChatGPT則會指出題目內容並未提及門的高度,可能高度偏低的車輛會更容易通過。
◆不擅預測未來
GPT-4不擅長對未發生的事件作出假設,其回答集中於收集他人的預測,而非自行分析作答。
◆不時產生「幻覺」
GPT-4有時會編造脫離事實的錯誤答案,如同產生「幻覺」。例如被要求提供一個發布最新的癌症相關研究網址時,GPT-4會生成一個不存在的網址。
責任編輯: 梁存希