版權歸原作者所有,如有侵權,請聯(lián)系我們
發(fā)散性思維(divergent thinking)被認為是創(chuàng)造性思維的核心指標,是人類創(chuàng)造性的體現(xiàn)。
如果 ChatGPT-4 等大模型具有超過人的發(fā)散性思維,那是不是意味著,這一專屬于智慧生物的獨特性,也被人工智能(AI)學會了?
近日,來自阿肯色大學的研究團隊在一項工作中發(fā)現(xiàn):ChatGPT-4 在創(chuàng)造性思維測試中的表現(xiàn),已經超越了人類。
相關研究論文以“The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks”為題,已發(fā)表在 Nature 子刊 Scientific Reports 上。
研究團隊表示:“總體而言,即使在控制反應的流暢性的情況下,GPT-4 在每項發(fā)散性思維任務上都比人類更具獨創(chuàng)性和復雜性。換句話說,GPT-4 在整個發(fā)散思維任務中表現(xiàn)出了更高的創(chuàng)造潛力。”
GPT-4的發(fā)散性思維,真的好過人類?
據論文描述,研究團隊測試了 151 名人類參與者和 ChatGPT-4 分別在 Alternative Uses Task、Consequences Task 和 Divergent Associations Task 三個創(chuàng)造性思維任務上的表現(xiàn)。
這些任務旨在評估個體的創(chuàng)造性思維能力,其中包括了對于日常物品的創(chuàng)新用途、對于假設情境的可能后果,以及對于詞語的語義差異的理解。這些標準有助于量化每個參與者在創(chuàng)造性思維任務中的表現(xiàn),同時也為后續(xù)的分析提供了基礎。
Alternative Uses Task(替代用途任務):這是一個經典的創(chuàng)造力測試,要求參與者為一個常見物品想出盡可能多的不同用途。例如,參與者可能會被要求為一張紙想出多種用途。這個任務旨在衡量個體在生成獨特和多樣想法方面的能力。
Consequences Task(結果任務):在這個任務中,參與者被要求想象一個不尋常的情況或事件,并描述可能發(fā)生的結果。例如,如果重力突然消失,會發(fā)生什么?這個任務考察的是個體在邏輯推理和想象力方面的創(chuàng)造力。
Divergent Associations Task(發(fā)散聯(lián)想任務):這個任務要求參與者對一個給定的刺激詞(如“云”)提供盡可能多的關聯(lián)詞或想法。這個任務用于評估個體的思維靈活性和詞匯關聯(lián)能力。
測試結果顯示,在三個創(chuàng)造性思維任務中,ChatGPT-4 明顯優(yōu)于人類參與者。無論是在生成回答的數量、回答的長度還是語義差異方面,ChatGPT-4 都表現(xiàn)出了顯著的優(yōu)勢,突顯了其在創(chuàng)造性思維領域的潛力。
圖|在 Alternative Uses Task 中,與人類相比,在給出相同數量生成答案的機會下,GPT-4 更能成功地提出不同的答案,并且表現(xiàn)出更高的原創(chuàng)性,但僅限于特定的提示。(來源:該論文)
圖|在 Consequences Task 中,與人類相比,在相同數量的機會下,GPT-4 能夠更成功地想出更多不同的反應,并且根據提示類型也表現(xiàn)出更高的原創(chuàng)性。(來源:該論文)
為了排除其他因素的影響,研究還對回答流暢性進行了控制比較。結果顯示,即使在控制了回答流暢性的情況下,ChatGPT-4 仍然表現(xiàn)出了更高的創(chuàng)造性潛力,進一步證實了其在創(chuàng)造性思維任務中的優(yōu)越性。
這一研究結果引發(fā)了關于創(chuàng)造性潛力和實際應用的討論。雖然 ChatGPT-4 在創(chuàng)造性思維任務中表現(xiàn)出了顯著的優(yōu)勢,但研究團隊也指出了其適用性的局限性。
例如,與人類相比,ChatGPT-4 缺乏自主性和實際經驗,其創(chuàng)造性潛力依賴于人類用戶的指導和輸入。因此,盡管 ChatGPT-4 能夠生成創(chuàng)造性的想法,但其實際應用仍受到限制。
另外,在評估 ChatGPT-4 的創(chuàng)造性潛力時,還需要考慮其回答的適用性和實用性。盡管 ChatGPT-4 可以生成大量原創(chuàng)的想法,但這些想法是否適用于實際情境,以及是否能夠產生有意義的成果,仍然需要進一步的研究和驗證。
最后,研究團隊還強調了人類創(chuàng)造力的獨特性和多樣性。與 ChatGPT-4 相比,人類具有更廣泛的經驗和情感體驗,能夠以更靈活和多樣的方式思考和創(chuàng)造。因此,在探討創(chuàng)造性潛力時,不能簡單地將 ChatGPT-4 的表現(xiàn)與人類相提并論,同時也需要更全面地考慮其在實際應用中的適用性和局限性。
AI取代人類?還有待觀察
與之前的研究相比,此次研究的測試結果揭示了 ChatGPT-4 在多個創(chuàng)造性思維任務上的顯著優(yōu)勢,為我們提供了有關人工智能在創(chuàng)造性思維方面的新認識。
然而,這也引發(fā)了更多問題和未來的探索方向。我們需要深入研究人工智能與人類創(chuàng)造性思維之間的關系,探討如何更好地利用人工智能來促進創(chuàng)新。
未來的研究將致力于開發(fā)更智能、更全面的測量方法,以更好地理解和評估創(chuàng)造性思維的各個方面。隨著人工智能技術的不斷發(fā)展,我們對于人類創(chuàng)造力的認識也將不斷深化,為構建更具創(chuàng)意和智能的未來奠定堅實基礎。
研究團隊認為,這些測試是否能完美地衡量人類的創(chuàng)造潛能并不是問題的關鍵。關鍵在于,大模型正在快速演化,并以前所未有的方式超越人類,它們是否有可能取代人類的創(chuàng)造力還有待觀察。
他們也表示,在未來,人工智能作為靈感工具、作為個人創(chuàng)造過程的輔助工具或克服固定性(fixedness)的工具,都大有可為。
參考鏈接:
https://www.nature.com/articles/s41598-024-53303-w
https://arkansasresearch.uark.edu/ai-outperforms-humans-in-standardized-tests-of-creative-potential/
歡迎掃碼關注深i科普!
我們將定期推出
公益、免費、優(yōu)惠的科普活動和科普好物!