看完5大AI測評,讓你一天摸魚4小時!
今年上半年AI大模型隨着Chatgpt和Midjourney的出圈爆火,迎來了屬於它的Iphone時刻,很多學生都開始用AI寫論文了。以至於需要用反AI的軟件來區別哪個是AI寫的論文,哪個是人寫的。
足球/聽音辨位踢球 盲生射門超有成就感
但不知道大家有沒有一種感覺,就是,有點亂。上半年發佈的AI大模型太多了,至少有好幾百個,有時候一次展會就有100個模型參展,太誇張了。
所以如果我現在要用AI來提升生產力,到底哪個AI模型最好用?這是個很重要的問題。
今天呢,我要給大家帶來5款常見的世界頂級免費大語言模型的橫向測評。
它們分別是:2022年下半年開啓大模型世界流行風潮的Chatgpt 3.5,由OpenAI前員工組建的“叛忍”組織Anthropic公司推出的大模型Claude1和2,全球頂尖大廠Google推出的當家花旦Bard,以及由中國人工智能大模型的先驅者,科大訊飛公司推出的訊飛星火。
進入這次測試名單的都是免費且大家容易接觸到的AI,需要付費的Chatgpt-4和沒有開放公衆權限的華爲盤古大模型,我這次就先沒放進來。如果各位喜歡這樣的測評,歡迎一鍵三連支持一波,我之後再去要一些內部的測試權限。
這次的測試內容是三個項目,數據處理並生成文本圖表、會議訪談的歸納總結、學術論文的翻譯總結評價,之所以設計這三個項目,一來是這些項目我們平時用得着,由人腦去做非常麻煩耗時,二來是它們分別能體現AI的數據清洗、場景描述,對編程需求的理解,對背景資料的查詢,以及文字記憶和上下文歸納總結,這些基礎的能力。(完整測評過程將會在視頻中放出)
对2024蓝白合 他惊人预言:国民党「这件事」准备好了
好了,話不多說,讓我們開始第一輪的比賽!
工作中,我們要去快速地解一個國家,一個社會或者一個行業,閱讀數據是極爲關鍵的一步。但這些數據往往非常龐雜,並且由於管理這些基礎數據的單位,不是國家部門就是某些NGO,它們怎麼說呢,一般都不夠卷,導致數據往往以一坨翔的面貌呈現在觀衆面前,而吃翔的感覺非常的難受。
那能不能讓AI來幫我們吃翔呢?
美債殖利率飆…9月金融業減損擴大 恐重擊配息能力
所以第一輪比賽的內容就是,基礎數據處理並生成文本。
公告汇总:工商银行3.46%股份划转给社保基金理事会
數據採用our world in data網站中的1972~2021年各國碳排放的數據,數據鏈接我們放在下方,各位可以自行下載,然後復現我的操作。
可以看到有不少單元格是空白或者是0,這就很符合我們現實生活會看到的各種數據的面貌,它們通常都不規整,其中很多都是一點用也沒有。
日对中出口水产剩活鲤鱼?他揭2022惊人数字:真的蛮惨
我們要求AI第一步先對於下載的數據進行清洗,刪除掉沒有用的部分,並且只保留2000年之後的數據。
然後完成四項任務,分別是:
由於我們最終要輸出文檔和圖表,而這五個模型都沒有多模態功能,所以我們要求它們以Python語言輸出,然後我們再自己手動操作一下,得到最終結果。
事不宜遲,讓我們請出第一位參賽選手,ChaGPT-3.5.
山林閒人 小說
可以看到gpt3.5很好地領會了相關文案的語義,做出了相應的庫的安裝和調用反應。
從投行看大陸/外債政策影響台資銀行跨境業務分析
當我們將gpt-3.5寫的程序放到IDE裡面運行之後,我們會發現這段程序是可以無bug運行的。稍許的一點瑕疵是我們在命令裡面要求gpt進行一個碳排放的介紹,而它對於碳排放介紹顯得過於簡短。但是它在圖片的繪製和命令運行方面是比較妥善的,沒有問題。
Claude 2作爲一種被很多人期望可以對標gpt-4的大模型,表現令人失望。可以看到Claude2將我的命令進行了一次解析,但是沒有給出Python代碼。
(体育)超1.2万人将参加武夷山马拉松赛
所以我再次明確要求它提供Python的程序,但是第一次提供的程序並不完整,只是提供了一個代碼樣例,所以我要求他提供完整代碼。最終經過多輪調整,它提供了一個相對完整的代碼。
雖然最終成功輸出了word,但這個圖表讓人一言難盡,似乎它並沒有理解我的要求而是自己亂畫了一個。所以結論是,Claude 2沒有完成測試任務。
小孩搭机哭爆!家长1反应让他怒轰「没家教」 上千人战翻
同樣的命令扔到Claude 1裡面,也表現出了類似的情況,當我們把代碼放到IDE裡面運行,發現是有報錯的。隨後將報錯放回Claude 1進行了多次的Debug後,我們發現程序依然不能運行。這意味着Claude1,它在數據處理和代碼生成上都是有問題的。
第四個出場的是Bard,和Claude1類似,Bard也很快給出了全部結果,但是我們發現,它並沒有爲它的程序進行庫的導入,這使得它編的程序是無法運行的。對這個情況進行了提示後,Bard也改正了相關代碼。
但是它重新生成的代碼完全沒有達到我們的要求,在視頻中我們可以看到python不停的報錯,給出的兩個表也不知所云。而當我們把python報的錯誤丟回Bard要求更正之後,錯誤依舊沒法得到完整地更正。
信義房屋:Q2平均房貸期數歷史次高 長年期房貸替房價減壓
鑑於我之前用Bard生成過一些簡單的程序,是沒有問題的,我想很可能是Bard關聯上下文的理解力不行,尤其是在一次完成多種任務的場景下,它顯然無力應對。
我可爱的御宅女友
韓國羽賽/直落二力退球后山口茜 戴資穎明與安洗瑩爭冠
最後出場是訊飛星火,它在關聯上下文方面的表現似乎還行,不但成功識別並導入了庫,然後還給出了分步驟的代碼。看起來挺像那麼回事兒。
但未曾想,在執行最後的任務的時候,程序反覆循環的輸出了同一個內容,在最後一條明顯導入了一些根本沒有關聯的包。可以看出,它的程序反饋已經完全失效了。所以,訊飛星火沒有完成這個程序編寫的任務。
第一輪比賽結束總結一下。
Chatgpt免費的3.5版本相對於其他免費版的大模型,在同時兼顧短段落語義理解和編程方面的能力是有明顯的優勢的,處於斷層領先,雖然它目前不能輸出多模態內容,但是如果我們會一點代碼的話,它有極強的多模態輸出潛力。所以毫無疑問,當你需要找個助手,儘快清洗數據並且在五分鐘內形成一份基礎報告的話,找chatgpt肯定沒錯。
最後我們給第一局各位參賽選手的表現打一個分,滿分十分,我給Chatgpt 3.5打分9.5分就扣0.5分,畢竟說的太簡略。其他幾位都沒有完成任務所以都不及格。(Chatgpt 9.5,Claude2 5.5,Claude1 4.0,Bard4.5,訊飛星火3.0)
大家覺得這個打分公平嗎?歡迎評論區說出你的觀點。
裕隆集團打造進口車服務聯盟 年底挑戰80家加盟
讓我門進入到第二輪的比賽。
我們在工作中總是要關注行業的最新動態,而這些動態往往是以發佈會,訪談和圓桌討論的形式呈現。以我所在的科技行業爲例,這些活動多如牛毛,而且很多時候會發生在凌晨,比如說蘋果,谷歌或者我龍哥的發佈會。
每经热评丨上市公司董监高现金薪酬不宜与股价挂钩
那麼讓我們假設這樣一種場景,昨晚有一場重要的訪談,而你因爲戰況激烈根本就沒看直播,五分鐘後領導組織了會議討論此事,能否讓AI幫你快速看掉訪談內容,並且輸出一個總結歸納呢?
湖北三大都市圈,为何只有武汉圈最靠谱?
訪談內容上,我們選取了一個大家都熟悉的名場面,被譽爲“互聯網史上第一約架”的“羅永浩PK王自如”的對話。由於全文太長,我們找了一個相關視頻,並從3分50秒左右開始的對話節選,鏈接同樣也放在下面,大家可以自行下載操作。
“排名消失”,苏炳添还能参加巴黎奥运会吗
在這段視頻中,王自如和羅永浩先就錘子手機的一些設計和用料的事實問題產生了激烈對峙,而後就王自如是否在故意詆譭錘子手機進一步爆發了強烈對抗。裡面還出現過一些經典段子,比如,“王自如:錘子沒過檢測標準,oppo過了,錘子都沒過最低標準。-老羅:oppo是最低標準?”
豪车品牌跨界玩艺术
我們要求AI們對於訊飛轉寫的視頻文稿內容回答下面幾個問題:
日对中出口水产剩活鲤鱼?他揭2022惊人数字:真的蛮惨
這輪首先出場的是,訊飛星火。
【2020米其林】S hotel成唯一「米其林認證」防疫旅館
我們可以看到它的整個問答環節十分流暢,很快速的就完成了回答。但是如果我們細看它的每一個回答,就可以在它的回答中明顯感受到一種“中庸”的味道。
美国财长口风突变:美国经济需要放缓,必须放缓
比如他會說:“我們不能簡單地判斷雙方是否有互相指責,需要更多的背景信息和語境才能做出準確的評價。”從而避免給出傾向性很強的觀點,或者在某種意義上轉着圈說話。而我們看完視頻是可以很明顯地感覺到王自如對於相關質疑的迴應是落於下風的,而且整體來說老羅並沒有認爲它的產品有比較大的問題。
萬古仙穹 第1季
如果從更技術的角度來說,可以說,訊飛這套模型雖然它也能提取到羅永浩、王自如的名字,也能提取到其中的一部分主題信息,但是它生成的文本量不夠,上下文關聯能力也不足,主題提取上面它會稍弱一點。
然後是Google的Bard這個模型,我們可以看到,對於信息的提取能力Bard在測試期間的表現可以說是略優於訊飛星火的,能夠提取出包括羅永浩指出王自如是收了其他人錢才說錘子手機壞話這種關鍵信息。並且能在只標註說話人1、2的情況下提取出說話人是羅永浩和王自如。
梳扎头发的神绪结衣
但是與訊飛星火相同,它也存在非常明顯的主題提取失誤的問題,直接把一場針鋒相對對話理解成了求同存異。而且對於整個十分鐘的對話的主題提取的量也不足。說明它的主題提取模型目前來講也是非常不好的。
如果基於這兩個模型總結的結果在會上發言,那你就得開始找工作了。
然後我們來看Claude兩兄弟了。
风波再起!菲尼克斯太阳想摆脱保罗,谋求和76人交换哈登
首先是Claude1,面對同樣的問題,Claude1的表現明顯就優於前面出場的訊飛星火和Bard。相比於那兩位,Claude1的回答更加像公文,傾向於列出一個個要點來對觀點進行總結。
當然Claude1在理解畫外音方面依舊有所缺憾,並不能理解我們人類所感受到的那種劍拔弩張的氣氛,但是已經明顯脫離了中庸的詞語和不太貼近原文的描述,對於交鋒的觀點和事實都有了一個初步符合直覺的概括。
在强国建设中彰显巾帼担当——中国妇女第十三次全国代表大会侧记
而它的後輩Claude2在Claude1的基礎上進一步提升了,最直觀的一個提升體現在Claude2可以直接上傳文檔,然後交給大模型直接閱讀,而不需要我們專門複製粘貼。Claude2 可以上傳的格式包括PDF、Docx、TXT、CSV、MD、ini等多種常見格式甚至包括字幕格式和代碼格式的文件等等。但是由於它不支持多模態,所以還不能看圖和看視頻看CAD。但這依舊是一個不小的飛躍,省了我不少事兒。
财富的真正含义并不仅仅在于物质层面
輸入文檔後,我們可以看到它在保留了Claude1分條歸納的基礎上,不僅對於羅永浩和王自如的觀點等都有比較清晰的總結,而且對於整體對話的總結也相比於Claude1,顯得更加符合我們人類看過視頻後的第一感覺。而兩代模型都能從中提煉出羅永浩是錘子科技CEO這種比較關鍵的背景信息。
進一步來說,我們可以看出,Claude2相對前作,在雙方情緒以及話外音的理解上有巨大進步。比如它提到了“潑大糞”是有明顯貶低的意思,這一點非常有意思,因爲上傳的原文是訊飛語音AI轉寫的,裡面的文字是有一些錯別字的,比如“潑大糞”在我們上傳AI的文檔裡面就是“破大糞”。雖然現在AI並不能理解“破大糞”就是“潑大糞”,但是Claude2依舊通過上下文聯繫的方式準確提取了它的負面內涵。
綜合比較Claude1和2,從他們回答的格式和語氣上看,Claude 1和2的訓練邏輯是一脈相承的。兩代模型都能比較準確地總結文本的表層意思,也能查詢資料理解錄音稿的背景,但是Claude1生成的文本有羅永浩和Luo Yonghao混雜使用的情況,也就是說它在生成文本方面還是稍有不足,一致性更低。而兩代模型在聯繫上下文理解畫外音上的表現也有很大差距,第二代擁有明顯優勢。
最後讓我們來看下gpt-3.5.
不得不說從實測的情況看,Chatgpt3.5的表現是略低於預期的。首先是他並沒有通過對於上下文的理解提取出兩個對話人分別是錘子科技CEO羅永浩以及王自如這種關鍵信息。
對於雙方的言論尖銳程度的理解,Chatgpt3.5的理解能力基本上和Claude2處於同一水平線,能夠理解雙方在一些問題上的對抗性。
在任三年半,陈戌源干了些什么?
當然與Claude2不同,Chatgpt更傾向於在不需要條分縷析地列出相關內容的時候,就選擇用一段話通過自然語言的方式把它說出來。這一點體現了雙方在算法訓練上的不同。
總的來說,Claude2和ChatGPT3.5一樣,理解這段錄音文本里面的主要觀點、內容以及主題是完全不成問題的,表現出了對於其他的AI大模型的顯著優勢。在一些關鍵信息推理提取方面,Claude2的水平略高於Chatgpt3.5。所以閱讀並歸納長文本對話的能力,我個人的評價是:
Claude2>Chatgpt3.5>Claude1>Bard>訊飛。
進入打分環節,我會給Claude29分,Chatgpt 3.5 8.5,而Claude1 我會給到7.5分,Bard6.5分、訊飛星火6分。
大家覺得這個打分合理嗎?
第三輪比賽,就是對各位AI模型的終極考驗了。
V观财报|中体产业第三季净利降27.86%
在工作中,我們往往需要去建立很多私密的信息渠道,爲此不惜付出大量的時間精力甚至金錢,因爲研讀公開信息通常不足以讓我們脫穎而出,但是有一類信息除外,那就是頂級學術刊物上的論文,那是人類對於未知探索最前沿的結晶。
【半途】林禹瑄/青年旅舍沒有青年
但問題是,論文很難讀,不僅會涉及到大量我們本身不瞭解的背景知識,甚至由於很多優質論文都是英文的,那裡面專業詞彙都要一個個查,這大大提升了咖啡的消耗量,使我心跳加速氣喘吁吁。
於是我有一個大膽的想法,能不能讓AI來替我把論文翻譯成中文,並且把內容總結給我呢?
而在論文方面,我們選取了可能是人類歷史上熱度最高的論文,《The First Room-Temperature Ambient-Pressure Superconductor》,也就是韓國團隊發現所謂LK-99室溫超導材料的那篇文章。文章的鏈接同樣是貼在了下面。
在提取文檔階段,我們將論文轉化爲word,並且刪除了結尾的引用文獻,以方便我們的各個AI讀取它的內容。但是論文裡面有一個問題就是它有不少比如Bi2Sr2Cu2O8+δ這種化合物以及其他的公式符號等,AI在讀取的時候是可能無法讀取原格式的。甚至文章裡面的表格、註釋之類的都會某種程度上成爲一種亂碼,這會給各位AI理解文章帶來很大的考驗。
元太攜日商 攻智慧設備檢測
首先出場的還是訊飛星火,我們把文章內容先粘貼進去。然後拉到輸入框的底部,會發現它和文章的最後一句話長得不一樣。然後我們倒回去查,會發現那句話大概在文章略多於1/3的地方。只能讀取這一部分內容是無法理解整篇文章的意思的。於是我們接續發送了後面的文字餵給AI。
現在我們就讓訊飛對於這篇文章進行翻譯,很遺憾第一步就G了。
然後我們讓AI對這篇文章的內容,作者和說明的問題進行總結。我們可以看到這個總結的文字非常短,都是些片湯話,幾乎沒有太多的實用價值。這說明訊飛星火對於這篇文章的理解分析能力是不足的。它甚至無法提供關於作者的準確信息。
而進一步專門詢問它第一段輸入中的關鍵信息,比如作者名字和論文題目之類的問題,我們可以看到它已經忘記了,然後經過自己的編寫,總結出了一個新的題目和作者,這就有點尬了。
博鳌经安论坛第二届大会明日启幕
接下來的測試是針對Bard,雖然輸入的字數對應txt文檔裡面有190多行比訊飛略多,但是和訊飛星火一樣,Bard依舊需要3次才能將論文的文字內容完全錄入。
然後我們要求他對於全文進行翻譯,雖然從反應速度上來說,它是高於訊飛星火的。但是很遺憾它並沒有完全理解需求,而是提供了一個它對論文內容總結的中英對照。這可能是因爲Bard有文本長度的輸出限制,也有可能是因爲他已經忘記了部分內容。
而當我們再次詢問第一段輸入的關鍵信息:論文名稱、作者、時間的時候。很遺憾,它忘掉了,和訊飛一樣Bard也開始編相關信息。同時我們可以看到他在所謂的翻譯中提到了LK-99的超導性是在75K的時候達到臨界溫度,這一回答完全與整篇文章的主旨相違背,這也意味着我們進一步提問讓AI對文章進行總結變得沒有了意義。
诺格公司B-21匿踪轰炸机「零利润」 所幸其他专案有赚钱
所以我們跳到Claude 1,當我們把全文輸入對話框之後,對話框提示我們的輸入量還是超出了它的上限。所以我們依舊要分多次輸入這篇文章。但是相比於Bard來說,Claude1的輸入量更高,我們最後截取的位置大概是在原文的一半多,對應txt文件有238行。所以這次我們只要兩次就可以完成全文輸入。
現在我們開始對Claude1進行拷打。首先就是讓它回答這篇文章是誰寫的,看看他有沒有忘記前面的內容,這時候Claude1的回答讓我心裡涼了半截,它直接回答無法判斷相關標題和作者名稱。這讓我懷疑它是不是也忘記了第一段文章。
營業車牌照稅繳納 明截止
但是接下來要求Claude1對文章內容進行概括的結果,令我十分意外,雖然我也並不完全能看懂原文的所有主要內容,但是AI準確地提取出了包括LK-99的核心是用銅離子取代鉛離子實現體積縮小0.48%,這是論文中論證LK-99超導的關鍵論點。雖然Claude1提到LK-99的時候,依舊說論文裡認爲它是一種高溫超導材料,而不是常溫超導,但是肉眼可見的,他對於論文全文的理解和概括準確性有質的提高。
所以我趕緊測試了一下他能不能進行全文翻譯,很可惜,Claude1依舊沒有實現語句的全文翻譯,但是它表現出來的對於有亂碼信息干擾的,論文關鍵信息總結能力,已經十分令人驚訝。當然AI總結的關鍵信息是否完全正確,就交給各位大佬來進行評價了。
疑遭无人机袭击,俄炼油厂起火
Claude1的成功讓我對於之後Claude2和Chatgpt3.5的王者對決充滿期待,話不多說我們開測。
先上場的還是Claude2,由於它可以直接上傳文檔,這次我們就不用複製粘貼了,直接把原文的PDF扔進去,還是很方便的。但這就帶來了一個巨大的挑戰,因爲我們轉寫的文檔是刪除了引文那些東西的,而原文pdf是包含全部的引用參考文獻以及原來的圖片的。可以說難度又高了一級。
雖然很遺憾Claude2依舊沒有把全文翻譯成中文,但是他已經給出了中文的全文概括。包括提到了LK-99被作者認爲是一種室溫超導材料,而且是在400k和常壓下就可以實現零電阻、邁斯納效應等。這種級別的信息歸納提取能力簡直完爆之前的所有AI啊。
而且問這篇論文的名稱和作者時候,Claude2也首次完成了回答,沒有亂編。
中職/聯盟第1000名本土球員是他 獅隊捕手張聖豪留名
對於這種AI,常規的問題已經不能問住它了,必須出重拳。由於這篇論文的內容已經超過了我的專業能力,我也無法給出更有參考價值的正確性判斷,所以就請各位靜靜的欣賞它的表演吧。
新生儿落户被标文盲引家长不满,有学龄前儿童选项为了方便就偷懒
雖然這裡面的回覆依舊可能會有不少錯誤,但是這些內容很多時候,已經可以達到甚至超過,多數科普文章所能給你提供信息的極限水平了。
雖然Claude2作爲一種離線大模型軟件,無法隨着互聯網信息的更新而更新自己的知識庫,也沒有辦法對於自己的回答的正確與否做出完全靠譜的判斷,但是作爲一種本時代的大模型來說,Claude2的表現已經讓我產生一定的懷疑,它已經能比多數人更能讀懂論文了。
宁沪高速:前三季度归母净利润40.37亿元,同比增29.8%
最後壓軸出場的,還是Chatgpt 3.5。由於它只有文本輸入接口,無法導入文檔,我們把所有內容全部都複製粘貼過去,比較令我意外的是,Chatgpt也是一次導入成功。
那麼我們就開測。首先按照慣例,我們先測試它的翻譯能力。在這一點上,chatgpt表現很好,程序嚴格按照我們要求對文字進行逐字翻譯,而不是自動跳到總結翻譯主要內容的階段。超過其輸出限制的部分它也主動說明。
但是在幾個問題問答之後,Chatgpt的記憶空間到達了極限,以至於他已經無法提取有關標題、作者等關鍵信息了。
於是重新導入文章內容,像Bard那樣分段輸入,覆蓋下原本的對話。這次它就沒有進行一個完整的翻譯,而是自動進行了對文章的總結。
1029侯友宜、朱立倫全國客家挺侯後援會
然後就是對於全文內容的總結測試。相比於Cluade2,Chatgpt雖然提取信息的可讀性更好了,對普通人更加友好了,但是似乎提取的信息總量低於Claude2。
而在評價這篇論文上,Chatgpt表現出了一如既往的謹慎,提前做出宇宙無害聲明,然後對實驗現象進行了描述,強調了如果真實可靠是人類的巨大突破,但是它無法驗證其真實性和科學性,發言非常安全。
對於Claude2 提煉出的LK-99的合成方法等細節,Chatgpt並沒指出來。但是作爲一個大模型,從讀論文提取信息的角度來說,Chatgpt已經可以成爲Claude2之下,第二強的AI大模型了。
又到了打分環節,由於我並不能完全判斷Claude2信息的準確度,所以我給Claude2打9.5,Chatgpt3.5我給它8.5分,Claude1 7.5分,Bard和訊飛我只能都給6分。
實驗清晰地表明,Chatgpt和Claude2這類頂級免費AI,已經能夠快速的幫你解決常規辦公,以及基礎信息的處理任務了。未來如果有什麼具體文字處理乃至編程上的需求,我們現在推薦的免費AI毫無疑問是Chatgpt3.5。而如果要閱讀長文本乃至論文並瞭解其中關鍵信息,那我們首推Claude2。
最後我總結一下我個人的一點感受。
首先,AI大語言模型顯然已經跨越了可用的門檻,它在做很多工作上的效果達到可以接受的水平,效率上更是碾壓人類,所以我們一定要用起來。
比如就拿讀論文來說,有個人跟我說Claude2提煉的要點並不完全準確,很多知名學者行業專家可以給出更專業的解讀,那我就問他,你在所有的領域都有熟悉的行業專家嗎?沒有你在那裡說什麼?這跟慈禧太后嫌火車太吵有什麼區別啊?AI與人類伴生已經是現在進行時,它只會越來越強,開弓沒有回頭箭,所以一定要現在就用起來。
第二點是,我十分建議大家都學一點簡單的編程。在未來的很長一段時間,AI大模型都很難打通所有的軟件,所有的輸出格式,如果能會一點簡單的編程,AI能幫你乾的事將會成倍增長。
這就好比,你不知道爲什麼,俘獲了一箇中科院院士,非常厲害什麼都會,並且完全供你差遣,Yes my Lord。唯一的問題是,他語言溝通出了點障礙,很多時候只能看懂手語,這時候你是不是應該學一下手語?
最後,也是最關鍵的問題,AI時代,人最重要的能力是什麼?
角色法伤还没一只灵符女娲高,139级法伤能有1800?
那就是不停地學習。
因爲在可以預見的將來,AI做事還是會有很多瑕疵,很多錯誤,高效利用AI是需要,基於人對於正確結果有預期的基礎之上。只有這樣才能實現人對於AI輸出結果進行判斷,並基於預期差進行修改。
我們不停地學習,學習的目標不是爲了在AI的領域超過AI,而是爲了實現生物智能和人工智能的高效合作。你可以把AI當成你的員工而你是老闆,只有老闆對於問題有清晰的認識,項目纔不會跑偏。