中國推出的DeepSeek,標榜自己只用低成本,就能訓練出強大AI模型,一度引起歐美市場恐慌。不過ChatGPT的母公司OpenAI指控,DeepSeek其實是偷拿他們的模型來開發,背後採用的方法叫做「蒸餾」。這種技術就像是直接站到巨人的肩膀上,把別人的東西全都學走,如果沒有事先得到授權,恐怕就有盜用疑慮。
中國的DeepSeek橫空出世,先是讓美國矽谷大吃一驚,接著引起全球AI界不小恐慌,但ChatGPT母公司OpenAI聲稱,DeepSeek其實是拿它們的模型來開發,還說手上已經掌握證據,路透社新聞旁白說:「即便DeepSeek下載量居冠,但專家已經表示懷疑,針對它所陳述的成功故事。」
OpenAI聲稱,DeepSeek疑似用「蒸餾」技術打造模型,簡單來說,ChatGPT就像一名厲害大廚,蒐集大量食材,再透過精湛手藝,製作出一道道膾炙人口的頂級料理;而DeepSeek則是名小廚師,雖然食材較少,料理方法也相對簡單,但模仿ChatGPT後,也能端出味道差不多的佳餚,而且成本更低,這個小廚向大廚學習的過程就叫「蒸餾」。
半導體專家曲建仲說:「利用大型語言模型產出的資料,也就是利用「教師模型」,來訓練「學生模型」,所以我可以用一個比較小的模型,就達到大型語言模型推論的結果,而且我模型也不用這麼大。」
就像是站在巨人的肩膀上,DeepSeek自然能標榜自己「低成本」,但「蒸餾」其實沒什麼大問題,甚至可說是AI業界常見做法,關鍵在有沒有經過對方同意,如果DeepSeek未經OpenAI授權,就擅自偷偷站到人家肩膀上,那就有疑慮了。
半導體專家曲建仲說:「授權在AI界本來就很難定義,法律上面怎麼去定義什麼該授權,什麼不該授權,我認為這個還需要進一步地,讓科學家還有法學專家討論,才會有結論。」
不過OpenAI自己也被酸了一把,有藝文創作者聯合投書華爾街日報,調侃OpenAI若被盜用,完全就是「因果報應」,因為OpenAI過去也沒說清楚,到底如何訓練ChatGPT,AI模型接連問世,掀起新一波科技熱戰。
【延伸閱讀】
◆ OpenAI控DeepSeek用「蒸餾」技術 盜用GPT-4模型
◆ OpenAI:已掌握證據 顯示DeepSeek盜用其訓練模型