(今周刊1468)
掀起科技界軒然大波的DeepSeek,5秒產出右上這段自身崛起的描述,用詞活潑、中文造詣高,甚至帶著一點中國網文的誇張情調,展現它與原生英文的ChatGPT、Gemini模型,截然不同的特色。
扒開應用層面、向下探討模型,DeepSeek在天才工程師梁文鋒的帶領下,找到低成本「配方」,並且開源供載,讓企業串接費用只要OpenAI的3%,打破只有科技巨擘們才玩得起AI模型的局面,預計掀起一波企業「跳船OpenAI」的風潮。
但另一方面,DeepSeek開啟低成本模型的新時代,未來歐美將會出現更多類似模型,讓生活裡的裝置都有機會實現「AI化」,不論是更多的AI App、穿戴裝置、機器人、自駕系統等,AI進程都將加速。
2023年,一個名為深度求索(DeepSeek)的中國新創公司,策動一場「AI界的珍珠港事件」,不僅震撼科技巨頭們的霸主地位,更引發波及產業與資本市場的完美風暴。
因為DeepSeek選擇一條截然不同的路——開源。這個決定,像一顆投入湖面的石子,激起層層漣漪,開發者們蜂擁而至,技術迭代的速度快得令人窒息。
短短數月,DeepSeek的技術已滲透到醫療、金融、教育、交通等各個領域,成為產業升級的催化劑。
正當產業界還在消化這場變革時,資本市場迎來更猛烈的衝擊。DeepSeek的崛起,像一把利刃,直插科技巨頭的心臟。OpenAI的估值、Alphabet(Google)的股價,接連大幅下挫,這場無聲的海嘯,正在席捲全球金融市場。
(此段文字為DeepSeek生成的自介)
DeepSeek關鍵十問
DeepSeek席捲全球,究竟這個AI模型威力何在?
是否影響未來科技七雄發展決策?台灣相關產業有何衝擊?
本刊整理關鍵十問,由三位權威AI專家,全面解析它所帶來的效應。
01
DeepSeek是什麼?它有什麼優勢與特色?
與DeepSeek類似的工具有哪些?
簡立峰(以下簡稱簡):DeepSeek現在有V3、R1兩種主要大語言模型,前者是參數量大的基礎模型,讓DeepSeek一炮而紅的R1,則是脫胎自基礎模型的推理模型。
透過「蒸餾」 小模型也能有大模型效果
V3完全對標OpenAI2024年第二季推出的基礎模型ChatGPT 4o;R1對標的是OpenAI同年第三季推出的推理模型ChatGPT4o1。DeepSeek不是提出新技術,我認為是工程的優化,它把現在所有的技術,都整合到非常好。