(今周刊1468)
過去一周,一款由中國AI新創深度求索所推出的大型語言模型DeepSeek-R1,在全球資本市場颳起一陣旋風,也讓矽谷科技巨擘為之瘋狂。究竟,這家成立不到兩年的新創公司有何本事?它的創辦人又是何方神聖?
「我們不是故意要成為一條鯰魚,只是,不小心成了一條鯰魚⋯⋯。」這是中國AI新創公司深度求索(DeepSeek)創辦人梁文鋒,在去年中接受中國媒體採訪時的一段談話。
DeepSeek,梁文鋒;一家公司,一號人名,也是過去一周間,全球資本市場最火熱的兩個關鍵詞。
時序,先回到去年6月。
當時,DeepSeek發布了一款名叫DeepSeek-V2的大型語言模型,因其在特定推理任務上展現的優異性能,引起了中國科技圈的廣泛關注;此外,V2相較國際指標語言模型更為低廉的訓練與開發成本,也在字節跳動、阿里巴巴、百度、騰訊等中國一線AI科技大廠之間,掀起了一場意料之外的「價格戰」,被外界形容為是中國AI界的「鯰魚效應」。