 鲜花( 61)  鸡蛋( 0)
|
周一(1月27日),美国三大股指开盘后大幅下跌,英伟达、微软、谷歌母公司Alphabet、Meta等主要科技股遭遇重挫。从华尔街到硅谷,一片惊慌。% U: |- a6 L1 l0 t
$ {6 q1 ^, }! s. d6 U2 P6 a# n而这一切,均来自一家中国仅成立一年多的人工智能初创公司——深度求索(DeepSeek)。- ^& y, O0 p. i7 _
& O7 [# n7 }' B/ X: A& x# w* p; }
01
) T$ Q* v* b2 ]5 g) J* u# g# m6 @/ f/ q
一夜之间,科技巨头们丢了多少钱?0 ]0 Y, p, C" c$ x
. b( B3 x3 a+ v0 ?$ \; ]4 G2 N上周,深度求索公司DeepSeek展示了一款类似ChatGPT 的人工智能模型,名为:DeepSeek-R1。
+ b6 F9 I# N' ]) R3 }8 k9 _, h: s" C
这件事本来说大也不大,因为市面上很多公司都在做类似的人工智能模型。但DeepSeek的特殊之处在于:该模型的研发只用了两个月、成本不到600万美元,就训练出了与GPT-4不相上下的顶尖模型。( _$ M4 N: _& e p- m
$ n) t( v/ a5 @7 n; L& w- N( K2 U
要知道OpenAI训练ChatGPT-4的成本高达7800万美元,甚至可能达到1亿美元。/ d5 U( k* ~+ [' X0 f7 o. ^+ R
+ q# W; v* J9 ]" a7 n" w9 P, e6 LFreedom Capital Markets的全球首席战略师杰伊·伍兹(Jay Woods)表示:“这项技术被认为比美国的模型更省电、更具成本效益,这让美国的科技投资者非常担忧。”3 H3 ?! M) z) l/ D6 ^
" q! i, ?( d/ t3 W简单来说就是,中国的这款模型研发时间短、成本低、功能性强、对AI芯片的依赖低。这些优点放在一起简直就是绝杀!
, j7 `; U. D. u- f9 i( }% m
6 m* M' J; {! U6 TDeepseek在苹果中国和美国地区的应用商店免费APP下载排行榜上均登顶,直接超越了ChatGPT。
' A! }, y1 L4 }1 M6 A! ~* } L! O7 J3 Z/ }5 y
一夜之间,美国最具影响力的几家科技巨头都饱受重创。* [/ N# ]& D# C1 O, r
; t* Q, M% N8 t( o
首当其冲就是英伟达,在过去的一年半里,英伟达依靠人工智能的推波助澜,股票一路上涨。但就在昨日,英伟达的股价暴跌17%,市值蒸发了6000亿美元,创下了股市历史上单日最大损失。
4 y. B& @8 l6 d- U }1 A' B) q7 T% ?
2 C8 q+ _& k! r0 w与此同时,半导体设备制造公司ASML的股价下降了6%,Broadcom股价也下跌了17%。
2 {1 m& t3 J" B h9 i$ t
- H/ L! Y8 M6 q, n# g谷歌的母公司Alphabet下跌超过4%,投资OpenAI的微软下跌近3%。
( ?. ?! W2 V1 _3 N
# x2 t. R! v0 Z2 E8 t4 f其次是一些能源类公司的股票,投资者担心新技术可能需要更少的能源来运行,从而减少科技行业对能源的需求。生产风力和燃气涡轮机的GE Vernova公司股价暴跌21%,电力公司Vistra下跌了28%。
1 W7 P: _# J! o3 M5 f) Y! I/ R
以科技股为主的纳斯达克指数下跌了3%,跌幅达612点;标准普尔500指数下跌了1.5%;仅道琼斯工业平均指数则上涨了0.7%。
: o% `/ x$ e! _% c4 |7 e) G( r) `$ J7 {- {0 r0 N
就昨天一天,美国股市亏损了1万亿美元,直到今天都回弹无力。2 l5 I& h2 S& K; `
4 o- c5 i! \7 {* B2 E+ n& q, A
, W1 x/ ]5 C1 V! p白宫人工智能和加密货币负责人David Sacks在X上表示,DeepSeek的出现表明人工智能领域的竞争将变得非常激烈,“我对美国的未来充满信心,但我们不能因此而自满。”
2 r, {, `8 s( E% C
4 ^! T( M! z" B: |* u& e
, F+ |8 d$ |* a" K4 t( r( p1 C02
( M" w$ b- [( X, e# A
# W+ r) `" m4 W为什么DeepSeek会引发如此大的恐慌?
# H- x% [9 H5 D0 h
$ @; C4 C+ l* i( g6 t4 b首先,Deepseek人工智能的高性价比正在冲击美国大模型的垄断地位。它的训练成本仅为同性能模型的5%到10%。这种新型的训练方法大幅度降低了大模型行业的入门门槛,使得大规模预训练不再是科技巨头的专利。
6 o+ u3 b) X( Z# j2 P( i3 D8 X3 }( W; X1 @) H6 f( j( r& q7 f
DeepSeek推出的新模型DeepSeek-R1,价格为2.2美元/百万词元,而同性能的OpenAI模型费用为60美元/百万词元,DeepSeek的价格仅为OpenAI的三十分之一。这一“低成本”标志着推理大模型的调用进入了平价时代。
" V- ?- l8 s! q! M$ _. ]
: O/ R4 m# U( g因此,无论从基础研究角度还是从商业层面来看,DeepSeek在训练和推理方面的优势,对美国一些大模型公司既有模式造成了较大的冲击。' x" }) b# t4 b9 J
c% w* Q2 P# _. _0 D2 W4 `' e其次,DeepSeek公司的模式创新引发美国高新技术人员的恐慌。DeepSeek通过采用不同于美国大模型的训练模式,大幅降低了开发成本。
7 k' i- L% i$ b6 [) D% u7 k& o/ D) l# i4 q9 h, H, m! E" v
与OpenAI依靠大量算力和海量数据提升性能的“人海战术”不同,DeepSeek通过算法对数据进行总结、分类并选择性处理后输入大模型。这种方法优化了算力使用,降低了成本,同时提升了模型性能。
. H1 R( _, K/ D _. c6 q
9 _8 `0 v+ b+ ~, _; `- Z$ A- _Meta公司为训练Llama投入了大量资金,但效果却不如成本极低的DeepSeek。Meta高层已经开始思考,是否公司资金被浪费在了效果不佳的技术上。
* ]% i2 l$ S' Y( d: p9 I6 r/ L) `
6 U8 t- k% t+ m8 T; r这种反思引发了许多企业技术人员的恐慌,如果公司开始质疑他们的技术能力和创新性,自己可能会因此失去工作。8 `# G8 n8 ^% P7 H7 R
/ ?( g8 N ~ ^
& m* i- d& i# B& ^3 O/ E03
- @* I/ C3 G! L/ @
* s, B3 C6 C9 C, i5 Q' D7 h/ sDeepseek被“挤”到宕机6 n/ K& P$ q7 X
9 r# ^" t" Y2 O+ i% h( h5 mDeepSeek旗下AI服务在上线后的24小时内多次发生宕机。1月27日:# A: ~! y: Q; B. l
上午10点55分:第一次大规模宕机,DeepSeek的API服务完全不可用。4 _/ f q9 R- e4 F: s" [ e
11点32分:DeepSeek-R1 API服务恢复正常,紧接着在14点21分,DeepSeek-V3 API服务也恢复了。
! r7 W) U3 J' C$ ?6 h5 I" `; |14点37分:第二次大规模宕机发生,导致DeepSeek的网页和API服务再次无法使用,问题在16点43分才得到解决。
; }' K# Y3 c J20点16分:DeepSeek出现无法登录和注册的问题,直到21点32分才恢复正常。
6 |$ X# h) q7 L7 i21点33分:DeepSeek网页和API再次出现性能问题,影响了API服务和网页对话服务。6 B+ w* d7 J, u* p
) p& y5 E: |2 H, c- @! [! I
DeepSeek随后回应称,“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。”
; G$ x# I1 d( a7 H; M% v0 W8 q' o& h
+ K ~- T$ s. m5 p1 }) o) N对于DeepSeek这匹“黑马”,你怎么看?
( ~6 \& F+ u1 ?3 I: W3 S$ Q9 x
! b' o( O% t" g+ Z6 h, N它会取代GPT的地位吗?
$ ?. d& y$ y# o% `# Q
) Y4 N6 r# K( Z; m( l欢迎给我们留言 |
|