|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
5 c7 C1 \) u; l) j' A: x
有型号了,未来潜力还是巨大的# k4 M. p5 Y( v, |6 L c" F$ I6 ]
目前算力不具备商业竞争力
! S4 X% L9 p% i4 G
$ Y+ E6 w; Q9 e7 i一张RTX 4090 在不同精度下的理论计算性能如下:7 S8 k, d" f3 y4 L& \$ c
0 n; z! r: u4 Y1 w3 w9 aFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。% Q. P7 m8 V3 y9 _6 \/ J+ @
7 E0 ^8 J6 [1 C% Z9 x- m: S6 ~( K
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
0 W+ c0 i3 F6 ?6 x
9 M$ U0 a* W8 E& \3 B% KF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
% w8 [. s# D$ ]6 n% A4 Z3 M6 }
- E$ ?$ S% Z* t. E( m新闻稿没讲FP精度,FP8的可能性比较大
4 Y# n. d4 i( \" G8 T# R* J也即单机柜算力很可能比490高一点
: E' e/ d# ?, L5 E q9 i: {6 E
. u! H7 L9 ]; t8 a3 ^, t目前还是小学六年级小朋友,不能和博士比
& E1 J, H# y& g2 b) O7 l不在现在,在于全自主,未来可期! |
|