|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
. M0 P! A) u& F. b& H7 Y+ S& ]有型号了,未来潜力还是巨大的
* g/ S& O) P# l. S2 H0 m( W目前算力不具备商业竞争力* C) B/ | C8 [6 h1 @
3 g5 ?( C! f3 k0 S7 X% a" U一张RTX 4090 在不同精度下的理论计算性能如下:
( ]: [5 a& [/ P# F% ?) J2 a; N4 I6 ^& R4 p, \5 N" e+ D7 o" w1 w" z, {8 E3 W
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。( K) \& m' {( w3 j! m; {7 c
' H0 [ K" m0 o+ U
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。1 g# b4 z8 ?3 l
) r7 l4 C7 B+ ^# PF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
! A$ u6 X0 m& E1 w: Q$ d/ N7 n2 D- N% s' F: m F
新闻稿没讲FP精度,FP8的可能性比较大
9 g9 `# W2 P4 k' p也即单机柜算力很可能比490高一点3 n$ s4 t3 `' X ?1 _
$ s/ M: D/ l5 J/ H2 R, Y4 p7 H' H目前还是小学六年级小朋友,不能和博士比
5 j; Y, V/ \1 J9 z7 r% T; H不在现在,在于全自主,未来可期! |
|