|
发表于 2024-8-30 21:11:23
|
显示全部楼层
5 r4 m9 ?, w7 a- L$ @有型号了,未来潜力还是巨大的" u4 `! P6 I6 G5 r& |
目前算力不具备商业竞争力
f" n% B! k5 K: x5 D4 {8 y
$ b7 F: K! E* k" I+ F一张RTX 4090 在不同精度下的理论计算性能如下:: J$ c5 K4 x9 v: M7 ~
% c# w3 W) E* u( W% J0 CFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。0 H6 b# c) v1 c# {% M$ }
5 M; U0 z& ?! ]
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
( {, o7 c# ? v) \% G& X) c. G6 T# h
1 a% Y9 G! e4 uF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。* {; K8 d! E0 _$ i4 B. |" O
" T) ?7 V8 t: l, X
新闻稿没讲FP精度,FP8的可能性比较大6 o4 b, a0 ], v# t
也即单机柜算力很可能比490高一点, S$ [* ~( w' F
: X" ^ N! W" @; O+ v5 c1 Z目前还是小学六年级小朋友,不能和博士比! {4 \" ~; u/ d
不在现在,在于全自主,未来可期! |
|