|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
7 A* ?& [ ^. v" n0 @. U5 p
有型号了,未来潜力还是巨大的 q4 _8 L K* R9 _
目前算力不具备商业竞争力2 z# j$ M7 p9 E. k8 v4 H
! f* M. [- X* { X1 C一张RTX 4090 在不同精度下的理论计算性能如下:
# f5 g# F' Y" D: {* |3 K, k, z6 |5 w( x, U# Q- {, f$ d
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。# s/ v, z; ]8 y+ h, ~9 n: b) n4 m
/ W) ]! a1 q! r- U; _' f" e i, r
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
6 ~) @% P/ c2 F4 Q* L1 q' b0 u8 G; a7 A4 q* G$ }
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。- [5 P$ O% ?$ |& d6 H
& t) `" x, y; e, P/ R/ n. I
新闻稿没讲FP精度,FP8的可能性比较大 B; V9 T8 L* I8 m$ X* q
也即单机柜算力很可能比490高一点$ W7 N# w k# {+ K* h+ z
3 r! H5 G0 Q# z4 ~+ n/ q5 C' ]. j
目前还是小学六年级小朋友,不能和博士比; I1 S+ @2 D& {" A! W! _
不在现在,在于全自主,未来可期! |
|