|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
: C5 C2 _7 h: h/ p有型号了,未来潜力还是巨大的
3 t0 I5 e+ Z& p" {. i目前算力不具备商业竞争力5 Q& J5 Y/ o8 q& Q, U( j
; Q5 J) L* W5 s, b& u9 J一张RTX 4090 在不同精度下的理论计算性能如下:5 Z4 x- S/ ^% B, F
0 ~, P2 c) ]) `9 a) C1 z* z- U# |FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。" o4 t& D% `1 ^5 w) @. i7 C
5 v% U8 w& `2 E
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。2 w! ?4 @6 S- X- J
9 r1 g m5 |) QF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
; j$ w7 @0 A1 r6 A$ e* B) w9 c8 J( e$ ~/ M/ B# R
新闻稿没讲FP精度,FP8的可能性比较大: h1 V! {3 o# P& {# {
也即单机柜算力很可能比490高一点
6 v' I9 o8 c) x; p& N9 E# ~% x1 ^7 J' Z/ C H
目前还是小学六年级小朋友,不能和博士比- f' D* D: |, F; U: z
不在现在,在于全自主,未来可期! |
|