Deepseek开源它的揭露了如何第三弹DeepGEMM 300行代码 暴击专家优化内核,简要的说就是用最精简使用显卡计算的方式,打破了英伟达用显卡垄断的局面
此外,有好几个项目在使用内存计算的效果上,得到了惊人的进步
一旦内存计算被成功优化,就是英伟达破产之日,任何人都不用什么昂贵的显卡了,买一百刀的128G内存就可以自己计算了。
所以英伟达的破烂儿,还想卖高价,是不可能的了!
现在买英伟达股票,相当于1910年入宫当太监,1949年加入国民党。
评论
花有重开日,人无再少年?
评论
请问其他的跟着跌的股票呢
Mediatek Qualcomm broadcom
评论
我不信
评论
早点完蛋,我还等着换游戏显卡呢
评论
我看不懂这代码,期待大家解释下
http://github.com/deepseek-ai/D ... p_gemm/fp8_gemm.cuh
这个函数是否是创新的代码?为何好啊?__global__ void __launch_bounds__(get_num_threads_per_sm<kNumTMAThreads, kNumMathThreadsPerGroup>(BLOCK_M), 1)
fp8_gemm_kernel(__nv_bfloat16* gmem_d, float* scales_b, int* grouped_layout,
uint32_t shape_m,
const __grid_constant__ CUtensorMap tensor_map_a,
const __grid_constant__ CUtensorMap tensor_map_b,
const __grid_constant__ CUtensorMap tensor_map_scales_a,
const __grid_constant__ CUtensorMap tensor_map_d) {
评论
我看了下显然代码使用FP8精度,但这要使用昂贵的AI卡,NVIDIA Hopper 架构(GH100)并不是是普通的显卡,例如GTX1070等,谁给改下代码让支持GTX1070?
评论
如果用deepseek来证明英伟达要完蛋,我完全不认同。
个人的感觉,英伟达应该在140-180之间。
评论
麻烦楼主解释下DEEPSEEK使用FP8优化提高计算速度2.7倍如何打破了NVIDIA用显卡垄断的局面?
评论
显卡贵上天了,该打
评论
Leo 现在买特斯拉是不是49入国军
评论
我感觉学习DEEPSEEK的代码让我认识到程序员不会被人工智能取代
评论
就看老黄愿不愿意多挤点牙膏了
如果说稍微多挤点牙膏显卡算力飙升,应该会短时间内再出现一波买单
评论
嗯,是,非常是
评论
会有更多优化算法的
评论
显然你说的是将来啦
评论
重点不在于1949年入没入国民党,而在于是否果断追随了委员长的步伐移民啊
评论
去开山建设,苦几十年吗?
评论
leo自动房地产投资失败被套后,精神就格外的好,各种投资指点江山
评论
我感觉那时去台湾好
评论
懂了,梭哈nvda
澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联