DeepSeek漫谈

内容摘要  DeepSeek 可能是现在最火的话题之一了,以至于我每天都能刷到一堆关于 DeepSeek 的文章,但说实话大多数都不忍卒看,完全是一堆看客聊得热火朝天但却不知所云。太多的文章言之凿凿但却荒诞不经,以至于都无力再说些什么了。  先科普一下,DeepSeek 是一个大语言模型,它宣告了在小小算力下也能达到世界顶尖水平,并且

  DeepSeek 可能是现在最火的话题之一了,以至于我每天都能刷到一堆关于 DeepSeek 的文章,但说实话大多数都不忍卒看,完全是一堆看客聊得热火朝天但却不知所云。太多的文章言之凿凿但却荒诞不经,以至于都无力再说些什么了。

  先科普一下,DeepSeek 是一个大语言模型,它宣告了在小小算力下也能达到世界顶尖水平,并且开源了出来,谁都可以看可以用,也可以自己本地化部署一套出来自己玩。DeepSeek 训练过程中只使用了其他顶尖大模型训练需要用到的GPU的一部分算力,这宣告了他能用更低廉的成本提供高质的服务。

  关于 DeepSeek 和 ChatGPT 的关系,可以用一个形象的比喻来说明。关于发现新大陆,ChatGPT 第一次发现了新大陆,告诉大家新大陆就在那里,从此以后谁都能去那里了。DeepSeek 则是找到了用飞机抵达新大陆的方法,他告诉大家,用这个方式能最快抵达新大陆。其他所有传言中的龃龉都是狗血的肥皂剧,谁信谁傻。

  DeepSeek 是不是很牛叉,是的。DeepSeek 确实性能上已经达到了一个世界顶尖的水平,所以如果我们去和 DeepSeek 聊天,体验会挺不错的。这是我们最接近世界最顶级的大语言模型的时刻,毫无障碍,国产良心。而且由于是国产大模型,所以在训练时会有意无意地使用大量中文的语料,所以和他对话,是所有世界顶级大模型中最接近我们中国人语言、习惯、思想的。

  DeepSeek 带给国人的最大价值是什么,恐怕是对AI的自信心。漂亮国在AI上的严防死守,大家都知道了,就不赘述了。但这种情况下,DeepSeek 取得的进展一扫雾霾,让大家都很有信心,突破漂亮国的AI小院高墙。当然,漂亮国的反应也很快,很快估计新的制裁会出炉了。

  DeepSeek 带给世人最大的价值,是验证了AI算力神话的破灭。美股领头羊英伟达之前的股价支撑逻辑是,更好更大的模型需要更高的算力,而英伟达几乎是唯一的算力提供者(华为在漂亮国是不会被认可的,更不会被提及,只会被忽略)。但 DeepSeek 宣告了小小的算力也能提供顶尖的模型,所以英伟达之前的价值逻辑遭到了巨大的颠覆,导致了股价跳水。

  DeepSeek 最近似乎常常不能正常提供服务。是的,有2方面原因,一方面使用的人太多了,它的服务器难以提供足够的服务给这么多人,好比一堆人去饭店吃饭,前面的客人都没走,新的客人就来了,大厨忙不过来就时不时罢工,反正怎么加班加点也服务不完你们这些大爷们。另一个方面,有些居心叵测者进行了网络攻击,好比说还有一帮恶霸跑来饭店里占着座不点菜,但就是挤占着不让其他人吃饭。

  DeepSeek 会不会越来越好用,会的。饭店之前没想到这么火,现在知道了,就开始大肆装修,扩展店面,也会时不时赶走占座的恶霸,各位顾客再等些时候,就能享受到不错的服务了。

  国产是不是还有其他大模型也挺不错,是的。听说现在在第一梯队的,除了如雷贯耳的 DeepSeek ,还有就是通义千问,豆包。其他大模型是不是也不错,也许是的,但没那么好的口碑。而且,没有一个大模型是全知全能的,尺有所长寸有所短,事实上不同的场景下不同的大模型表现也会有差别,各位需要仔细去试验体会。

  对了,我在试过近期几个排名靠前的大模型后,把之前一直付费使用的文小言(也就是以前的文心一言),默默地取消了续费。商业竞争是残忍的,百度真的总是起个大早赶个晚集,实在是无语死了。

  有人说,不对啊,我看了网上好多绘声绘色声情并茂地说 DeepSeek 咋地的那些你怎么一句不提。嗯,是的,一句不提。郭德纲有段相声,“比如我和火箭专家说,你那火箭不行,燃料不好,我认为得烧柴,最好是烧煤,煤还得选精煤,水洗煤不好。如果那科学家拿正眼看我一眼,那他就输了”。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
友情链接:  生意多  |  立体车库网  |  机电网  |  电商信息网  |  环球信息网  |  电工网  |  优秀信息网  |  B2B  |  商路通  |  商途网  |  花卉网 天天商务网  |  易修网  |  直通车信息网  |  B2B  |  商务网  |  信息网  |  114  |  B2B  |  商路通  |  商途网  |  防雷网 每天发布网  |  我的航运网  |  转让系统  |  力之信息网
浙ICP备2021030705号-9