最近国内很火爆的幻方DeepSeek ,据说可以用十分之一的算力就能实现OpenAI最新版本的数理推理能力,你们别误会,不是它的技术更牛,而是它创新一种独门绝技,就是将算力进行分工。
用通俗易懂的话来讲,就好比一个工厂有多个车间(这里的“车间”就是指模型中的“专家”),每个车间都有自己擅长的工作,在DeepSeek的模型中,这些“专家”会根据实时的工作任务和自身的解决能力,智能地分配任务。
如果某个车间(专家)特别忙,而其他车间相对较闲,DeepSeek的模型就会自动将一些任务从忙碌的车间转移到空闲的车间,以确保工作能够更高效地完成,这样的动态调整,不仅避免了某些专家过载而影响整体效率,还确保了每个专家都能在其能力范围内高效工作。
此外,DeepSeek还采用了一种特殊的方法,为每个专家设置动态的负载阈值,当专家的负载超过这个阈值时,就会触发负载调整机制,模型会考虑多个因素(如专家的历史处理效率、当前任务的紧急程度等)来进行任务的重新分配。
这种分工方式,就像是在一个团队中,任何一个人都有自己的专长,团队领导会根据每个人的能力和当前的任务需求,灵活地分配工作,以确保整个团队能够以最高的效率运作,使得DeepSeek能够在保持高性能的同时,大幅度降低所需的算力资源。
现在全球都在大力投资发展AI模型,但是对于用AI怎么去挣钱,目前都只是在探索阶段,还没什么具体头绪,顶多收一点会员服务费,比如国外一些知名的AI软件收费情况大都是每月20-30美金,而国内的文言一心和快手可灵每月会员费几十块人民币,生成图片和生成视频收一点钱,这点钱都不够团队发工资的,怎么赚钱。
但那些给ai卖铲子的公司已赚钱赚麻了,比如英伟达、博通,而我们国内的ai龙头是被爆炒还在亏损中的寒武纪。
有意思的是,出资研发deepseek公司的竟然是国内著名量化私募机构幻方,幻方的老板梁文峰持有deepseek公司83%的股权,他用这么牛逼的技术在股市上割韭菜,割的是游资和散户一片哀嚎。
但更有趣的是,这个团队都是浙大出来的,他们炒股赚钱的目的是为了做AI,而不是做为了做AI赚股市上的钱,浙大出来的人脑瓜子就是灵活,搞科研都可以不需要去申请科研经费,把自己的研究成果拿出来在股市上收割一波,拿着钱去买英伟达卡继续做大模型。
坊间传闻幻方量化曾对超算集群系统投入 10 亿元,搭载了超 1 万张英伟达 A100 显卡,里面的钱肯定有我的微小贡献。
虽然目前ai模型现在没有一个挣钱的(炒股的不算),但我们普通人已经享受到了AI带给了我们的方便,比如提升工作效率,长途开车无人驾驶,协助写文章等等,都很实用。
小米现在也在发力做ai,也在冲刺这个赛道,雷军千万年薪聘请95后天才女工程师,就是之前在幻方、deepseek团队工作的罗福莉,目前国产模型的水平正在快速追赶美国ai,可以想见在未来的一段时间里,ai会是科技赛道上最热门的概念,吸引更加多的资本流入。
资本都是无利不起早的一群饿狼,别担心他们怎么挣钱,只要能对我们普通人有用,方便大众的,我们都应该支持,你说是吧?