第78章 三维融合架构芯片要提上日程(2 / 3)

“而对于机器来说,这非常困难。微软联合OpenAI搞的这种方式,是怎么做的呢?这么说吧,假如说,本来的大模型是一张网,网你见过,就跟渔网一样,一个疙瘩通过几个线条跟另外几个疙瘩相连。

“跟它不相连的疙瘩,是很难去直接联系的。人工智能模型也类似,所以模型的联想能力是偏弱的,举一反三很困难。

“但,我们发现,咦,这两个东西虽然隔得很远,但是其实是一回事儿,比如,秦始皇和嬴政。所以我们就在任何环境的变化中,都给他人为的标一起。

“类似的情形还有很多,那就人为的一个个全标上。这样,经过长时间的训练,模型就具备了时时把两个相似东西联想到一块儿的能力。

“语言模型本身就是一张网,而这就相当于在原来的语言模型中,又织造了一个新的网,网中之网。”

这么说着,纪弘内心也是非常佩服这帮人,人工强硬标记联系,加上大规模的算力,竟然真的训练出了类似于人类的【语言泛化能力】。

真要算力无限,说不定真的能搞出什么更大的名堂呢。

不过,算力无限这事儿,想想也就罢了——就算把全世界所有的沙子都做成芯片,所有的能源都用来发电,量再大,那也是有定数的。

“那咱们的类思维呢?”程荟问道。

“类思维不是综合模型,不单单是语言模型。”纪弘说道:“甚至,类思维更偏向于决策过程。

“对于正式文件、说明文档、技术资料这些,类思维更擅长,不管是工作助理还是系统自动化插件,都是基于此的。

“但是,私人工作助理你用了,模型的语言能力是不是也不弱?基本正常的对话,它基本都能理解。

“语言能力确实是现阶段类思维模型的弱项之一,但哪怕是弱项,那也不是所谓的【类人泛化】的所谓MLC训练法——一个靠人工标记然后算力堆积训练出来的方法训练出来的东西所能比的。”

“那是,当然是我老公最厉害了!”程荟眼里又开始冒小星星了。

【得到认可,人泛化能力形成机理思维灵感+1】

“嗡!”纪弘的脑子瞬间爆了——不是因为这些灵感有多多,而是因为这个机理好像涉及到了另一个层面——人泛化能力形成机理研究的好像是人脑本身。

不仅如此,它好像和下午开会时候获得的【类人泛化能力实现方式的思维灵感】还能结合起来!

不过