一夜之间,大模型界又炸出个big news!
斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):
只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。
而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!
还有一个更绝的“骚操作”。
研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。
所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。
(薅羊毛高手……)
然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:
复制一个GPT-3.5效果的AI,很便宜,很容易,还很小。
而且团队还把数据集(秒省500刀)、代码统统都给开源了,这下子人人都能去微调个效果炸裂的对话AI:
项目在GitHub发布才半天时间,便已经狂揽1800+星,火爆程度可见一斑。
Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容:
不仅如此,斯坦福团队还搞了个demo,在线可玩的那种。
话不多说,我们现在就来看看这个“草泥马”的效果。
比肩davinci-003的草泥马Aplaca
在斯坦福官方的演示中,他们先小试牛刀地提了一个问题:
什么是羊驼?它和美洲驼的区别是什么?
草泥马Aplaca给出的答案较为干练:
羊驼是一种小型骆驼科动物,原产于秘鲁、玻利维亚、厄瓜多尔和智利;它比美洲驼小,羊毛更细,也没有驼峰。
而后又简单的介绍了二者群居生活的不同。
同样的问题若是交给ChatGPT(GPT3.5-turbo),则答案就不会像草泥马Aplaca那般简洁: