有新闻称,Facebook的大型语言模子LLaMa通常只供获得批准的研究职员、政府官员或民间社会成员使用,现在已经泄露到网上供任何人下载。

据悉,现在在4chan 上已经有人在共享泄露的语言模子。上周,一名成员上传了 Facebook 工具 LLaMa((Large Language Model Meta AI))的 torrent 文件。这标志着一家大型科技公司的专有 AI 模子首次遭果然泄露。

迄今为止,谷歌、微软和 OpenAI 等公司最新模子都处于保密状态,只能通过消费者界面或 API 接见,据称是为了控制滥用情形。4chan 成员声称在他们自己的机械上运行 LLaMa,但此次泄露简直切内容尚不清晰。

在一份声明中,Meta 也并没有否认 LLaMa 遭泄露的说法,并强调了其在研究职员之间共享模子的方式。

官宣:谷歌2023年I/O大会将于5月10日举行

“Meta 的目的是与研究社区的成员分享最先进的 AI 模子,以辅助我们评估和改善这些模子。LLaMA 是出于研究目的而共享的,这与我们之前共享大型语言模子的方式一致。虽然并非所有人都可以使用该模子,而且有些人试图规避批准程序,但我们信托当前的公布计谋允许我们在责任和开放之间取得平衡,”Meta 谈话人在一封电子邮件中写道。

据领会,与包罗 OpenAI 的 GPT-3在内的其他人工智能模子一样,LLaMa 确立在大量单词或“符号”的基础上。只要在LLaMa 输入单词,就能展望下一个单词,并天生更多文本。

LLaMa 有多个差异巨细的版本,其中 LLaMa65B 和 LLaMa33B 在1.4万亿token上举行了训练。该模子主要从维基百科、书籍、以及来自 ArXiv、GitHub、Stack Exchange 和其他网站的学术论文中网络的数据集上训练的。

报道称,Meta 似乎正在在线提交该模子的删除请求以控制其流传。

凯辉基金合伙人马骏:消费创业与投资,从不确定性中寻找确定性