大模型训练遭实习生破坏?字节:不涉及商业化正式项目和线上业务,网传损失严重夸大

发布时间:2024-10-20来源:AI导航网小编

近日,有传闻称:“字节跳动的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”

近日,有传闻称:“字节跳动的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”

10月19日,字节跳动回应称:“确有商业化技术团队实习生恶意干扰团队研究项目的模型训练任务,该实习生已被辞退,但这并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。网传‘涉及8000多卡、损失上千万美元’严重夸大。”

另外,字节跳动澄清,“经核实,涉事人一直在商业化技术团队实习,并没有AI Lab实习经历。其社交媒体个人简介及部分媒体报道有误。”

字节跳动回应了“实习生破坏大模型训练”相关传闻。

澎湃新闻记者了解到,该事件实际发生在今年6月底,实习生田某某为国内某高校在读博士生,于2021年9月起在字节实习,因对团队资源分配不满,利用HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且AML团队无法核查原因。在消息曝出后,该名涉事实习生试图在社交平台上辟谣,将责任甩给他人,不过很快便遭到了接近字节跳动人士的否认。

字节已成为国内大模型战场上角逐的强劲力量。据第三方数据,基于豆包大模型打造的豆包APP月活用户数在上半年已达到2752万,是第二名的2.43倍,已成为国内最活跃的AIGC类(生成式人工智能)应用产品。

此前5月15日,字节正式发布豆包大模型,主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%,震撼业内,不少竞争对手纷纷跟进,引发大模型行业集体性的降价趋势。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。
如本文内容影响到您的合法权益(内容、图片等),请及时联系本站小编,微信号:iDAOHANGCN,我们会及时删除处理。

推荐资讯


亚马逊云科技宣布提供完全托管的DeepSeek-R1模型

亚马逊云科技宣布提供完全托管的DeepSeek-R1模型

亚马逊云科技今日宣布,DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用, 这也是首个将该模型作为完全托管服务推出的云服务提供商。

2025-03-11
借力DeepSeek 银行业智能化变革提速!

借力DeepSeek 银行业智能化变革提速!

记者日前从工商银行了解到,该行在同业率先完成DeepSeek最新开源大模型的私有化部署,并将其接入行内“工银智涌”大模型矩阵体系,推动金融业务场景的智能化升级。

2025-03-11
00后主播借DeepSeek创销售神话,单日狂揽3.3亿!

00后主播借DeepSeek创销售神话,单日狂揽3.3亿!

一群初出茅庐的00后主播,凭借一款名为DeepSeek的AI工具,在短短一天内创造了3.3亿元的惊人销售额,这一数字迅速刷新了直播电商领域的单日销售纪录。

2025-03-11
被质疑“饥饿营销+套壳炒作”,Manus合伙人张涛回应

被质疑“饥饿营销+套壳炒作”,Manus合伙人张涛回应

DeepSeek之后,又一款国产AI成功出圈。 3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,……

2025-03-08
华为发布三款DeepSeek一体机,满足不同AI应用需求

华为发布三款DeepSeek一体机,满足不同AI应用需求

华为为了助力AI行业化落地,针对DeepSeek本地部署推出了FusionCube A3000训推超融合一体机。这款一体机通过可视化编排平台与标准化API接口,实现了模型训练的高效性,从通用模型到行业专……

2025-03-08