当前位置：首页 > 新闻资讯 > 正文内容

个人数据成为大模型的免费“养料”，用户却无法拒绝？

七夏9小时前新闻资讯10

南都数字经济治理研究中心一份最新报告测评发现，用户的个人数据被一些网络平台用于大模型的训练和优化，但国内主流平台普遍未提供用户拒绝和退出的渠道。

12月18日下午，南都在京召开第八届啄木鸟数据治理论坛，会上重磅发布3.6万字的《生成式AI用户风险感知与信息披露透明度报告（2024）》（下称“报告”）。

针对主流网络平台应用生成式AI的信息披露透明度，这份报告从五个维度展开测评：（1）有无提及AI大模型的条款？（2）是否明确告知会将用户数据用于AI大模型训练？（3）是否具体告知哪些用户数据会被用于AI大模型训练？（4）是否告知这些数据提供给哪些第三方公司用于AI大模型训练？（5）是否给用户提供拒绝个人数据被用于AI大模型训练的机制或功能？

报告以用户使用程度为主要指标，兼顾App类型的多元化，选取了微博、美团、淘宝、小红书、微信、京东、抖音、百度、知乎、携程十家主流互联网平台作为测评对象，涵盖内容平台、电商平台、本地生活服务平台、OTA平台（在线旅游服务平台）等常见类别，同时将国内平台与海外头部社交平台的做法展开对比。

测评维度及测评结果。

总体情况而言，淘宝、小红书、抖音、百度、知乎、携程六款App的平台规则中提及生成式AI的应用。

但仅有淘宝、携程和抖音三家平台，会明确告知将用户数据用于AI大模型训练和优化。测评发现，在明确告知的前提下，平台承诺对数据进行安全加密技术处理、严格去标识化且无法重新识别特定个人。但这些平台缺乏更进一步的功能设置：当用户不愿为大模型贡献“养料”，却无法从平台协议中获取到拒绝授权的方式。

相比之下，一些海外头部平台在协议中把退出机制直接告知用户。例如，领英在隐私政策中提供了一份《领英和生成式人工智能常见问题解答》，明确了用户行使拒绝权的方式——点击名为“Data for Generative AI Improvement member setting”的网页，即可选择不将个人数据和在领英上创建的内容用于大模型训练和微调。

领英个人主页的大模型训练退出选项。

南都记者注意到，由于国内平台未提供类似的退出机制，一些用户选择在所处平台发布“反向声明”，拒绝平台将用户上传的内容用于人工智能开发。

有法律实务界人士分析认为，这类声明直接明确了用户自己的拒绝态度，完全符合法律规定，并具有法律效力。但问题在于，AI爬取时也许并不能识别这类声明——对于AI而言，该文章同样仅仅只是一份可供爬取的数据，与其他数据并无不同。因此，最为妥当的解决方式，是平台提供专门用于屏蔽AI爬取功能的窗口。

上述报告同样建议，互联网平台应给予用户更多的选择权利，提供便捷的退出功能，让用户有权在设置中选择是否同意个人数据被用于模型训练。

报告还发现，百度、知乎和微博三款被测评的App，存在提供生成式AI服务，但没有披露是否将用户数据用于模型训练。微博方面曾公开表示，从隐私安全性上来说，微博的训练数据来源于公开发布的内容，不使用任何私密或敏感信息，不涉及用户的私信或其他设置为私密的内容。这表明实际操作中，微博会利用用户个人数据训练旗下大模型。也说明微博在用户数据训练问题上的透明度不够，未能落实到纸面的平台规范。

作为平台重要资产的用户数据，容易成为其他公司觊觎的对象。报告发现，像知乎、Quora、Reddit这样的在线问答社区平台，积累了大量优质问答内容，但这三家平台一致地严防自有数据“富矿”成为其他大模型公司的免费“午餐”。比如Quora在用户协议中强调，禁止将Quora平台的内容用于训练或开发任何人工智能、大语言模型或机器学习算法。

大模型内容安全问题上，国内平台沿用互联网治理的思路，由平台与用户共同承担信息安全义务。报告指出，平台规则在警惕用户注重甄别内容真实准确性的同时，还要求用户主动为AI内容进行标识。若用户未能履行相应义务，平台赋予自身采取处置措施的权利。例如，小红书的协议便写道，平台有权对相关内容和账户采取包括但不限于增加标识、限制、封禁等措施。而且，小红书也会通过主动监测，为疑似AI内容打上提示标记，并减少AI生成的低质内容曝光。

小红书在画面左下角提示内容疑似AI生成。

报告经比较发现，AI内容标识的规范在海外互联网平台的普及程度，远不如国内平台。从领英、X、Meta、谷歌和Reddit五家平台来看，普遍没有规定AI生成内容标识义务，更没有像小红书等国内平台那样主动监测并增加标识的做法。

为规范AI内容标识的做法，2024年9月中旬，国家网信办发布《人工智能生成合成内容标识办法（征求意见稿）》和《网络安全技术人工智能生成合成内容标识方法》强制性国家标准（征求意见稿）。

全国网络安全标准化技术委员会12月的一场活动上，中央网信办副主任、国家网信办副主任、网安标委主任委员王京涛指出，要以标准规范引领人工智能等新技术新应用安全有序发展，加快推动《人工智能生成合成内容标识方法》等标准的研制发布。

出品：南都数字经济治理研究中心

采写：南都记者杨柳李玲黄莉玲樊文扬

制图：黄莉玲

设计：李蓓

扫描二维码推送至手机访问。

本文链接：https://www.0538ta.cn/post/71586.html

分享给朋友：

返回列表

上一篇：“干到起皮”！东莞未来一周持续晴朗干燥，这一红色预警生效

下一篇：因私下接受客户委托买卖证券，中信证券一营业部员工遭警示

个人数据成为大模型的免费“养料”，用户却无法拒绝？

“个人数据成为大模型的免费“养料”，用户却无法拒绝？” 的相关文章

台风“普拉桑”将登陆！北方秋凉加重南方高温消退全国天气一览

河南开封：加快郑开300万辆汽车产业带建设

一高中允许女生留高马尾，这本不该是新闻

直播预告｜“9·20全国爱牙日”特别策划：从“齿”开始，一起爱牙

寻呼机爆炸让人细思极恐！全球潜在“爆炸物”数以十亿计，或对航空业影响最大

中秋深圳公园迎274.6万人次游客，客流量前五公园是……

干货满满！深圳市龙华区“法律明白人”为社区网格员充电

再见家乡！你好军营！深圳龙华新兵启程赴军营

全球最贵古代书画《十面灵璧图卷》领衔，15件国宝齐聚广州

佛山南海“人文艺术季”启动，超130项精彩活动等你来玩！

发表评论

鲁ICP备20023396号-1

个人数据成为大模型的免费“养料”，用户却无法拒绝？

“个人数据成为大模型的免费“养料”，用户却无法拒绝？” 的相关文章

发表评论取消回复

鲁ICP备20023396号-1 var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?a833e1c295e4cddaf213a76cdceab4b3"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();

发表评论

鲁ICP备20023396号-1