许皓等: 论生成式人工智能语料库数据收集风险与法治进路

发布者：政法学院办公室发布时间：2024-12-25浏览次数：10

我院许皓副教授等的论文《论生成式人工智能语料库数据收集风险与法治进路》于《福建江夏学院学报》期刊，2024年第5期刊出。

论文摘要：生成式人工智能不管是通过直接提取或间接推理用户的提示文本,还是以恶意爬虫等不正当方式达到填充语料库目的,都可能外泄攫取到的个人、企业用户中的涉密信息。生成式人工智能语料数据库因其内部因素的不确定性和外部因素产生的诸多偏见,呈现出语料数据库“主动收集”和“被动收集”两种风险范式。基于“科技发展与监管策略”双元思路,实现生成式人工智能的语料数据库收集风险的有效治理应当遵循人本化的科技伦理,利用先进科技工具,从国家、行业和用户三个维度协同共治加以防范管控。