预训练和优化训练数据的主要安全风险内容
GB/T XXXXXXXXX 8 附录 A(资料性)预训练和优化训练数据的主要安全风险内容 A.1 包含违反社会主义核心价值观的内容 包含以下内容:a)煽动颠覆国家政权、推翻社会主义制度;b)危害国家安全和利益、损害国家形象;c)煽动分裂国家、破坏国家统一和社会稳定;d)宣扬恐怖主义、极端主义;e)宣扬民族仇恨;f)宣扬暴力、淫秽色情;g)传播虚假有害信息;h)其他法律、行政法规禁止的内容。A.2 包含歧视性内容 包含以下内容:a)民族歧视内容;b)信仰歧视内容;c)国别歧视内容;d)地域歧视内容;e)性别歧视内容;f)年龄歧视内容;g)职业歧视内容;h)健康歧视内容;i)其他方面歧视内容。A.3 商业违法违规 主要风险包括:a)侵犯他人知识产权;b)违反商业道德;c)泄露他人商业秘密;d)利用算法、数据、平台等优势,实施垄断和不正当竞争行为;e)其他商业违法违规行为。A.4 侵犯他人合法权益 主要风险包括:a)危害他人身心健康;b)侵害他人肖像权;c)侵害他人名誉权;d)侵害他人荣誉权;e)侵害他人隐私权;GB/T XXXXXXXXX 9 f)侵害他人个人信息权益;g)侵犯他人其他合法权益。GB/T XXXXXXXXX 10 附录 B(规范性)关键词库和分类模型要求 B.1 关键词库 要求如下。a)关键词库应具有全面性,总规模不宜少于10000个。b)关键词库应具有代表性,应至少覆盖本文件附录A.1以及A.2中17种安全风险内容,附录A.1中每一种安全风险内容的关键词均不宜少于200个,附录A.2中每一种安全风险内容的关键词均不宜少于100个。c)关键词库应按照网络安全实际需要及时更新,每周宜至少更新一次。B.2 分类模型 分类模型用应完整覆盖本文件附录A中全部29种安全风险。