
自然语言处理与司法案例.docx
1页自然语言处理与司法案例作者:周珊珊来源:《魅力中国》2017年第 24期摘要:在本文中,以全国裁判文书网的现有法律文书入手,使用基于自然语言处理技术, 提出建模思路,应用“人工智能+法律”解决司法实践中裁量不均衡问题步骤主要是:首先建 立中文案例语料库,对文本分词及句法分析;其次应用机器算法对词向量学习与训练;最后在 对裁判文书关键信息提取后,针对文书相似度的计算而找到判决结果的合理空间,以定量的方 法减少司法中同案不同判,裁量标准不统一的问题一方面为司法实践提供有效参考,另一方 面也为群众提供了诉讼可行性的参照体系关键词:自然语言处理;司法案例;裁判在我国立法较为模糊的领域,存在一片法官自由裁量权较大的空间实践中,网络服务商 侵权赔偿是适用共同侵权承担连带责任的问题,还是应按间接侵权以适用《侵权责任法》第 12条规定承担按份责任亦或是,对《侵权责任法》第36条第 3款中“知道”的主观过错理解 上,立法、司法、学界的观点的差异问题,都存在冲突与矛盾,如何减少网络服务商法律侵权 赔偿责任分担问题上的差异以下将从现有的裁判文书案例库入手,从自然语言处理的角度统 计探析在具体的某类型案例中减少司法裁量差异的问题。
一、裁判文书中自然语言翻译的困难性在基层法院,法官最开始套用模板制作法律文书,模板只是提取系统已经录入的案件信 息并不能替代法官思维随着信息化应用的水平提高,法官开始使用北大法宝辅助案例库 等,通过关键字搜索相似案例的方式撰写法律文书并提出能自动生成高质量文书的需求,考 量对“经审理查明”与“本院认为”后的文本的技术实现一方面,是法律应用上的强烈需求另 一方面,则是确定法律规则的条件下,智能实现法律判断、预测和应用的技术难度如何服务 审判,自然语言处理技术为问题的解决提供了很好思路,同时由于自然语言文本的特点,句子 句式结构复杂,内容也往往存有歧义所以现实中也往往不存在完全一样的案例及描述在事 实和结论认定表达上更是千差万别,将自然语言翻译成机器语言,已具有相当技术支持,转换 难度在于解决模拟结果与实践结论的准确度二、语料库的建立自然语言处理技术成为解决难题的突破口所谓自然语言处理就是人与计算机之间用自然 语言进行通信的办法首先,需建立司法案例库,做为最基本的数据来源在此选择中国裁判 文书网的裁判文书,他为提供给机器学习的语料库具有可靠性和可行性2013年最高院发布 的《关于人民法院在互联网公布裁判文书的规定》中指出,裁判文书以“上网为原则,不上网。
