我的位置: 上观号 > 上海检察 > 文章详情

上海检察智能化语料库建设论证会举行

转自:上海检察 2025-12-15 15:06:49

党的二十届四中全会对全面实施“人工智能+”行动作出部署。上海检察机关深入贯彻党的二十届四中全会精神以及最高检关于全国检察智能化建设的总体规划,围绕试点罪名和试点场景重点开展建设。目前,上海证据审查(危险驾驶罪)、三书比对、案卡回填等功能已推广到全国18个省应用。

为进一步提升智能化准确度,上海检察机关以“梳理构建检察知识体系、围绕模型应用转化业务知识、助力提升基础模型专业能力”为目标展开上海检察语料库和团体标准构建,并邀请业务和行业专家开展论证。日前,由上海市人民检察院主办的上海检察智能化语料库建设论证会在浦东新区检察院举行。

最高人民检察院检察技术信息研究中心副主任冯涛,上海市人民检察院检委会专职委员吴云,上海交通大学、华东政法大学、上海政法学院专家学者,以及上海长三角智慧城区发展研究院相关负责人出席。安徽省检察院相关负责同志、上海市三级检察机关智能化工作的业务和技术负责人以及上海检察智能化语料库建设团队全体成员参加。

吴云在致辞中表示,上海检察语料库建设采取了产学研联动模式,采用先进语料数据平台,由一线干警梳理法律名词解释等专业内容,并联合复旦、交大、华政等知名高校收集汇聚清洗法律教材、地方性行政法规等内容。同时,上海检察机关将建设“语料库”的思维链过程、专家经验、上海检察数据采集、转化、提炼等过程总结,形成语料库建设的上海范式。

当前,以人工智能为代表的新质生产力应用正在迅猛发展。算力、算法和语料是人工智能发展的三大要素。其中,语料就是经科学取样和加工的大规模电子文本集合,为自然语言处理和语义理解提供基础资源。语料对于人工智能大模型非常重要。

在检察智能化试点建设实践中,建设语料库是必经之路,通过梳理清楚法律法规、业务规则、量刑指导、名词解释、参考性案例等,提升提示词的精准性,做好模型微调训练,以适配新时代检察办案智能化的需要。

论证会上,上海市检察院汇报上海检察智能化语料库建设总体情况,浦东新区检察院以危险驾驶罪为例汇报展示SFT语料库内容、以盗窃罪为例汇报展示CoT语料库内容,上海检察智能化语料库建设团队成员汇报《人工智能上海检察语料库建设导则》。与会专家对语料库内容和语料库建设标准进行点评和指导。

专家点评

沈建平

上海长三角智慧城区发展研究院副院长

在人工智能和检察业务加强结合的大背景下,构建检察语料库意义重大,能够使大语言模型更加可控、可信、可用。不同领域构建语料库的方法论不同,上海市检察院已经找到了检察语料库的方法论,希望继续完善优化、延伸功能。

赵运锋

上海政法学院教务处处长、教授

基于检察实践形成的罪名梳理与案例分析为语料库建设打下了扎实基础,接下来可以在语料的准确性、完整性及来源多样性方面进一步优化,并做好动态跟踪与持续更新。

张  勇

华东政法大学刑事法学院教授、博士生导师

上海检察语料库建设前期工作非常扎实,规范有序、初见成效。建议进一步明确目标,聚焦检察工作中疑难实务问题、注重法律解释和裁判说理过程,增强语料库可用性、可控性。

杨  力

上海交通大学智慧司法研究院常务副院长、教授

上海检察语料库从 RAG、SFT、CoT 等多维度开展了基础性探索,具有较强的应用落地价值,对全国范围内的检察语料建设具有重要意义。《人工智能上海检察语料库建设导则》可为通识基础模型与专用领域大模型的精准适配与有效应用提供基础支撑、输出专业标准。

最高人民检察院检察技术信息研究中心副主任冯涛点评并讲话

冯涛指出,上海市检察院在全国率先开展语料库建设,探索出检察语料库四层架构并制定相关标准,取得了阶段性成果。下阶段,要深入贯彻党的二十届四中全会关于全面实施“人工智能+”的精神,持续落实人工智能与检察工作的深度结合,扎实、稳步推进检察智能化建设,坚持问题导向,发挥人工智能对检察办案的辅助作用。希望上海检察机关持续输出上海经验,打造检察智能化生态建设的上海样板。

供稿 | 市检察院检务保障部、浦东新区检察院