Article(id=1149729525703033292, tenantId=1146029695717560320, journalId=1146123302524792850, issueId=1149729524688007450, articleNumber=null, orderNo=null, doi=10.3969/j.issn.1672-6073.2025.02.001, pmid=null, cstr=null, oa=null, hot=null, price=null, onlineType=0, articleFormat=0, articleType=null, articleTypeStr=null, receivedDate=1741536000000, receivedDateStr=2025-03-10, revisedDate=1742745600000, revisedDateStr=2025-03-24, acceptedDate=null, acceptedDateStr=null, onlineDate=1752046479869, onlineDateStr=2025-07-09, pubDate=1743436800000, pubDateStr=2025-04-01, doiRegisterDate=null, doiRegisterDateStr=null, onlineIssueDate=1752046479869, onlineIssueDateStr=2025-07-09, onlineJustAcceptDate=null, onlineJustAcceptDateStr=null, onlineFirstDate=null, onlineFirstDateStr=null, sourceXml=null, magXml=null, createTime=1752046479869, creator=13701087609, updateTime=1752046479869, updator=13701087609, issue=Issue{id=1149729524688007450, tenantId=1146029695717560320, journalId=1146123302524792850, year='2025', volume='38', issue='2', pageStart='1', pageEnd='177', issueExtLink='null', onlineDate='null', pubDate='null', beforeIssueId=null, nextIssueId=null, price=null, status=1, issueComplete=1, articleOrder=1, issueType=-1, specialIssue=null, createTime=1752046479627, creator=13701087609, updateTime=1753780095764, updator=13701087609, preIssue=null, nextIssue=null, ext={EN=IssueExt(id=1157000837835870332, tenantId=1146029695717560320, journalId=1146123302524792850, issueId=1149729524688007450, language=EN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=), CN=IssueExt(id=1157000837835870333, tenantId=1146029695717560320, journalId=1146123302524792850, issueId=1149729524688007450, language=CN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=)}, issueFiles=null}, startPage=1, endPage=7, ext={EN=ArticleExt(id=1149729525883388368, articleId=1149729525703033292, tenantId=1146029695717560320, journalId=1146123302524792850, language=EN, title=Constructing a Retrieval-Augmented Generation Knowledge Base for Urban Rail Transit Large Language Models: A Knowledge Graph-Based Approach, columnId=1153381656112124779, journalTitle=Urban Rapid Rail Transit, columnName=Special Contribution, runingTitle=null, highlight=null, articleAbstract=

Data plays a crucial role in the successful deployment of urban rail transit large language models (LLMs). RetrievalAugmented Generation (RAG) technology emerges as a promising approach for developing industryspecific LLMs and mitigating hallucination issues. However, the lack of comprehensive industry knowledge bases hinders its effectiveness. This study proposes a novel framework for constructing a knowledge graphbased RAG knowledge base for urban rail transit LLMs. This framework consists of four key dimensions: classification skeleton, semantic benchmark, feature rules, and logical relationships. These dimensions are implemented through entity classification systems, terminology dictionaries, attribute libraries, and entity relationship tables, respectively. By incorporating industryspecific attributes for entities, this approach goes beyond the traditional subjectpredicateobject triple structure of knowledge graphs, resulting in a comprehensive and multifaceted representation of industry knowledge. This knowledge base serves as the core component of the RAG system, providing standardized, reliable, and traceable domain knowledge through a systematic pipeline of data collection, structuring, vectorization, and knowledge representation. This process significantly enhances the reliability and domain expertise of the content generated by urban rail transit LLMs, paving the way for a new era driven by both data and knowledge.

, correspAuthors=Songwei YU, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=Songwei YU, Wei LIU, Xiujiang XIA, Xin SHAO, Dezhi HAN, Xiaoyi HAN), CN=ArticleExt(id=1149729530673283611, articleId=1149729525703033292, tenantId=1146029695717560320, journalId=1146123302524792850, language=CN, title=基于知识图谱的城轨大模型 RAG 检索增强知识库构建研究, columnId=1153381656317645676, journalTitle=都市快轨交通, columnName=本刊特稿, runingTitle=null, highlight=null, articleAbstract=

当前,数据是城轨大模型落地的关键和核心养料,检索增强生成(retrievalaugmented generation,RAG)技术是城轨行业大模型建设和解决大模型幻觉问题的重要手段之一,但却因行业知识库的缺失难以充分发挥效用。本研究通过实体分类表、术语词典、属性库、实体关系表,创建分类骨架语义基准特征规则逻辑关系四维架构,尤其新增实体的行业属性,突破传统知识图谱的实体 A关系实体B三元组架构,从而形成标准化与立体化的行业知识体系。基于此构建的高质量行业知识库作为RAG技术的核心组件,通过数据采集→结构化→向量化→知识化的链路,为大模型提供标准、可信、可溯的领域知识,显著提升城轨大模型生成內容的的可靠性和专业性,为城轨行业迈向数据驱动与知识驱动的新阶段提供核心支撑。

, correspAuthors=于松伟, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=5TGxfHBFE0zLVp74hcZE3A==, magXml=3H6BMlye18H1yOLDV8BWeg==, pdfUrl=null, pdf=QBvO6K29nn3YpA7dQe9V9g==, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=o+OK6+ZjZvWsEM5fe98/NQ==, mapNumber=null, authorCompany=null, fund=null, authors=

于松伟,男,硕士,教授级高级工程师,长期从事城市轨道交通设计咨询与总体管理工作,

, authorsList=于松伟, 刘巍, 夏秀江, 邵昕, 韩德志, 韩晓艺)}, authors=[Author(id=1154050906892001534, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=yusw@bjucd.com, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154050906950721792, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050906892001534, language=EN, stringName=Songwei YU, firstName=Songwei, middleName=null, lastName=YU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154050907009442049, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050906892001534, language=CN, stringName=于松伟, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京城建设计发展集团股份有限公司 北京 100037, bio={"content":"

于松伟,男,硕士,教授级高级工程师,长期从事城市轨道交通设计咨询与总体管理工作,

"}, bioImg=null, bioContent=

于松伟,男,硕士,教授级高级工程师,长期从事城市轨道交通设计咨询与总体管理工作,

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])]), Author(id=1154050907080745219, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154050907495981317, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907080745219, language=EN, stringName=Wei LIU, firstName=Wei, middleName=null, lastName=LIU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154050907554701574, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907080745219, language=CN, stringName=刘巍, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京城建设计发展集团股份有限公司 北京 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])]), Author(id=1154050907605033224, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154050907667947786, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907605033224, language=EN, stringName=Xiujiang XIA, firstName=Xiujiang, middleName=null, lastName=XIA, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154050907735056651, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907605033224, language=CN, stringName=夏秀江, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京城建设计发展集团股份有限公司 北京 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])]), Author(id=1154050907781193997, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, orderNo=3, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154050907827331343, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907781193997, language=EN, stringName=Xin SHAO, firstName=Xin, middleName=null, lastName=SHAO, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154050907877662992, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907781193997, language=CN, stringName=邵昕, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京城建设计发展集团股份有限公司 北京 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])]), Author(id=1154050907923800338, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, orderNo=4, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154050907990909204, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907923800338, language=EN, stringName=Dezhi HAN, firstName=Dezhi, middleName=null, lastName=HAN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154050908066406677, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050907923800338, language=CN, stringName=韩德志, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京城建设计发展集团股份有限公司 北京 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])]), Author(id=1154050908137709847, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, orderNo=5, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154050909643465003, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050908137709847, language=EN, stringName=Xiaoyi HAN, firstName=Xiaoyi, middleName=null, lastName=HAN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154050909697990957, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, authorId=1154050908137709847, language=CN, stringName=韩晓艺, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京城建设计发展集团股份有限公司 北京 100037, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])])], keywords=[Keyword(id=1154050910159364410, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=1, keyword=urban rail transit), Keyword(id=1154050910226473276, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=2, keyword=artificial intelligence), Keyword(id=1154050910276804926, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=3, keyword=large language models), Keyword(id=1154050910327136576, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=4, keyword=DeepSeek), Keyword(id=1154050910381662530, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=5, keyword=retrieval-augmented generation), Keyword(id=1154050910427799876, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=6, keyword=knowledge base), Keyword(id=1154050910473937221, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=7, keyword=knowledge graph), Keyword(id=1154050910520074566, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=8, keyword=vector database), Keyword(id=1154050910570406215, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, orderNo=9, keyword=data annotation), Keyword(id=1154050910629126472, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=1, keyword=城市轨道交通), Keyword(id=1154050910692041033, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=2, keyword=人工智能), Keyword(id=1154050910738178378, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=3, keyword=大模型), Keyword(id=1154050910817870155, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=4, keyword=DeepSeek), Keyword(id=1154050910914339148, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=5, keyword=RAG), Keyword(id=1154050910973059406, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=6, keyword=知识库), Keyword(id=1154050911031779664, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=7, keyword=知识图谱), Keyword(id=1154050911103082835, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=8, keyword=向量数据库), Keyword(id=1154050911165997396, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, orderNo=9, keyword=数据标注)], refs=[Reference(id=1154050913321869685, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2023, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://arxiv.org/abs/2309.05557v3, language=null, rfNumber=[1], rfOrder=0, authorNames=MIAO Yukai, BAI Yu, CHEN Li, journalName=null, refType=null, unstructuredReference= MIAO Yukai , BAI Yu , CHEN Li , et al. An empirical study of NetOps capability of pre-trained large language models[EB/OL]. 2023. 2309.05557. https://arxiv.org/abs/2309.05557v3., articleTitle=An empirical study of NetOps capability of pre-trained large language models, refAbstract=null), Reference(id=1154050913393172854, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2024, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://arxiv.org/abs/2406.01375v1, language=null, rfNumber=[2], rfOrder=1, authorNames=QUE Haoran, LIU Jiaheng, ZHANG Ge, journalName=null, refType=null, unstructuredReference= QUE Haoran , LIU Jiaheng , ZHANG Ge , et al. D-CPT law: domain-specific continual pre-training scaling law for large language models[EB/OL]. 2024. 2406.01375. https://arxiv.org/abs/2406.01375v1., articleTitle=D-CPT law: domain-specific continual pre-training scaling law for large language models, refAbstract=null), Reference(id=1154050913468670327, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2018, volume=9, issue=1, pageStart=4352, pageEnd=null, url=null, language=null, rfNumber=[3], rfOrder=2, authorNames=WU Ji, LIU Xien, ZHANG Xiao, journalName=Nature communications, refType=null, unstructuredReference= WU Ji , LIU Xien , ZHANG Xiao , et al. Master clinical medical knowledge at certificated-doctor-level with deep learning model[J]. Nature communications, 2018, 9(1): 4352., articleTitle=Master clinical medical knowledge at certificated-doctor-level with deep learning model, refAbstract=null), Reference(id=1154050913527390584, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2024, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://arxiv.org/abs/2410.11195v1, language=null, rfNumber=[4], rfOrder=3, authorNames=PENG Xiao, CHEN Liang, journalName=null, refType=null, unstructuredReference= PENG Xiao , CHEN Liang . Athena: retrieval-augmented legal judgment prediction with large language models[EB/OL]. 2024. 2410.11195. https://arxiv.org/abs/2410.11195v1., articleTitle=Athena: retrieval-augmented legal judgment prediction with large language models, refAbstract=null), Reference(id=1154050913586110841, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2023, volume=36, issue=5, pageStart=1, pageEnd=10, url=null, language=null, rfNumber=[5], rfOrder=4, authorNames=于松伟, 刘巍, 仲莹萤, journalName=都市快轨交通, refType=null, unstructuredReference=于松伟, 刘巍, 仲莹萤. 基于复杂巨系统理论的城市轨道交通可持续发展综合评价[J]. 都市快轨交通, 2023, 36(5): 1-10., articleTitle=基于复杂巨系统理论的城市轨道交通可持续发展综合评价, refAbstract=null), Reference(id=1154050913644831098, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2023, volume=36, issue=5, pageStart=1, pageEnd=10, url=null, language=null, rfNumber=[5], rfOrder=5, authorNames=YU Songwei, LIU Wei, ZHONG Yingying, journalName=Urban rapid rail transit, refType=null, unstructuredReference= YU Songwei , LIU Wei , ZHONG Yingying . Comprehensive evaluation of sustainable development of urban rail transit based on open complex giant system theory[J]. Urban rapid rail transit, 2023, 36(5): 1-10., articleTitle=Comprehensive evaluation of sustainable development of urban rail transit based on open complex giant system theory, refAbstract=null), Reference(id=1154050913724522875, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://mp.weixin.qq.com/s/uMcMcauaM6Hy0E-3vJMvyw, language=null, rfNumber=[6], rfOrder=6, authorNames=国家数据局, journalName=null, refType=null, unstructuredReference=国家数据局. 关于向社会公开征求《数据领域名词解释》意见的公告[EB/OL]. (2024-10-21)[2025-01-05]. https://mp.weixin.qq.com/s/uMcMcauaM6Hy0E-3vJMvyw., articleTitle=关于向社会公开征求《数据领域名词解释》意见的公告, refAbstract=null), Reference(id=1154050913774854524, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://www.ndrc.gov.cn/xxgk/zcfb/tz/202501/t20250113_1395643.html, language=null, rfNumber=[7], rfOrder=7, authorNames=国家发展改革委, journalName=null, refType=null, unstructuredReference=国家发展改革委. 关于促进数据标注产业高质量发展的实施意见(发改数据〔2024〕 1822 号)[A/OL]. (2025-01-13)[2025-02-20]. https://www.ndrc.gov.cn/xxgk/zcfb/tz/202501/t20250113_1395643.html., articleTitle=关于促进数据标注产业高质量发展的实施意见(发改数据〔2024〕 1822 号), refAbstract=null), Reference(id=1154050913820991869, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2020, volume=31, issue=2, pageStart=302, pageEnd=320, url=null, language=null, rfNumber=[8], rfOrder=8, authorNames=蔡莉, 王淑婷, 刘俊晖, journalName=软件学报, refType=null, unstructuredReference=蔡莉, 王淑婷, 刘俊晖, 等. 数据标注研究综述[J]. 软件学报, 2020, 31(2): 302-320., articleTitle=数据标注研究综述, refAbstract=null), Reference(id=1154050913888100734, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2020, volume=31, issue=2, pageStart=302, pageEnd=320, url=null, language=null, rfNumber=[8], rfOrder=9, authorNames=CAI Li, WANG Shuting, LIU Junhui, journalName=Journal of software, refType=null, unstructuredReference= CAI Li , WANG Shuting , LIU Junhui , et al. Survey of data annotation[J]. Journal of software, 2020, 31(2): 302-320., articleTitle=Survey of data annotation, refAbstract=null), Reference(id=1154050913951015295, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2023, volume=14, issue=21, pageStart=1, pageEnd=4, url=null, language=null, rfNumber=[9], rfOrder=10, authorNames=马鹤桐, 王序文, 沈柳, journalName=中国卫生标准管理, refType=null, unstructuredReference=马鹤桐, 王序文, 沈柳, 等. 医学知识标注体系设计与系统构建[J]. 中国卫生标准管理, 2023, 14(21): 1-4., articleTitle=医学知识标注体系设计与系统构建, refAbstract=null), Reference(id=1154050914001346944, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2023, volume=14, issue=21, pageStart=1, pageEnd=4, url=null, language=null, rfNumber=[9], rfOrder=11, authorNames=MA Hetong, WANG Xuwen, SHEN Liu, journalName=China health standard management, refType=null, unstructuredReference= MA Hetong , WANG Xuwen , SHEN Liu , et al. Medical knowledge labeling system design and annotation system construction[J]. China health standard management, 2023, 14(21): 1-4., articleTitle=Medical knowledge labeling system design and annotation system construction, refAbstract=null), Reference(id=1154050914064261505, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2021, volume=18, issue=2, pageStart=189, pageEnd=193, url=null, language=null, rfNumber=[10], rfOrder=12, authorNames=王霞, 徐向东, 周光华, journalName=中国卫生信息管理杂志, refType=null, unstructuredReference=王霞, 徐向东, 周光华, 等. 健康医疗大数据标签体系构建方法研究[J]. 中国卫生信息管理杂志, 2021, 18(2): 189-193., articleTitle=健康医疗大数据标签体系构建方法研究, refAbstract=null), Reference(id=1154050914122981762, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, doi=null, pmid=null, pmcid=null, year=2021, volume=18, issue=2, pageStart=189, pageEnd=193, url=null, language=null, rfNumber=[10], rfOrder=13, authorNames=WANG Xia, XU Xiangdong, ZHOU Guanghua, journalName=Chinese journal of health informatics and management, refType=null, unstructuredReference= WANG Xia , XU Xiangdong , ZHOU Guanghua , et al. Research on the construction method of the tag system for health care big data[J]. Chinese journal of health informatics and management, 2021, 18(2): 189-193., articleTitle=Research on the construction method of the tag system for health care big data, refAbstract=null)], funds=[Fund(id=1154050913154097524, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, awardId=2024YFB3713002, language=CN, fundingSource=国家重点研发计划课题(2024YFB3713002), fundOrder=null, country=null)], companyList=[AuthorCompany(id=1154050906522902776, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, xref=null, ext=[AuthorCompanyExt(id=1154050906527097080, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037), AuthorCompanyExt(id=1154050906824892668, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, companyId=1154050906522902776, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京城建设计发展集团股份有限公司 北京 100037)])], figs=[ArticleFig(id=1154050912004858210, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, label=Figure 1, caption=Relationship between urban rail transit knowledge base and large language models, figureFileSmall=81f9nnTCB5/H490Sn1naDA==, figureFileBig=o/2bijhxpJ/qeOiNNAu6RA==, tableContent=null), ArticleFig(id=1154050912080355683, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, label=图1, caption=城轨行业知识库与大模型的关系, figureFileSmall=81f9nnTCB5/H490Sn1naDA==, figureFileBig=o/2bijhxpJ/qeOiNNAu6RA==, tableContent=null), ArticleFig(id=1154050912134881636, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, label=Figure 2, caption=Architecture of urban rail transit knowledge base, figureFileSmall=hMjFNXA6uB/Z7zFf35AilA==, figureFileBig=3nwG7ljZ/xRSuO15ntk0cg==, tableContent=null), ArticleFig(id=1154050912243933541, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, label=图2, caption=城轨行业知识库架构, figureFileSmall=hMjFNXA6uB/Z7zFf35AilA==, figureFileBig=3nwG7ljZ/xRSuO15ntk0cg==, tableContent=null), ArticleFig(id=1154050912294265191, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, label=Figure 3, caption=Platform architecture of urban rail transit knowledge base, figureFileSmall=FcedujI6Dbn6AmOakHZ6yw==, figureFileBig=98ggaLQf/AHbR2HrAm0U2w==, tableContent=null), ArticleFig(id=1154050912340402537, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, label=图3, caption=城轨行业知识库平台架构, figureFileSmall=FcedujI6Dbn6AmOakHZ6yw==, figureFileBig=98ggaLQf/AHbR2HrAm0U2w==, tableContent=null), ArticleFig(id=1154050912386539883, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, label=Table 1, caption=Elements of urban rail transit system: five subsystems as core, three axes of development, and four interactive spheres, figureFileSmall=null, figureFileBig=null, tableContent=
框架 子系统 具体组成
-c 基础系统 包括隧道、桥梁、车站等站前设施
运行系统 包括车辆、轨道、供电系统、信号系统、通信 系统、综合监控系统、在线监测系统、车辆段、 控制中心等站后设施
服务系统 乘客信息系统、通风空调、照明、给排水、消 防、电扶梯、屏蔽门、售检票系统、应急疏散 指示、安检系统、问询、招援、导向、能源管 理系统、大数据底座及平台等
管理系统 运营调度指挥管理系统、运维管理、投融资管 理、建设管理、资产管理、企业管理等
经营系统 包括广告、通信、商业、TOD、物业开发、文 旅开发、产业链投资等资源开发
三轴 时间 向度轴 包括投资立项、规划设计、施工安装、装备制 造、运营管理、维修改造等阶段
空间 向度轴 包括单元设备(系统)、单点车站、单线线路、 城市线网、区域四网、全国行业六大层级
利益相关 方向度轴 包括乘客、政府、城轨企业、项目直接参建方、 项目间接相关方、社会第三方
四圈 层 功能层 包括提升出行效率、拓展城市空间、促进产业 集聚、助力绿色减碳、营造品质生活、支持投 资拉动等功能
知识层 指由自然、科学、技术、工程、产业、经济、 社会等相关知识所构成的集成性知识体系
目标层 以经济、社会和环境的综合效益最大化为目标的
交互层 始终与外围环境存在着人流、物流、能流、资 金流、信息流的交互,尤其是以土地高效利用 为核心的城市功能交互
), ArticleFig(id=1154050912470425965, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, label=表1, caption=城轨交通系统要素——一心三轴四圈层, figureFileSmall=null, figureFileBig=null, tableContent=
框架 子系统 具体组成
-c 基础系统 包括隧道、桥梁、车站等站前设施
运行系统 包括车辆、轨道、供电系统、信号系统、通信 系统、综合监控系统、在线监测系统、车辆段、 控制中心等站后设施
服务系统 乘客信息系统、通风空调、照明、给排水、消 防、电扶梯、屏蔽门、售检票系统、应急疏散 指示、安检系统、问询、招援、导向、能源管 理系统、大数据底座及平台等
管理系统 运营调度指挥管理系统、运维管理、投融资管 理、建设管理、资产管理、企业管理等
经营系统 包括广告、通信、商业、TOD、物业开发、文 旅开发、产业链投资等资源开发
三轴 时间 向度轴 包括投资立项、规划设计、施工安装、装备制 造、运营管理、维修改造等阶段
空间 向度轴 包括单元设备(系统)、单点车站、单线线路、 城市线网、区域四网、全国行业六大层级
利益相关 方向度轴 包括乘客、政府、城轨企业、项目直接参建方、 项目间接相关方、社会第三方
四圈 层 功能层 包括提升出行效率、拓展城市空间、促进产业 集聚、助力绿色减碳、营造品质生活、支持投 资拉动等功能
知识层 指由自然、科学、技术、工程、产业、经济、 社会等相关知识所构成的集成性知识体系
目标层 以经济、社会和环境的综合效益最大化为目标的
交互层 始终与外围环境存在着人流、物流、能流、资 金流、信息流的交互,尤其是以土地高效利用 为核心的城市功能交互
), ArticleFig(id=1154050912545923439, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, label=Table 2, caption=Urban rail transit entity relationship types, figureFileSmall=null, figureFileBig=null, tableContent=
关系名称 示例说明
因果关系 高峰时段客流量激增(实体 A)导致列车发车调度调 整(实体 B)
组成关系 线路网络(实体 A)由线路 1(实体 B)、线路 2(实体 C)、线路 3(实体 D)等组成
从属关系 城市轨道交通(实体 $\mathrm{A}$ )从属于城市公共交通(实体 $\mathrm{B}$ )
位置关系 换乘枢纽(实体 A)位于三条线路交叉节点(实体 B)
时间关系 2023 年城轨年鉴(实体 A)早于 2024 年城轨年鉴(实 体 B)发布
相似关系 车站直梯(实体 A)与自动扶梯(实体 B)都是乘客运输 设备
对立关系 列车满载率高(实体 A)与乘客舒适度达标(实体 B) 存在对立
依赖关系 列车自动驾驶安全性(实体 A)依赖 ATO 系统可靠性 (实体 B)
交互关系 乘客(实体 A)通过移动支付(实体 B)完成票务交互
等同关系 第三轨(实体 A)与接触轨(实体 B)同义
), ArticleFig(id=1154050912650781041, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, label=表2, caption=城市轨道交通实体关系类型, figureFileSmall=null, figureFileBig=null, tableContent=
关系名称 示例说明
因果关系 高峰时段客流量激增(实体 A)导致列车发车调度调 整(实体 B)
组成关系 线路网络(实体 A)由线路 1(实体 B)、线路 2(实体 C)、线路 3(实体 D)等组成
从属关系 城市轨道交通(实体 $\mathrm{A}$ )从属于城市公共交通(实体 $\mathrm{B}$ )
位置关系 换乘枢纽(实体 A)位于三条线路交叉节点(实体 B)
时间关系 2023 年城轨年鉴(实体 A)早于 2024 年城轨年鉴(实 体 B)发布
相似关系 车站直梯(实体 A)与自动扶梯(实体 B)都是乘客运输 设备
对立关系 列车满载率高(实体 A)与乘客舒适度达标(实体 B) 存在对立
依赖关系 列车自动驾驶安全性(实体 A)依赖 ATO 系统可靠性 (实体 B)
交互关系 乘客(实体 A)通过移动支付(实体 B)完成票务交互
等同关系 第三轨(实体 A)与接触轨(实体 B)同义
), ArticleFig(id=1154050912726278514, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=EN, label=Table 3, caption=Classification of text data for urban rail transit, figureFileSmall=null, figureFileBig=null, tableContent=
分层 来源渠道 示例
社会通 识知识 免费获取 网上公开信息、免费数据集等
购买类 国家及各地的统计年鉴、市志等
行业通 用知识 协会积累 团体标准、统计年鉴、百科全书(城轨部分)、 报告、文件、装备认证、科技成果、协会网 站与人民城轨公众号等
行业公开 论文、专著、专利、软著、行业研究报告(白 皮书、蓝皮书等)、行业政策、管理办法、国 家标准、行业标准、媒体报道等
企业私 域知识 企业 规划设计文件、勘察资料、投融资报告、施 工组织、施工方案、施工管理、装备与设备 手册、运营数据、管理数据、经营数据、资 产数据、运维保养规程及数据、咨询评估报 告、第三方监测数据、企业标准类、企业研 究报告等
个人私 有知识 个人 汇报 PPT、工作笔记、工作总结、会议记录、 调研资料、邮件、聊天记录、培训素材等
), ArticleFig(id=1154050912889856371, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149729525703033292, language=CN, label=表3, caption=城轨文本数据分层, figureFileSmall=null, figureFileBig=null, tableContent=
分层 来源渠道 示例
社会通 识知识 免费获取 网上公开信息、免费数据集等
购买类 国家及各地的统计年鉴、市志等
行业通 用知识 协会积累 团体标准、统计年鉴、百科全书(城轨部分)、 报告、文件、装备认证、科技成果、协会网 站与人民城轨公众号等
行业公开 论文、专著、专利、软著、行业研究报告(白 皮书、蓝皮书等)、行业政策、管理办法、国 家标准、行业标准、媒体报道等
企业私 域知识 企业 规划设计文件、勘察资料、投融资报告、施 工组织、施工方案、施工管理、装备与设备 手册、运营数据、管理数据、经营数据、资 产数据、运维保养规程及数据、咨询评估报 告、第三方监测数据、企业标准类、企业研 究报告等
个人私 有知识 个人 汇报 PPT、工作笔记、工作总结、会议记录、 调研资料、邮件、聊天记录、培训素材等
)], attaches=null, journal=Journal(id=1146119287908970507, delFlag=0, nameCn=都市快轨交通, nameEn=Urban Rapid Rail Transit, nameHistory1=null, nameHistory2=null, issn=1672-6073, eissn=, cn=11-5144/U, coden=null, periodic=1, language=CN, oaType=0, ccby=null, superviseOffice=null, ownerOffice=null, pubOffice=null, editorOffice=null, officeType=null, aims=null, clcCode=null, officeProv=null, officeCity=null, officeAddr=null, officeZip=null, officeEmail=null, officePhone=null, editDirector=null, officeDirector=null, officeDirectorPhone=null, officeStaffNum=null, officeEmpNum=null, coverPicUrl=P1a+Ek/jjjHf/jufN8hKnw==, journalPrice=null, startedYear=null, abbrevIsoEn=Urban Rap Rail Trans, journalRemark=null, publicationField=null, createdTime=null, updatedTime=1756899235814, createdBy=null, updatedBy=18614031015, firstLetterCn=U, firstLetterEn=U, subjectCode=Engineering, subjectName=工程, subjectCodeEn=Engineering, subjectNameEn=null, picCn=P1a+Ek/jjjHf/jufN8hKnw==, picEn=Ml/zvLJzYsu7AhRo5kg9VQ==, jcr=null, cjcr=null, exts=[JournalExt(id=1158448607830827008, language=CN, name=都市快轨交通, nameHistory1=null, nameHistory2=null, managedBy=中国科学技术协会, sponsoredBy=中国技术经济学会, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=北京市西直门外北京交通大学机械工程楼D905室, officeZip=100044, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.urt.cn, createdTime=1754125271042, updatedTime=1754125271042, createdBy=13701087609, updatedBy=13701087609, submissionGuidelinesUrl=http://dskgjt.ijournals.cn/dskgjt/site/menu/20200615141511001, submissionAuthorUrl=http://dskgjt.ijournals.cn/dskgjt/author/login, submissionEditorUrl=http://dskgjt.ijournals.cn/dskgjt/editor/login, submissionReviewUrl=http://dskgjt.ijournals.cn/dskgjt/reviewer/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""}), JournalExt(id=1158448607931490305, language=EN, name=Urban Rapid Rail Transit, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=, createdTime=1754125271065, updatedTime=1754125271065, createdBy=13701087609, updatedBy=13701087609, submissionGuidelinesUrl=http://dskgjt.ijournals.cn/dskgjten/site/menu/20241120152535001, submissionAuthorUrl=http://dskgjt.ijournals.cn/dskgjt/author/login, submissionEditorUrl=http://dskgjt.ijournals.cn/dskgjt/editor/login, submissionReviewUrl=http://dskgjt.ijournals.cn/dskgjt/reviewer/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""})], databaseList=null, tenantJournalId=1146123302524792850, websiteList=[Website(id=1148243202399789480, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123302524792850, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/dskgjt/CN, language=CN, createTime=1751692112779, createBy=18614031015, updateTime=1753522796719, updateBy=18614031015, name=都市快轨交通-中文站点, tplId=1146099689490845704, title=都市快轨交通, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155921926926229709, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=articleTextType, value=kx, createTime=1753522863370, updateTime=1753522863370, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926905258186, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=banner, value=null, createTime=1753522863365, updateTime=1753522863365, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926896869577, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=AqFiyT4buOvVaL3FTbHG1g==, createTime=1753522863363, updateTime=1753522863363, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926917841100, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522863368, updateTime=1753522863368, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926913646795, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522863367, updateTime=1753522863367, creator=18614031015, updator=18614031015)]), Website(id=1155921810454626336, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123302524792850, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/dskgjt/EN, language=EN, createTime=1753522835604, createBy=18614031015, updateTime=1753522835604, updateBy=18614031015, name=都市快轨交通-英文站点, tplId=1146101810881728533, title=Urban Rapid Rail Transit, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155922050809192658, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=articleTextType, value=kx, createTime=1753522892906, updateTime=1753522892906, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050792415439, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=banner, value=null, createTime=1753522892902, updateTime=1753522892902, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050788221134, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=AqFiyT4buOvVaL3FTbHG1g==, createTime=1753522892901, updateTime=1753522892901, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050804998353, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522892905, updateTime=1753522892905, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050796609744, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522892903, updateTime=1753522892903, creator=18614031015, updator=18614031015)])], journalTitle=都市快轨交通, weixinUrl=null, journalUrl=null, iacademicId=null, status=0, seqNo=null, journalTitleEn=Urban Rapid Rail Transit, journalPhotoCn=P1a+Ek/jjjHf/jufN8hKnw==, journalPhotoEn=Ml/zvLJzYsu7AhRo5kg9VQ==, journalFirstLetter=U, journalRecommend=null, journalNew=null, journalCollection=null, jcrJf=null, cjcrJf=null, jcrJfStr=null, cjcrJfStr=null, submissionFirstDecision=null, sciSubjectClassification=null, casSubjectClassification=null, citeScore=null, totalCitationFrequency=null, icpCode=null, psCode=null, advertisingLicenseCode=null, copyrightInformation=null, country=null, option=null, provinceCode=null, provinceName=null, collectFlag=false), detailUrlCn=https://castjournals.cast.org.cn/joweb/dskgjt/CN/10.3969/j.issn.1672-6073.2025.02.001, detailUrlEn=https://castjournals.cast.org.cn/joweb/dskgjt/EN/10.3969/j.issn.1672-6073.2025.02.001, pdfUrlCn=https://castjournals.cast.org.cn/joweb/dskgjt/CN/PDF/10.3969/j.issn.1672-6073.2025.02.001, pdfUrlEn=https://castjournals.cast.org.cn/joweb/dskgjt/EN/PDF/10.3969/j.issn.1672-6073.2025.02.001, aliStartDate=null, aliEndDate=null, collectionFlag=false, citedCount=null, citedUrl=null, reference=null)
收藏切换
基于知识图谱的城轨大模型 RAG 检索增强知识库构建研究
收藏切换
PDF下载
于松伟 , 刘巍 , 夏秀江 , 邵昕 , 韩德志 , 韩晓艺
都市快轨交通 | 本刊特稿 2025,38(2): 1-7
收起
收藏切换
都市快轨交通 | 本刊特稿 2025, 38(2): 1-7
基于知识图谱的城轨大模型 RAG 检索增强知识库构建研究
全屏
于松伟 , 刘巍, 夏秀江, 邵昕, 韩德志, 韩晓艺
作者信息
  • 北京城建设计发展集团股份有限公司 北京 100037
  • 于松伟,男,硕士,教授级高级工程师,长期从事城市轨道交通设计咨询与总体管理工作,

Constructing a Retrieval-Augmented Generation Knowledge Base for Urban Rail Transit Large Language Models: A Knowledge Graph-Based Approach
Songwei YU , Wei LIU, Xiujiang XIA, Xin SHAO, Dezhi HAN, Xiaoyi HAN
Affiliations
  • Beijing Urban Construction Design and Development Group Co., Ltd. Beijing 100037
出版时间: 2025-04-01 doi: 10.3969/j.issn.1672-6073.2025.02.001
文章导航
收藏切换

当前,数据是城轨大模型落地的关键和核心养料,检索增强生成(retrievalaugmented generation,RAG)技术是城轨行业大模型建设和解决大模型幻觉问题的重要手段之一,但却因行业知识库的缺失难以充分发挥效用。本研究通过实体分类表、术语词典、属性库、实体关系表,创建分类骨架语义基准特征规则逻辑关系四维架构,尤其新增实体的行业属性,突破传统知识图谱的实体 A关系实体B三元组架构,从而形成标准化与立体化的行业知识体系。基于此构建的高质量行业知识库作为RAG技术的核心组件,通过数据采集→结构化→向量化→知识化的链路,为大模型提供标准、可信、可溯的领域知识,显著提升城轨大模型生成內容的的可靠性和专业性,为城轨行业迈向数据驱动与知识驱动的新阶段提供核心支撑。

城市轨道交通  /  人工智能  /  大模型  /  DeepSeek  /  RAG  /  知识库  /  知识图谱  /  向量数据库  /  数据标注

Data plays a crucial role in the successful deployment of urban rail transit large language models (LLMs). RetrievalAugmented Generation (RAG) technology emerges as a promising approach for developing industryspecific LLMs and mitigating hallucination issues. However, the lack of comprehensive industry knowledge bases hinders its effectiveness. This study proposes a novel framework for constructing a knowledge graphbased RAG knowledge base for urban rail transit LLMs. This framework consists of four key dimensions: classification skeleton, semantic benchmark, feature rules, and logical relationships. These dimensions are implemented through entity classification systems, terminology dictionaries, attribute libraries, and entity relationship tables, respectively. By incorporating industryspecific attributes for entities, this approach goes beyond the traditional subjectpredicateobject triple structure of knowledge graphs, resulting in a comprehensive and multifaceted representation of industry knowledge. This knowledge base serves as the core component of the RAG system, providing standardized, reliable, and traceable domain knowledge through a systematic pipeline of data collection, structuring, vectorization, and knowledge representation. This process significantly enhances the reliability and domain expertise of the content generated by urban rail transit LLMs, paving the way for a new era driven by both data and knowledge.

urban rail transit  /  artificial intelligence  /  large language models  /  DeepSeek  /  retrieval-augmented generation  /  knowledge base  /  knowledge graph  /  vector database  /  data annotation
于松伟, 刘巍, 夏秀江, 邵昕, 韩德志, 韩晓艺. 基于知识图谱的城轨大模型 RAG 检索增强知识库构建研究. 都市快轨交通, 2025 , 38 (2) : 1 -7 . DOI: 10.3969/j.issn.1672-6073.2025.02.001
Songwei YU, Wei LIU, Xiujiang XIA, Xin SHAO, Dezhi HAN, Xiaoyi HAN. Constructing a Retrieval-Augmented Generation Knowledge Base for Urban Rail Transit Large Language Models: A Knowledge Graph-Based Approach[J]. Urban Rapid Rail Transit, 2025 , 38 (2) : 1 -7 . DOI: 10.3969/j.issn.1672-6073.2025.02.001
编者按 随着ChatGPT、DeepSeek 等生成式人工智能大模型的推出,AI 必将逐步走进百行千业万企全民。而目前大模型的幻觉问题,是影响进程的主因之一,也是基础大模型在城轨行业垂直落地应用的关键所在。构建城轨行业知识库,为各城轨企业大模型提供外挂RAG 向量数据库等服务,是提升企业大模型训练微调效率与推理决策精准度的有效办法之一。本文提出的基于深度知识图谱,构建高质量的城轨行业知识库的相关研究,是将大模型应用到行业的基础性工作。希望行业凝心聚力,共同研究,共同建设。
自 2023 年 ChatGPT 发布后, 以大模型技术为代表的新一轮生成式人工智能浪潮席卷而来, 引发了一场千模大战。目前, DeepSeek 已在世界范围内进入百行千业万企。城市轨道交通(简称 “城轨” )行业各企业也不例外, 纷纷基于 DeepSeek 开展企业大模型或各种智能体研发与部署, 我国城轨行业智慧化正加速迈向数据驱动与知识驱动的新阶段。
城轨行业作为大模型的应用方, 也面临着算法- 算力-数据三要素的结构性问题。算力与算法可由 IT 及大模型等专业厂商主导;城轨行业尽管可通过借助 (开源)基础大模型搭建起本领域的垂直大模型, 但由于当前行业数据质量参差不齐且覆盖范围有限, 使得数据成了大模型在城轨行业应用的核心关键。NetEval 评估集系统对 26 个基础大语言模型进行评估后发现, 未注入行业数据的通用大模型对行业问题的回答准确率不足50% [ 1 ] 。城轨大模型的应用既包括一般问答等通用场景, 也包括决策性专用场景, 其对数据的准确性与合规性要求较高。准确性不足则易在实际应用中引发故障甚至事故;模型输出若未绑定合规依据与溯源路径, 还可能面临合规风险与监管处罚。
在解决上述核心问题的众多技术中, 检索增强生成技术(retrieval-augmented generation, RAG)至关重要, 它由领域知识库、检索器、生成器(大模型)3 大基础组件构成。其中, 城轨行业知识库作为核心组件, 结构化并语义向量化存储行业知识; 检索器根据用户提问, 精准理解用户意图并在知识库中迅速关联语义相关数据; 生成器(大模型)结合检索结果和用户问题, 生成符合要求的可信内容, 从而提升大模型回答的准确率。
然而, 当前行业内 RAG 技术的实际应用状况却差强人意,主要存在两个层面的问题:一是知识库建设层面,知识库作为 RAG 技术的运行基础,其质量优劣对 RAG 技术性能起着决定性作用, 但目前城轨行业尚缺乏一个高质量的行业知识库, 各企业自建知识库普遍存在知识覆盖不全、数据源杂乱、术语不统一、语义含混、更新滞后等问题;二是知识图谱支撑层面, 行业知识图谱作为知识库的神经中枢,在构建行业知识库时, 担负着实体齐全、概念清晰、关联准确、业务顺畅的核心职能。倘若构建的知识图谱范围不全、 质量不高, 那么定会导致 RAG 技术语义关联能力弱、 准确性差。
基于此, 本文研究了基于深度知识图谱的城轨大模型 RAG 知识库构建, 以推动各城轨大模型更好地实际应用。
城轨行业知识库是指在传统结构化知识库的基础上, 基于城轨专业知识构建深度知识图谱, 并实现全部数据向量化的行业知识管理系统。它由行业凝心聚力,共同完成,覆盖各层级项目的全生命周期、全专业、全场景, 涉及各利益相关方的知识、信息、数据, 除传统知识库的各种功能外, 还能为企业智能体及大模型构建提供高质量数据集、精准知识支持以及可信推理保障等基础支撑。本文提出的城轨行业知识库构建思路与技术路线, 也可为城轨企业知识库的构建提供借鉴与参考,城轨行业知识库与大模型的关系如图1所示。
传统知识库以全文存储和关键词检索为主, 仅完成了碎片化及关键词索引构建, 并未进行语义向量化, 语义关联性弱; 而城轨行业知识库则是在传统知识库已完成碎片化的基础上, 实现了知识语义化、特征向量化,可提供向量数据检索,同时知识具备跨专业、 跨生命周期、跨场景等交叉关联,知识关联性强。
城轨行业知识库可通过 RAG 技术, 为城轨企业大模型提供以下服务:
1)提升训练微调效率。Haoran Que 等指出, 将法律、数学、代码、化学、音乐、医疗 6 个行业的数据, 按照特定比例与社会通识数据进行融合, 基于此融合数据集来训练垂直大模型, 仅需投入不到社会通用大模型 10%的训练成本,即可完成训练,有效提升垂直大模型的训练微调效率 [ 2 ]
2)提高推理准确性。腾讯优图通过构建一个涵盖 53 本医学专著和超过 38 万个医学问题的知识库,大大提升了大模型对医学问题回答的准确性 [ 3 ] ,法律知识库通过 RAG 技术使得 Athena 大模型在法律场景回答准确率高达 95% [ 4 ]
3)增强大模型安全合规性。模型输出结果自带内容溯源(如引用的标准规范条款),可追溯每条结论的数据源头。
城轨行业知识库架构, 是以知识体系为内容核心, 以知识库平台为技术载体, 以知识单元为智能组件, 构建起数据采集 $\rightarrow$ 结构化 $\rightarrow$ 向量化 $\rightarrow$ 知识化的完整链路, 服务于城轨行业的多样化场景, 如图2所示。
在此架构下, 首先对采集到的各类数据资源进行结构化处理, 再对知识体系进行向量化处理, 并将其加工成数据向量库, 最后在知识库平台上封装为方便调用的知识单元——智能组件。
知识体系是城轨行业知识库构建的内容核心, 包含知识采集与知识加工两大环节。
1)知识采集: 数据种类包括文本、图像、视频、 语音等多模态数据。数据来源主要包括政府部门、行业协会、城轨相关企事业单位等行业正规渠道。
2)知识加工: 通过人机交互构建深度知识图谱, 并进行数据标注, 最后实现数据向量化。
知识库平台由基础模块、知识模块和应用模块 3 大模块协同构成, 如图3所示。
1)基础模块: 提供算力支撑与硬件环境, 包括智能计算集群(GPU/TPU)、分布式存储系统及机房设施, 保障知识服务的高效稳定运行。
2)知识模块: 主要由知识库系统与其他系统构成,其中知识库系统包含数据层、解析层、功能层、 服务层, 实现知识的全流程管理。
3)应用模块: 面向大模型的智能服务接口, 支持自然语言处理(NLP)、计算机视觉(CV)、智能体(Agent) 等模型的训练微调与复杂推理。应用模块通过与这些大模型的紧密协作, 将城轨行业知识库中的知识转化为实际生产力, 满足行业多样化的业务需求。
知识单元是基于城轨行业分类特点封装的可复用知识模块, 由文档、术语词典、实体分类表、实体关系库、知识图谱、结构化数据库、向量化数据库、数据集等知识模块构成, 如团标单元、年鉴单元、百科全书单元、统计分析报告单元等。城轨企业通过标准化 API 接口可直接调用知识单元, 快速形成模型训练微调或推理决策所需的可靠语料与数据。知识单元支持动态更新, 确保与行业政策、标准规范、实时资讯等内容的同步迭代。
城轨行业知识库的核心价值在于知识质量高与覆盖范围大, 二者共同构成 RAG 技术高效运行的基石。
城轨行业知识库的知识质量高主要体现在数据来源的权威性和数据表征的准确性两方面。
1)数据来源的权威性指城轨行业知识库需要聚合各类经过审验的可靠数据, 如标准规范、行业年鉴、协会文件、分析报告等。通过纳入这些来源明确的数据, 可为知识库奠定坚实基础, 同时要坚决避免未经审验的信息,以免对知识库的严谨性和可靠性造成损害。
2)数据表征的准确性包含术语标准化和知识结构化两部分。术语标准化要求关键概念的定义严格遵从相关标准规范,从而杜绝术语存在歧义现象。鉴于城轨行业的复杂性以及协同作业的特性, 一致、精准的术语定义对于各方顺畅沟通与高效协作至关重要。 知识结构化指借助深度知识图谱, 让各个知识点相互关联且层次清晰, 这不仅便于知识的存储和管理, 更能让 RAG 技术在检索知识时, 迅速、精准地定位与问题相关的知识块, 为大模型提供全面、准确的知识支撑。
城轨行业知识库需实现全生命周期、全空间层级、 全利益相关者、全专业、全制式、全场景的覆盖。可按照急用先行的原则从行业共性文本知识开始, 范围逐步扩展。
全生命周期确保项目各阶段的知识连贯, 全空间层级满足从宏观系统到微观单元的多元知识诉求, 全利益相关者助力各方协同合作从而提升城轨系统综合效益, 全专业促进跨专业知识的交融与关联, 全制式适配各类城轨项目独特需求, 全场景保障灵活应对城轨交通复杂多变的业务场景。
本文的深度知识图谱是传统知识图谱在城轨行业的深化与拓展, 由实体分类表、术语词典、属性库、 实体关系表组成, 以解决行业知识离散、语义混乱、 特征未辩、逻辑缺联等问题, 实现城轨行业知识的精准表达与深度应用。
相较于传统知识图谱, 深度知识图谱的优势体现在以下 3 个方面:
1)表征精准:传统知识图谱聚焦于实体 A-关系- 实体 $\mathrm{B}$ 的三元组结构,以简单直观的平面化方式描绘知识间的基本关联, 往往缺乏特定行业的术语解释、 实体属性。深度知识图谱采用分类骨架→语义基准→ 特征规则 $\rightarrow$ 逻辑关系的四维架构,基于城轨行业特性、 语义规范, 尤其是强调了实体的行业属性, 极大地增强了知识体系的标准化与立体化。
2)广度扩展: 深度知识图谱全面覆盖城轨全生命周期、全空间层级、全利益相关方、全专业、全制式、 全场景,知识覆盖范围更为广泛。
3)深度突破:深度知识图谱实现细粒度语义关联解析, 从宏观系统到微观单元, 实体分类层层深入, 对知识进行细致剖析; 同时设置动态约束, 关系附加时效性等。
实体分类表是深度知识图谱的层级化骨架, 通过树状编码体系实现城轨实体的逐级分类与唯一标识。 实体包括术语类与非术语类。术语类涵盖国家标准、 行业标准、团体标准、(部分)地方标准中的专业术语; 非专业术语类, 指行业词汇与通用词汇。该表的构成要素包括分类框架和编码规则:
1)分类框架: 依据一心三轴四圈层 [ 5 ] 划分为 $\mathrm{A}$ (城轨一心类)、B(城轨三轴类)、C(城轨四圈层类)三大类, 如表1所示;
2)编码规则, 采用字母搭配数字层级码, 以字母标识大类,如 $\mathrm{A}\text{、}\mathrm{\;B}\text{、}\mathrm{C}$ 类,数字编码则用于逐级细化层级,像从 A-01 进一步细分到 A-0101 ……01,以此确保每个实体 ID 在全局范围内独一无二。原则上, 在 $\mathrm{{ABC}}$ 三类中,实体不存在重复情况。
例如, 实体接触网的编号为 A-0101010101 , 清晰归属于城轨一心类 A-运行系统 01-供电系统 0101-牵引供电 010101→牵引网 01010101→接触网 0101010101→ 架空接触网 010101010101 $\rightarrow$ 刚性架空接触网 0101010101 0101 这一分类,精准明确了其分类结构与上下类关系。
术语词典是深度知识图谱的重要语义基准, 通过标准化解决行业术语多义性问题, 术语定义必须引用相关标准规范。
属性库是深度知识图谱的实体特征库。属性库由编号、标签、类型、行业属性、基础属性五类特征构成, 形成实体特征描述的完整框架。
1)编号(ID): 层级化编码(如 A-0101010101)是实体(接触网)唯一标识,体现分类归属;
2)标签: 实体的中英文对照名(如实体接触网的标签为接触网-catenary), 确保人机交互一致性;
3)类型:采用实体分类表中的父类编码(如实体接触网的类型为牵引网的 ID, 即 A-01010101), 以此限定继承范围;
4)基础属性: 包括词性、情感、同义词(如接触轨与第三轨)、近义词(如牵引变电所与牵引降压混合变电所)及元数据(如版本号 V2.3、状态有效)等,并动态管理。
5)行业属性: 对每一个术语或特殊名词的个体属性进行解释, 以明确实体的功能。每个行业属性是一个属性组, 组内属性一方面要考虑与上下父类与子类的继承关系, 另一方面还要考虑全生命周期各场景中的特征表现。
示例: 如实体接触网的编号(ID)为 A-0101010101, 标签为接触网-catenary, 类型为 A-010101(此为其父类牵引网的 ID); 行业属性有①供电连续性:电分段? 电不分段?②电压等级:直流 ${1500}\mathrm{\;V}$ ?直流 ${750}\mathrm{\;V}$ ? 等等;基础属性相关标注为词性名词, 情感中性, 各种元数据等。
实体关系表构建实体间的知识逻辑网络, 包含 10 类基础关系及关系属性等。
实体关系可根据 10 类基础关系进行构建, 如表2所示。考虑到实际的具体任务与行业特性, 这些关系类型并非固定不变, 可依据需求调整或扩展, 不必局限于这 10 种。
比如, 还可以设置方向性属性(单向关系与双向关系), 轨道交通建设(实体 A)促进城市发展(实体 B), 反过来,城市发展(实体 $\mathrm{B}$ )促进轨道交通建设(实体 $\mathrm{A}$ ), 这两者就是一种双向关系; 添加权重属性用来表明关系强度, 像关键关系或次要关系, 如新线规划(实体 A)的关键权重是线路途经人口密集区(实体 B);还有时间有效性属性用以记录关系的时间范围, 如某一标准规范的有效时间等。
对城轨交通行业而言, 高质量知识库构建的重点在于知识体系建设, 而其难点又在于其中的数据标注。 因平台部署与知识单元封装属于成熟技术, 本文不再赘述。研究团队参照国家发展改革委员会的相关文件 [ 6 - 7 ] , 将数据标注解构为数据筛选、数据清洗、数据分类、 数据注释、数据标记、质量检验共六大步骤, 这是基于深度知识图谱实现知识向量化, 并最终构建城轨行业知识库的过程。
根据数据类型, 城轨数据可以分为文本数据、图像数据、视频数据和音频数据。
根据知识通用性, 城轨知识可以分为两通两私: 社会通识知识、行业通用知识、企业私域知识和个人私有知识。以城轨文本数据为例进行分层说明, 如表3所示。
数据筛选是知识体系建设的初始阶段, 其核心目标是从海量城轨数据中提取符合大模型训练与推理需求的高价值语料等原始数据, 确保数据质量与业务的相关性。
数据清洗是根据深度知识图谱的术语词典与属性库对文本进行纠错去重、降噪、消歧等结构化处理, 确保数据格式与语义的规范性, 将原始文本转化为规范化的数据。
数据分类分为两步, 第一步是基础分类, 第二步是行业分类。基础分类以内容分类、词性分类等为主, 行业分类是在基础分类的基础上, 根据深度知识图谱进行细化。
1)基础分类: 包括内容分类(篇、章、节、段、块), 词性分类(名词、动词、形容词等)、情感分类(文本的积极、中性、消极情感倾向等)等 [ 8 - 10 ] 。基础分类可通过机器完成。
2)行业分类: 对城轨交通的实体基于实体分类框架划分层级, 确定实体编号(ID)、标签、类型。行业分类以人工主导、机器为辅助,通过人机交互完成。 城轨交通的实体一般属于名词或名词性描述, 包括概念、命名实体,时间实体,数值实体,事件实体,评价实体等。
数据注释与标记的重点对属性标注。基础属性由机器完成, 行业属性则通过深度知识图谱, 通过人工注释与标注, 并通过机器转化为合适维数的向量化数据。需要注意的是, 向量化数据并不是维数越高越好, 向量的维数需根据任务需求、数据规模和计算资源进行权衡。
质量检验分为基础检验和行业检验, 形式上为人机协同,即先通过机器检验再人工抽样检查。基础检验是通过机器确保标注与语义保持一致性。行业检验是基于深度知识图谱检验标注是否符合实体分类表、 术语词典、属性库、实体关系表, 并同步检查新增标注与历史版本兼容性的对比, 避免知识冲突。
知识库为 RAG 技术提供城轨专业知识支持, 快速定位城轨复杂场景的关联知识, 从而解决城轨大模型的知识泛化、输出欠准等幻觉问题。
基于深度知识图谱的知识库, 使检索器能够将口语化或非标准以及深度专业的用户提问, 与知识库进行语义对齐, 转换为标准、规范、专业的术语, 消除自然语言中的歧义表达,使得生成器(大模型)输出精准结果。
知识库的动态更新使 RAG 技术能力与行业发展同步,并持续适应城轨复杂巨系统的演变。
知识库使得 RAG 生成的结果合规、可信。知识库支撑生成器(大模型)每条输出均可关联具体的知识来源, 形成输出结果-知识来源-原始文件的溯源路径。
城轨行业知识库是在传统知识库仅进行碎片化的基础上, 结合蕴含行业属性的深度知识图谱, 构建的全文向量化数据库。它包括原始文档、术语词典、实体分类表、实体关系库、知识图谱、结构化数据库、 向量数据库和高质量数据集等多种数据库。作为各城轨企业一个外挂的行业知识库, 除提供传统知识库关键词查询检索等功能外, 还将有效提升城轨大模型的训练与微调效率, 同时作为城轨大模型 RAG 技术的核心组件, 将大大提高城轨大模型检索增强及其输出结果的精准度, 包括为各种智能体决策提供多种数据服务。
未来课题组还将围绕知识丰富-技术适配-工具开发三大方向继续研究。
1)知识丰富: 融合图像、音频、视频等多模态数据, 不断提高知识库的知识规模与范围、数量与质量。
2)技术适配: 面向 Agentic RAG 特性优化知识库架构, 根据城轨行业特点和用户习惯, 借助智能体技术优化 RAG 调用流程与交互逻辑, 进一步提高 RAG 技术在大模型应用中的效率与价值。
3)工具开发: 在通用数据标注工具的基础上, 二次开发符合城轨行业特点的城轨数据标注工具, 提高行业知识库建设的效率与质量。
致谢 感谢中国城市轨道交通协会宋敏华副会长、仲建华副会长的行业指导,以及中国知网张宏伟总经理的技术指导!
  • 国家重点研发计划课题(2024YFB3713002)
参考文献 引证文献
排序方式:
[1]
MIAO Yukai , BAI Yu , CHEN Li , et al. An empirical study of NetOps capability of pre-trained large language models[EB/OL]. 2023. 2309.05557. https://arxiv.org/abs/2309.05557v3. https://arxiv.org/abs/2309.05557v3
[2]
QUE Haoran , LIU Jiaheng , ZHANG Ge , et al. D-CPT law: domain-specific continual pre-training scaling law for large language models[EB/OL]. 2024. 2406.01375. https://arxiv.org/abs/2406.01375v1. https://arxiv.org/abs/2406.01375v1
[3]
WU Ji , LIU Xien , ZHANG Xiao , et al. Master clinical medical knowledge at certificated-doctor-level with deep learning model[J]. Nature communications, 2018, 9(1): 4352.
[4]
PENG Xiao , CHEN Liang . Athena: retrieval-augmented legal judgment prediction with large language models[EB/OL]. 2024. 2410.11195. https://arxiv.org/abs/2410.11195v1. https://arxiv.org/abs/2410.11195v1
[5]
于松伟, 刘巍, 仲莹萤. 基于复杂巨系统理论的城市轨道交通可持续发展综合评价[J]. 都市快轨交通, 2023, 36(5): 1-10.
YU Songwei , LIU Wei , ZHONG Yingying . Comprehensive evaluation of sustainable development of urban rail transit based on open complex giant system theory[J]. Urban rapid rail transit, 2023, 36(5): 1-10.
[6]
国家数据局. 关于向社会公开征求《数据领域名词解释》意见的公告[EB/OL]. (2024-10-21)[2025-01-05]. https://mp.weixin.qq.com/s/uMcMcauaM6Hy0E-3vJMvyw. https://mp.weixin.qq.com/s/uMcMcauaM6Hy0E-3vJMvyw
[7]
国家发展改革委. 关于促进数据标注产业高质量发展的实施意见(发改数据〔2024〕 1822 号)[A/OL]. (2025-01-13)[2025-02-20]. https://www.ndrc.gov.cn/xxgk/zcfb/tz/202501/t20250113_1395643.html. https://www.ndrc.gov.cn/xxgk/zcfb/tz/202501/t20250113_1395643.html
[8]
蔡莉, 王淑婷, 刘俊晖, 等. 数据标注研究综述[J]. 软件学报, 2020, 31(2): 302-320.
CAI Li , WANG Shuting , LIU Junhui , et al. Survey of data annotation[J]. Journal of software, 2020, 31(2): 302-320.
[9]
马鹤桐, 王序文, 沈柳, 等. 医学知识标注体系设计与系统构建[J]. 中国卫生标准管理, 2023, 14(21): 1-4.
MA Hetong , WANG Xuwen , SHEN Liu , et al. Medical knowledge labeling system design and annotation system construction[J]. China health standard management, 2023, 14(21): 1-4.
[10]
王霞, 徐向东, 周光华, 等. 健康医疗大数据标签体系构建方法研究[J]. 中国卫生信息管理杂志, 2021, 18(2): 189-193.
WANG Xia , XU Xiangdong , ZHOU Guanghua , et al. Research on the construction method of the tag system for health care big data[J]. Chinese journal of health informatics and management, 2021, 18(2): 189-193.
2025年第38卷第2期
PDF下载
364
142
引用本文
BibTeX
文章信息
doi: 10.3969/j.issn.1672-6073.2025.02.001
  • 接收时间:2025-03-10
  • 首发时间:2025-07-09
  • 出版时间:2025-04-01
补充材料
相关文章
文章信息
作者
出版历史
  • 收稿日期:2025-03-10
  • 修回日期:2025-03-24
基金
国家重点研发计划课题(2024YFB3713002)
作者信息
    北京城建设计发展集团股份有限公司 北京 100037
参考文献
分享链接
https://castjournals.cast.org.cn/joweb/dskgjt/CN/10.3969/j.issn.1672-6073.2025.02.001
分享至
全文二维码

扫描看全文

引用本文
BibTeX
本文的引用情况
2种不同金属材料的力学参数

Family
属数
Number of
genus
种数
Number of
species
占总种数比例
Percentage of
total species (%)

Genus
种数
Number of
species
占总种数比例
Percentage of total
species (%)
鹅膏菌科Amanitaceae 2 11 5.26 鹅膏菌属 Amanita 10 4.78
小菇科 Mycenaceae 2 12 5.74 丝盖伞属 Inocybe 5 2.39
多孔菌科 Polyporaceae 8 14 6.70 蜡蘑属 Laccaria 5 2.39
红菇科 Russulaceae 3 23 11.00 小皮伞属 Marasmius 6 2.87
小菇属 Mycena 11 5.26
光柄菇属 Pluteus 5 2.39
红菇属 Russula 17 8.13
栓菌属 Trametes 5 2.39
关闭全屏