Article(id=1149744602908898204, tenantId=1146029695717560320, journalId=1146123302524792850, issueId=1149744590036583414, articleNumber=null, orderNo=null, doi=10.3969/j.issn.1672-6073.2024.01.009, pmid=null, cstr=null, oa=null, hot=null, price=null, onlineType=0, articleFormat=0, articleType=null, articleTypeStr=null, receivedDate=1697558400000, receivedDateStr=2023-10-18, revisedDate=1699545600000, revisedDateStr=2023-11-10, acceptedDate=null, acceptedDateStr=null, onlineDate=1752050074555, onlineDateStr=2025-07-09, pubDate=null, pubDateStr=null, doiRegisterDate=null, doiRegisterDateStr=null, onlineIssueDate=1752050074555, onlineIssueDateStr=2025-07-09, onlineJustAcceptDate=null, onlineJustAcceptDateStr=null, onlineFirstDate=null, onlineFirstDateStr=null, sourceXml=null, magXml=null, createTime=1752050074555, creator=13701087609, updateTime=1752050074555, updator=13701087609, issue=Issue{id=1149744590036583414, tenantId=1146029695717560320, journalId=1146123302524792850, year='2024', volume='37', issue='1', pageStart='1', pageEnd='166', issueExtLink='null', onlineDate='null', pubDate='null', beforeIssueId=null, nextIssueId=null, price=null, status=1, issueComplete=1, articleOrder=1, issueType=-1, specialIssue=null, createTime=1752050071486, creator=13701087609, updateTime=1753780168039, updator=13701087609, preIssue=null, nextIssue=null, ext={EN=IssueExt(id=1157001141138575501, tenantId=1146029695717560320, journalId=1146123302524792850, issueId=1149744590036583414, language=EN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=), CN=IssueExt(id=1157001141138575502, tenantId=1146029695717560320, journalId=1146123302524792850, issueId=1149744590036583414, language=CN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=)}, issueFiles=null}, startPage=54, endPage=62, ext={EN=ArticleExt(id=1149744603840033705, articleId=1149744602908898204, tenantId=1146029695717560320, journalId=1146123302524792850, language=EN, title=Design and Upgrade Practice of Urban Rail Big Data Platform Based on “Data Lakehouse” Technology, columnId=1154040062695170226, journalTitle=Urban Rapid Rail Transit, columnName=Upgrading of Existing Lines of Urban Rail Transit: A Featured Topic, runingTitle=null, highlight=null, articleAbstract=

To explore the optimal scheme for the construction and upgrading of the big data platform in the urban rail transit industry, this study takes the urban rail big data platform as the research object. Our study starts from the development process of the urban rail big data platform, sorts out the three stages of the development of the urban rail big data platform and analyzes the technology and advantages and disadvantages of the big data platform at each stage. Then it focuses on summarizing the advantages of "Data lake and Warehouse integration, stream processing and batch processing integration, OLTP+OLAP, multiple loads" and other advantages of the "Data Lakehouse" big data technology in the current stage, and studies the key points of the architecture upgrade and transformation design of the big data platform based on this technology. The technology was verified in the upgradation and transformation of the big data platform of the Beijing Metro Data Center. The application shows that the "Data lakehouse" big data platform technology combines the advantages of low cost of data lake and high performance of data warehouse, solves the shortcomings of the original big data platform in performance, capacity and multipurpose support, and provides new solutions for the construction and upgradation of big data platforms in the urban rail industry.

, correspAuthors=Yanjun WU, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=Yanjun WU, Zhirui GUANG, Minghua LI, Jianhua CHEN), CN=ArticleExt(id=1149744624807358974, articleId=1149744602908898204, tenantId=1146029695717560320, journalId=1146123302524792850, language=CN, title=基于“湖仓一体”技术的城轨大数据平台设计与升级改造实践, columnId=1154040062850359475, journalTitle=都市快轨交通, columnName=城轨既有线改造专辑, runingTitle=null, highlight=null, articleAbstract=

为了探寻城市轨道交通行业大数据平台建设与升级改造的最优方案,本文以城轨大数据平台为研究对象,从城轨大数据平台发展历程出发,梳理城轨大数据平台发展的3个阶段,分析各阶段大数据平台所采用的技术与优缺点,重点总结当前阶段“湖仓一体”大数据技术所具备的湖仓一体、流批一体、OLTP+OLAP、多重负载等优点,研究了基于该技术的大数据平台架构升级改造设计要点,并将该技术在北京地铁数据中心的大数据平台升级改造中进行应用验证。结果表明:“湖仓一体”大数据平台技术兼具数据湖的低成本、数据仓库的高性能等优点,解决了原大数据平台在性能、容量与多用途支持上的不足,为城轨行业大数据平台建设与升级改造提供了新的解决思路。

, correspAuthors=吴雁军, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=UsZfNQq6XKX7MI0itgL+kA==, magXml=/jESYRH9dzn9E2ZhjiJJ3Q==, pdfUrl=null, pdf=6Cv9Z5FIijYVZ13vlDvSzg==, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=WII3D7ij2e0+2OC/3Iz5UQ==, mapNumber=null, authorCompany=null, fund=null, authors=

吴雁军,男,本科,高级工程师,主要从事智慧交通、交通大数据、人工智能等方面研发工作,

, authorsList=吴雁军, 光志瑞, 李明华, 陈建华)}, authors=[Author(id=1154040109369385491, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=1532790289@qq.com, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154040109436494357, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040109369385491, language=EN, stringName=Yanjun WU, firstName=Yanjun, middleName=null, lastName=WU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154040109499408918, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040109369385491, language=CN, stringName=吴雁军, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082, bio={"content":"

吴雁军,男,本科,高级工程师,主要从事智慧交通、交通大数据、人工智能等方面研发工作,

"}, bioImg=null, bioContent=

吴雁军,男,本科,高级工程师,主要从事智慧交通、交通大数据、人工智能等方面研发工作,

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154040107641332239, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, xref=null, ext=[AuthorCompanyExt(id=1154040107645526544, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082), AuthorCompanyExt(id=1154040109264527889, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082)])]), Author(id=1154040109558129176, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154040110157914652, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040109558129176, language=EN, stringName=Zhirui GUANG, firstName=Zhirui, middleName=null, lastName=GUANG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154040110262772253, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040109558129176, language=CN, stringName=光志瑞, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154040107641332239, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, xref=null, ext=[AuthorCompanyExt(id=1154040107645526544, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082), AuthorCompanyExt(id=1154040109264527889, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082)])]), Author(id=1154040110317298207, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154040111869190690, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040110317298207, language=EN, stringName=Minghua LI, firstName=Minghua, middleName=null, lastName=LI, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154040111932105254, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040110317298207, language=CN, stringName=李明华, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154040107641332239, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, xref=null, ext=[AuthorCompanyExt(id=1154040107645526544, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082), AuthorCompanyExt(id=1154040109264527889, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082)])]), Author(id=1154040111986631210, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, orderNo=3, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1154040112095683116, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040111986631210, language=EN, stringName=Jianhua CHEN, firstName=Jianhua, middleName=null, lastName=CHEN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1154040112150209069, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, authorId=1154040111986631210, language=CN, stringName=陈建华, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1154040107641332239, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, xref=null, ext=[AuthorCompanyExt(id=1154040107645526544, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082), AuthorCompanyExt(id=1154040109264527889, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082)])])], keywords=[Keyword(id=1154040112452198961, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=1, keyword=urban rail transit), Keyword(id=1154040112510919218, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=2, keyword=big data platform), Keyword(id=1154040112561250870, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=3, keyword=upgrading), Keyword(id=1154040112636748344, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=4, keyword=data Lakehouse), Keyword(id=1154040112695468604, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=5, keyword=stream processing and batch processing integration), Keyword(id=1154040112791937602, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=6, keyword=data warehouse), Keyword(id=1154040112888406597, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, orderNo=7, keyword=data lake), Keyword(id=1154040112968098376, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=1, keyword=城市轨道交通), Keyword(id=1154040113093927497, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=2, keyword=大数据平台), Keyword(id=1154040113156842058, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=3, keyword=升级改造), Keyword(id=1154040113261699659, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=4, keyword=湖仓一体), Keyword(id=1154040113307837005, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=5, keyword=流批一体), Keyword(id=1154040113387528784, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=6, keyword=数据仓库), Keyword(id=1154040113496580692, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, orderNo=7, keyword=数据湖)], refs=[Reference(id=1154040115786670740, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://mp.weixin.qq.com/s/xtN_so61W2QtqKi2jNynsA, language=null, rfNumber=[1], rfOrder=0, authorNames=null, journalName=null, refType=null, unstructuredReference=2023年上半年中国内地城轨交通线路概况[EB/OL]. 北京: 中国城市轨道交通协会, [2023-07-01]. https://mp.weixin.qq.com/s/xtN_so61W2QtqKi2jNynsA., articleTitle=2023年上半年中国内地城轨交通线路概况, refAbstract=null), Reference(id=1154040115849585301, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=2020, issue=8, pageStart=129, pageEnd=134, url=null, language=null, rfNumber=[2], rfOrder=1, authorNames=景亮, 方晖, 张森, journalName=现代城市轨道交通, refType=null, unstructuredReference=景亮, 方晖, 张森. 城市轨道交通信息化云平台及大数据平台建设[J]. 现代城市轨道交通, 2020, 2020(8): 129-134., articleTitle=城市轨道交通信息化云平台及大数据平台建设, refAbstract=null), Reference(id=1154040115916694166, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=2020, issue=8, pageStart=129, pageEnd=134, url=null, language=null, rfNumber=[2], rfOrder=2, authorNames=JING Liang, FANG Hui, ZHANG Sen, journalName=Modern urban transit, refType=null, unstructuredReference= JING Liang , FANG Hui , ZHANG Sen . Construction of urban rail transit information Cloud and big data platform[J]. Modern urban transit, 2020, 2020(8): 129-134., articleTitle=Construction of urban rail transit information Cloud and big data platform, refAbstract=null), Reference(id=1154040115979608727, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2021, volume=24, issue=6, pageStart=12, pageEnd=12, url=null, language=null, rfNumber=[3], rfOrder=3, authorNames=李中浩, journalName=城市轨道交通研究, refType=null, unstructuredReference=李中浩. 建设标准化的城市轨道交通云和大数据平台[J]. 城市轨道交通研究, 2021, 24(6): 12-12., articleTitle=建设标准化的城市轨道交通云和大数据平台, refAbstract=null), Reference(id=1154040116050911896, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2021, volume=24, issue=6, pageStart=12, pageEnd=12, url=null, language=null, rfNumber=[3], rfOrder=4, authorNames=LI Zhonghao, journalName=Urban mass transit, refType=null, unstructuredReference= LI Zhonghao . Establish standardized urban rail transit cloud and big data platform[J]. Urban mass transit, 2021, 24(6): 12-12., articleTitle=Establish standardized urban rail transit cloud and big data platform, refAbstract=null), Reference(id=1154040116122215065, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://www.databricks.com/research/lakehouse-anew-generation-of-open-platforms-that-unify-data-warehousing-and-advanced-analytics, language=null, rfNumber=[4], rfOrder=5, authorNames=MICHAEL Armbrust, ALI Ghodsi, REYNOLD Xin, journalName=null, refType=null, unstructuredReference= MICHAEL Armbrust , ALI Ghodsi , REYNOLD Xin , et al . Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics[EB/OL]. [2020-12-22]. https://www.databricks.com/research/lakehouse-anew-generation-of-open-platforms-that-unify-data-warehousing-and-advanced-analytics., articleTitle=Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics, refAbstract=null), Reference(id=1154040116172546714, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2021, volume=34, issue=1, pageStart=138, pageEnd=143, url=null, language=null, rfNumber=[5], rfOrder=6, authorNames=王健, 徐炜, 张宁, journalName=都市快轨交通, refType=null, unstructuredReference=王健, 徐炜, 张宁, 等. 南京地铁线网指挥中心大数据平台架构[J]. 都市快轨交通, 2021, 34(1): 138-143., articleTitle=南京地铁线网指挥中心大数据平台架构, refAbstract=null), Reference(id=1154040116235461275, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2021, volume=34, issue=1, pageStart=138, pageEnd=143, url=null, language=null, rfNumber=[5], rfOrder=7, authorNames=WANG Jian, XU Wei, ZHANG Ning, journalName=Urban rapid rail transit, refType=null, unstructuredReference= WANG Jian , XU Wei , ZHANG Ning , et al. The big data platform architecture of Nanjing metro network control center[J]. Urban rapid rail transit, 2021, 34(1): 138-143., articleTitle=The big data platform architecture of Nanjing metro network control center, refAbstract=null), Reference(id=1154040116369679004, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=null, pageEnd=null, url=https://live.eyunbo.cn/live/74984?uin=1729, language=null, rfNumber=[6], rfOrder=8, authorNames=毛亮坚, journalName=null, refType=null, unstructuredReference=毛亮坚. 湖仓一体,构建企业数字化新基座[EB/OL].[2021-11-24]. https://live.eyunbo.cn/live/74984?uin=1729., articleTitle=湖仓一体,构建企业数字化新基座, refAbstract=null), Reference(id=1154040116436787869, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=17, issue=8, pageStart=62, pageEnd=66, url=null, language=null, rfNumber=[7], rfOrder=9, authorNames=徐炜, 张宁, 王健, journalName=铁路通信信号工程技术, refType=null, unstructuredReference=徐炜, 张宁, 王健, 等. 城轨线网指挥中心的大数据组织[J]. 铁路通信信号工程技术, 2020, 17(8): 62-66., articleTitle=城轨线网指挥中心的大数据组织, refAbstract=null), Reference(id=1154040116487119518, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=17, issue=8, pageStart=62, pageEnd=66, url=null, language=null, rfNumber=[7], rfOrder=10, authorNames=XU Wei, ZHANG Ning, WANG Jian, journalName=Railway signalling & communication engineering, refType=null, unstructuredReference= XU Wei , ZHANG Ning , WANG Jian , et al. Big data organi-zation of network command center in urban rail transit[J]. Railway signalling & communication engineering, 2020, 17(8): 62-66., articleTitle=Big data organi-zation of network command center in urban rail transit, refAbstract=null), Reference(id=1154040116550034079, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2018, volume=21, issue=增刊2, pageStart=43, pageEnd=46, url=null, language=null, rfNumber=[8], rfOrder=11, authorNames=胡彦, journalName=城市轨道交通研究, refType=null, unstructuredReference=胡彦. 城市轨道交通线网指挥中心大数据技术的应用[J]. 城市轨道交通研究, 2018, 21(增刊2): 43-46., articleTitle=城市轨道交通线网指挥中心大数据技术的应用, refAbstract=null), Reference(id=1154040116625531552, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2018, volume=21, issue=增刊2, pageStart=43, pageEnd=46, url=null, language=null, rfNumber=[8], rfOrder=12, authorNames=HU Yan, journalName=Urban mass transit, refType=null, unstructuredReference= HU Yan . Application of big data technology in urban rail transit network command center[J]. Urban mass transit, 2018, 21(增刊2): 43-46., articleTitle=Application of big data technology in urban rail transit network command center, refAbstract=null), Reference(id=1154040116675863201, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=null, issue=null, pageStart=null, pageEnd=null, url=null, language=null, rfNumber=[9], rfOrder=13, authorNames=贾福宁, journalName=null, refType=null, unstructuredReference=贾福宁. 轨道交通运营大数据:青岛地铁线网运营管理与指挥中心应用实践[M]. 北京: 北京交通大学出版社, 2020., articleTitle=轨道交通运营大数据:青岛地铁线网运营管理与指挥中心应用实践, refAbstract=null), Reference(id=1154040116738777762, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=null, issue=null, pageStart=null, pageEnd=null, url=null, language=null, rfNumber=[9], rfOrder=14, authorNames=JIA Funing, journalName=null, refType=null, unstructuredReference= JIA Funing . Big Data of Rail Transit Operation: Application Practice of Qingdao Metro Network Operation Management and Command Center[M]. Beijing: Beijing Jiaotong University Press, 2020., articleTitle=Big Data of Rail Transit Operation: Application Practice of Qingdao Metro Network Operation Management and Command Center, refAbstract=null), Reference(id=1154040116793303715, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2020, volume=null, issue=null, pageStart=null, pageEnd=null, url=null, language=null, rfNumber=[10], rfOrder=15, authorNames=null, journalName=城市轨道交通大数据平台技术规范: T/CAMET 11003—2020, refType=null, unstructuredReference=城市轨道交通大数据平台技术规范: T/CAMET 11003—2020[S]. 北京: 中国城市轨道交通协会, 2020., articleTitle=null, refAbstract=null), Reference(id=1154040116843635364, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2022, volume=35, issue=6, pageStart=69, pageEnd=74, url=null, language=null, rfNumber=[11], rfOrder=16, authorNames=吴昊, 梁樑, 张月坤, journalName=都市快轨交通, refType=null, unstructuredReference=吴昊, 梁樑, 张月坤, 等. 超大线网标准城轨云及共享数据平台研究[J]. 都市快轨交通, 2022, 35(6): 69-74., articleTitle=超大线网标准城轨云及共享数据平台研究, refAbstract=null), Reference(id=1154040116910744229, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, doi=null, pmid=null, pmcid=null, year=2022, volume=35, issue=6, pageStart=69, pageEnd=74, url=null, language=null, rfNumber=[11], rfOrder=17, authorNames=WU Hao, LIANG Liang, ZHANG Yuekun, journalName=Urban rapid rail transit, refType=null, unstructuredReference= WU Hao , LIANG Liang , ZHANG Yuekun , et al. Standard urban rail cloud and shared data platform of a super-large line network[J]. Urban rapid rail transit, 2022, 35(6): 69-74., articleTitle=Standard urban rail cloud and shared data platform of a super-large line network, refAbstract=null)], funds=null, companyList=[AuthorCompany(id=1154040107641332239, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, xref=null, ext=[AuthorCompanyExt(id=1154040107645526544, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082), AuthorCompanyExt(id=1154040109264527889, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, companyId=1154040107641332239, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082)])], figs=[ArticleFig(id=1154040114499019374, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 1, caption=Big data technology development history, figureFileSmall=HV1vM84fQD4SUOgF0iQaXg==, figureFileBig=x+RjR9SYtPv5lFhCq8f46g==, tableContent=null), ArticleFig(id=1154040114549351023, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 1, caption=大数据技术发展历程, figureFileSmall=HV1vM84fQD4SUOgF0iQaXg==, figureFileBig=x+RjR9SYtPv5lFhCq8f46g==, tableContent=null), ArticleFig(id=1154040114608071282, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 2, caption=Implementation principle of the Data Lakehouse technology, figureFileSmall=nW66KlpoU5HRCE15mkrVUQ==, figureFileBig=6qVT9fQY21ZIOS8084dilQ==, tableContent=null), ArticleFig(id=1154040114679374453, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 2, caption=湖仓一体技术实现原理, figureFileSmall=nW66KlpoU5HRCE15mkrVUQ==, figureFileBig=6qVT9fQY21ZIOS8084dilQ==, tableContent=null), ArticleFig(id=1154040114746483318, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 3, caption=System architecture, figureFileSmall=TEzX6+TWEZqXa+ddBcgalg==, figureFileBig=s86s8rDDZAYjmuPciEwqhQ==, tableContent=null), ArticleFig(id=1154040114796814968, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 3, caption=系统架构, figureFileSmall=TEzX6+TWEZqXa+ddBcgalg==, figureFileBig=s86s8rDDZAYjmuPciEwqhQ==, tableContent=null), ArticleFig(id=1154040114876506746, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 4, caption=Deployment architecture, figureFileSmall=HQG3khnQD4BSCLYlba9Nag==, figureFileBig=pyYHypu+yF/z86rYPGJlRQ==, tableContent=null), ArticleFig(id=1154040114943615612, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 4, caption=部署架构, figureFileSmall=HQG3khnQD4BSCLYlba9Nag==, figureFileBig=pyYHypu+yF/z86rYPGJlRQ==, tableContent=null), ArticleFig(id=1154040115077833343, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 5, caption=Data architecture, figureFileSmall=Hjg0pxLbg0aFqiSHldejmA==, figureFileBig=t+EkMZ1GW+Yj4Tl1Oe3lOw==, tableContent=null), ArticleFig(id=1154040115153330819, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 5, caption=数据架构, figureFileSmall=Hjg0pxLbg0aFqiSHldejmA==, figureFileBig=t+EkMZ1GW+Yj4Tl1Oe3lOw==, tableContent=null), ArticleFig(id=1154040115258188420, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 6, caption=Big data platform overall architecture diagram, figureFileSmall=FoKgzbae7j8F9AnP7CCWyA==, figureFileBig=twf+fpeWq0ONN2RvcnQBuw==, tableContent=null), ArticleFig(id=1154040115312714374, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 6, caption=大数据平台总体架构, figureFileSmall=FoKgzbae7j8F9AnP7CCWyA==, figureFileBig=twf+fpeWq0ONN2RvcnQBuw==, tableContent=null), ArticleFig(id=1154040115354657416, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Figure 7, caption=Big data platform deployment architecture diagram, figureFileSmall=eSjUHbI15wUsHOo2Tnwofw==, figureFileBig=sOi4PgabCCd9ppRUw08y8A==, tableContent=null), ArticleFig(id=1154040115400794762, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=图 7, caption=北京地铁大数据平台部署架构, figureFileSmall=eSjUHbI15wUsHOo2Tnwofw==, figureFileBig=sOi4PgabCCd9ppRUw08y8A==, tableContent=null), ArticleFig(id=1154040115451126412, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Table 1, caption=Comparison of Big Data platform construction technologies, figureFileSmall=null, figureFileBig=null, tableContent=
对比维度 数据仓库 数据湖 湖仓一体
数据格式 封闭的专有格式 开放格式 开放格式
存储数据 类型 结构化数据为 主,半结构化数 据有限支持 所有类型:结构 化、半结构化和 非结构化数据 所有类型:结构 化、半结构化和 非结构化数据
数据访问 仅支持SQL访问 可直接访问到文 件,并支持 SQL R、Python 及其 他语言 通过开放 API 可 直接访问到文 件, 并支持 SQL、 R、Python 及其他 语言
可靠性 通过 ACID 事务 处理提供高质 量、可靠数据 低质量,易造成 数据沼泽 通过 ACID 事务 处理提供高质量、 可靠数据
数据治理 与安全 为数据表提供行/ 列级别的细粒度 安全性和治理 安全性一般,因 为需要将安全性 应用到文件 为数据表提供行/ 列级别的细粒度 安全性和治理
性能
扩展性 按比例扩展成本 会成倍增加 可以低成本保存 任何数量的数据 而不考虑类型 可以低成本保存 任何数量的数据 而不考虑类型
用户场景 支持 仅限于统计分 析、报表报告 仅限于 AI 决策, 统计分析需要使 用额外组件 一个架构同时支 持统计分析与 AI 决策
), ArticleFig(id=1154040115501458062, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=表 1, caption=大数据平台构建技术对比, figureFileSmall=null, figureFileBig=null, tableContent=
对比维度 数据仓库 数据湖 湖仓一体
数据格式 封闭的专有格式 开放格式 开放格式
存储数据 类型 结构化数据为 主,半结构化数 据有限支持 所有类型:结构 化、半结构化和 非结构化数据 所有类型:结构 化、半结构化和 非结构化数据
数据访问 仅支持SQL访问 可直接访问到文 件,并支持 SQL R、Python 及其 他语言 通过开放 API 可 直接访问到文 件, 并支持 SQL、 R、Python 及其他 语言
可靠性 通过 ACID 事务 处理提供高质 量、可靠数据 低质量,易造成 数据沼泽 通过 ACID 事务 处理提供高质量、 可靠数据
数据治理 与安全 为数据表提供行/ 列级别的细粒度 安全性和治理 安全性一般,因 为需要将安全性 应用到文件 为数据表提供行/ 列级别的细粒度 安全性和治理
性能
扩展性 按比例扩展成本 会成倍增加 可以低成本保存 任何数量的数据 而不考虑类型 可以低成本保存 任何数量的数据 而不考虑类型
用户场景 支持 仅限于统计分 析、报表报告 仅限于 AI 决策, 统计分析需要使 用额外组件 一个架构同时支 持统计分析与 AI 决策
), ArticleFig(id=1154040115551789711, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=EN, label=Table 2, caption=Comparison of the two generations of data platforms, figureFileSmall=null, figureFileBig=null, tableContent=
对比维度 全量数据仓库 (基于数据仓库技术) 大数据平台 (基于湖仓一体技术)
成本 建设成本高昂, 扩容成 本按比例成倍增加 建设成本大幅降低,扩 容成本低廉
数据范围 只支持结构化数据, 不 满足机器学习要求 支持所有数据类型,同 时满足数据分析与 AI 技术需求
时效性 只支持离线数据批处理, 不支持实时数据流处理 同时支持离线数据批处 理与实时数据流处理
用途 只用于运营报表输出, 不能支持调度系统等实 时系统 可以作为智慧地铁所有 在线分析、实时监控系 统以及 AI 中台的统一 数据支持平台
), ArticleFig(id=1154040115644064401, tenantId=1146029695717560320, journalId=1146123302524792850, articleId=1149744602908898204, language=CN, label=表 2, caption=两代数据平台对比, figureFileSmall=null, figureFileBig=null, tableContent=
对比维度 全量数据仓库 (基于数据仓库技术) 大数据平台 (基于湖仓一体技术)
成本 建设成本高昂, 扩容成 本按比例成倍增加 建设成本大幅降低,扩 容成本低廉
数据范围 只支持结构化数据, 不 满足机器学习要求 支持所有数据类型,同 时满足数据分析与 AI 技术需求
时效性 只支持离线数据批处理, 不支持实时数据流处理 同时支持离线数据批处 理与实时数据流处理
用途 只用于运营报表输出, 不能支持调度系统等实 时系统 可以作为智慧地铁所有 在线分析、实时监控系 统以及 AI 中台的统一 数据支持平台
)], attaches=null, journal=Journal(id=1146119287908970507, delFlag=0, nameCn=都市快轨交通, nameEn=Urban Rapid Rail Transit, nameHistory1=null, nameHistory2=null, issn=1672-6073, eissn=, cn=11-5144/U, coden=null, periodic=1, language=CN, oaType=0, ccby=null, superviseOffice=null, ownerOffice=null, pubOffice=null, editorOffice=null, officeType=null, aims=null, clcCode=null, officeProv=null, officeCity=null, officeAddr=null, officeZip=null, officeEmail=null, officePhone=null, editDirector=null, officeDirector=null, officeDirectorPhone=null, officeStaffNum=null, officeEmpNum=null, coverPicUrl=P1a+Ek/jjjHf/jufN8hKnw==, journalPrice=null, startedYear=null, abbrevIsoEn=Urban Rap Rail Trans, journalRemark=null, publicationField=null, createdTime=null, updatedTime=1756899235814, createdBy=null, updatedBy=18614031015, firstLetterCn=U, firstLetterEn=U, subjectCode=Engineering, subjectName=工程, subjectCodeEn=Engineering, subjectNameEn=null, picCn=P1a+Ek/jjjHf/jufN8hKnw==, picEn=Ml/zvLJzYsu7AhRo5kg9VQ==, jcr=null, cjcr=null, exts=[JournalExt(id=1158448607830827008, language=CN, name=都市快轨交通, nameHistory1=null, nameHistory2=null, managedBy=中国科学技术协会, sponsoredBy=中国技术经济学会, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=北京市西直门外北京交通大学机械工程楼D905室, officeZip=100044, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.urt.cn, createdTime=1754125271042, updatedTime=1754125271042, createdBy=13701087609, updatedBy=13701087609, submissionGuidelinesUrl=http://dskgjt.ijournals.cn/dskgjt/site/menu/20200615141511001, submissionAuthorUrl=http://dskgjt.ijournals.cn/dskgjt/author/login, submissionEditorUrl=http://dskgjt.ijournals.cn/dskgjt/editor/login, submissionReviewUrl=http://dskgjt.ijournals.cn/dskgjt/reviewer/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""}), JournalExt(id=1158448607931490305, language=EN, name=Urban Rapid Rail Transit, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=, createdTime=1754125271065, updatedTime=1754125271065, createdBy=13701087609, updatedBy=13701087609, submissionGuidelinesUrl=http://dskgjt.ijournals.cn/dskgjten/site/menu/20241120152535001, submissionAuthorUrl=http://dskgjt.ijournals.cn/dskgjt/author/login, submissionEditorUrl=http://dskgjt.ijournals.cn/dskgjt/editor/login, submissionReviewUrl=http://dskgjt.ijournals.cn/dskgjt/reviewer/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""})], databaseList=null, tenantJournalId=1146123302524792850, websiteList=[Website(id=1148243202399789480, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123302524792850, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/dskgjt/CN, language=CN, createTime=1751692112779, createBy=18614031015, updateTime=1753522796719, updateBy=18614031015, name=都市快轨交通-中文站点, tplId=1146099689490845704, title=都市快轨交通, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155921926926229709, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=articleTextType, value=kx, createTime=1753522863370, updateTime=1753522863370, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926905258186, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=banner, value=null, createTime=1753522863365, updateTime=1753522863365, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926896869577, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=AqFiyT4buOvVaL3FTbHG1g==, createTime=1753522863363, updateTime=1753522863363, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926917841100, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522863368, updateTime=1753522863368, creator=18614031015, updator=18614031015), WebsiteProps(id=1155921926913646795, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202399789480, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522863367, updateTime=1753522863367, creator=18614031015, updator=18614031015)]), Website(id=1155921810454626336, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123302524792850, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/dskgjt/EN, language=EN, createTime=1753522835604, createBy=18614031015, updateTime=1753522835604, updateBy=18614031015, name=都市快轨交通-英文站点, tplId=1146101810881728533, title=Urban Rapid Rail Transit, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155922050809192658, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=articleTextType, value=kx, createTime=1753522892906, updateTime=1753522892906, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050792415439, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=banner, value=null, createTime=1753522892902, updateTime=1753522892902, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050788221134, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=AqFiyT4buOvVaL3FTbHG1g==, createTime=1753522892901, updateTime=1753522892901, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050804998353, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522892905, updateTime=1753522892905, creator=18614031015, updator=18614031015), WebsiteProps(id=1155922050796609744, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155921810454626336, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522892903, updateTime=1753522892903, creator=18614031015, updator=18614031015)])], journalTitle=都市快轨交通, weixinUrl=null, journalUrl=null, iacademicId=null, status=0, seqNo=null, journalTitleEn=Urban Rapid Rail Transit, journalPhotoCn=P1a+Ek/jjjHf/jufN8hKnw==, journalPhotoEn=Ml/zvLJzYsu7AhRo5kg9VQ==, journalFirstLetter=U, journalRecommend=null, journalNew=null, journalCollection=null, jcrJf=null, cjcrJf=null, jcrJfStr=null, cjcrJfStr=null, submissionFirstDecision=null, sciSubjectClassification=null, casSubjectClassification=null, citeScore=null, totalCitationFrequency=null, icpCode=null, psCode=null, advertisingLicenseCode=null, copyrightInformation=null, country=null, option=null, provinceCode=null, provinceName=null, collectFlag=false), detailUrlCn=https://castjournals.cast.org.cn/joweb/dskgjt/CN/10.3969/j.issn.1672-6073.2024.01.009, detailUrlEn=https://castjournals.cast.org.cn/joweb/dskgjt/EN/10.3969/j.issn.1672-6073.2024.01.009, pdfUrlCn=https://castjournals.cast.org.cn/joweb/dskgjt/CN/PDF/10.3969/j.issn.1672-6073.2024.01.009, pdfUrlEn=https://castjournals.cast.org.cn/joweb/dskgjt/EN/PDF/10.3969/j.issn.1672-6073.2024.01.009, aliStartDate=null, aliEndDate=null, collectionFlag=false, citedCount=null, citedUrl=null, reference=null)
收藏切换
基于“湖仓一体”技术的城轨大数据平台设计与升级改造实践
收藏切换
PDF下载
吴雁军 , 光志瑞 , 李明华 , 陈建华
都市快轨交通 | 城轨既有线改造专辑 2024,37(1): 54-62
收起
收藏切换
都市快轨交通 | 城轨既有线改造专辑 2024, 37(1): 54-62
基于“湖仓一体”技术的城轨大数据平台设计与升级改造实践
全屏
吴雁军 , 光志瑞, 李明华, 陈建华
作者信息
  • 北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082
  • 吴雁军,男,本科,高级工程师,主要从事智慧交通、交通大数据、人工智能等方面研发工作,

Design and Upgrade Practice of Urban Rail Big Data Platform Based on “Data Lakehouse” Technology
Yanjun WU , Zhirui GUANG, Minghua LI, Jianhua CHEN
Affiliations
  • Beijing Mass Transit Railway Operation Corp., Ltd., Technology Innovation Research Institute Branch, Beijing Key Laboratory of Subway Operation Safety Technology Beijing 100082
doi: 10.3969/j.issn.1672-6073.2024.01.009
文章导航
收藏切换

为了探寻城市轨道交通行业大数据平台建设与升级改造的最优方案,本文以城轨大数据平台为研究对象,从城轨大数据平台发展历程出发,梳理城轨大数据平台发展的3个阶段,分析各阶段大数据平台所采用的技术与优缺点,重点总结当前阶段“湖仓一体”大数据技术所具备的湖仓一体、流批一体、OLTP+OLAP、多重负载等优点,研究了基于该技术的大数据平台架构升级改造设计要点,并将该技术在北京地铁数据中心的大数据平台升级改造中进行应用验证。结果表明:“湖仓一体”大数据平台技术兼具数据湖的低成本、数据仓库的高性能等优点,解决了原大数据平台在性能、容量与多用途支持上的不足,为城轨行业大数据平台建设与升级改造提供了新的解决思路。

城市轨道交通  /  大数据平台  /  升级改造  /  湖仓一体  /  流批一体  /  数据仓库  /  数据湖

To explore the optimal scheme for the construction and upgrading of the big data platform in the urban rail transit industry, this study takes the urban rail big data platform as the research object. Our study starts from the development process of the urban rail big data platform, sorts out the three stages of the development of the urban rail big data platform and analyzes the technology and advantages and disadvantages of the big data platform at each stage. Then it focuses on summarizing the advantages of "Data lake and Warehouse integration, stream processing and batch processing integration, OLTP+OLAP, multiple loads" and other advantages of the "Data Lakehouse" big data technology in the current stage, and studies the key points of the architecture upgrade and transformation design of the big data platform based on this technology. The technology was verified in the upgradation and transformation of the big data platform of the Beijing Metro Data Center. The application shows that the "Data lakehouse" big data platform technology combines the advantages of low cost of data lake and high performance of data warehouse, solves the shortcomings of the original big data platform in performance, capacity and multipurpose support, and provides new solutions for the construction and upgradation of big data platforms in the urban rail industry.

urban rail transit  /  big data platform  /  upgrading  /  data Lakehouse  /  stream processing and batch processing integration  /  data warehouse  /  data lake
吴雁军, 光志瑞, 李明华, 陈建华. 基于“湖仓一体”技术的城轨大数据平台设计与升级改造实践. 都市快轨交通, 2024 , 37 (1) : 54 -62 . DOI: 10.3969/j.issn.1672-6073.2024.01.009
Yanjun WU, Zhirui GUANG, Minghua LI, Jianhua CHEN. Design and Upgrade Practice of Urban Rail Big Data Platform Based on “Data Lakehouse” Technology[J]. Urban Rapid Rail Transit, 2024 , 37 (1) : 54 -62 . DOI: 10.3969/j.issn.1672-6073.2024.01.009
中国城市轨道交通行业经历了近 20 年的快速发展。截至 2023 年 6 月 30 日,我国已有 57 座城市开通了城市轨道交通线路,运营总里程已达10 566 km[1] ,特别是北京、上海、广州、深圳等超大型城市的轨道交通已全面进入规模化和网络化运营阶段。城市轨道交通业务复杂, 空间上跨越车站、线路、线网三种维度, 专业上覆盖客流、行车、设备、供电、车辆、轨道等多种门类, 关联信息化系统有综合监控系统(integrated supervision and control system, ISCS)、火灾报警系统 (fire alarm system, FAS)、环境与设备监控系统(building automatic system, BAS)、监控和数据采集系统(supervisory control and data acquisition, SCADA)、自动列车监控系统(automatic train supervision, ATS)、自动售检票系统的清分中心(AFC clearing center, ACC)、多线路管理中心(multiple line center, MLC)、自动售检票系统 (automatic fare collection, AFC)等数十个, 每天会产生海量多源异构数据 [ 2 ] 。如何将这些数据有机地结合起来, 来满足城市轨道交通快速发展产生的新需求, 对城轨大数据平台建设提出了巨大的挑战。
一方面, 城市轨道交通网络化快速发展, 使网络化运营的调度指挥工作复杂程度大大增加, 这对作为调度指挥系统 “大脑” 的数据中心平台提出了极高的要求。另一方面,轨道交通运营时间超过 10 年的城市已有 15 座,其配套的数据平台已经不能满足轨道交通安全提升、品质提升、效率提升、效益提升的需求, 大多面临更新改造的问题。因此, 如何升级改造既有数据中心平台或建设新的大数据平台,成为非常值得研究的课题。鉴于在城市轨道交通领域利用第三代大数据技术解决上述问题的研究成果并不多见, 在参考轨道交通领域既有重要文献 [ 3 ] 的基础上,本文以城市轨道交通行业大数据平台的建设与升级改造为场景, 研究并提出基于最新 “湖仓一体” 大数据技术的城轨大数据平台设计, 助力城市轨道交通大数据体系的建设与完善。
城轨大数据平台技术的发展与大数据技术自身的发展密不可分,到目前为止大致可分为 3 个阶段 [ 4 ] , 如 图 1 所示。
第 1 阶段, 数据仓库(data warehouse)阶段。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合, 用于支持管理决策和信息的全局共享, 面向联机分析处理(on-line analytical processing, OLAP), 支持海量结构化数据的复杂分析。2011 年以前, 城轨数据中心的核心任务是解决传统关系型数据库无法承载海量结构化数据复杂分析的难题, 因此主流的城轨数据中心平台搭建主要采用数据仓库软硬件一体机技术。例如, 北京市轨道交通指挥中心线网指挥中心(traffic control center, TCC)二期数据中心平台、广州市轨道交通工程线网指挥平台(comprehensive operation coordination center, COCC)一期数据中心平台、深圳市轨道交通网络运营控制中心(network operation control center, NOCC)一期数据中心平台均采用 Teradata Aster 数据仓库软硬件一体机,西安地铁线网(应急)指挥中心(network contingency and operating contrd center, NCC) 一期采用 Oracle ExaData 数据仓库软硬件一体机。数据仓库拥有海量结构化数据的离线分析能力, 但不支持非结构化数据分析, 也不支持实时数据分析, 导致数据中心平台功能单一, 主要用于指标计算与报表输出,不能满足调度指挥系统实时监控需求。
第 2 阶段,数据湖(data lake) [ 5 ] 阶段。随着城轨业务的发展, 在指标分析的基础上实时监控和机器学习等新需求日增, 这与数据仓库只支持结构化历史数据分析、不支持非结构数据、不支持实时分析的特性之间的矛盾日益突出。2011 年 12 月, Hadoop 1.0.0 的发布开启了基于数据湖技术搭建大数据平台的新篇章。 以 Hadoop 为代表的数据湖技术构建的大数据平台可以存储任何形式(包括结构化、非结构化和半结构化) 和任何格式(包括文本、音频、视频和图像等)的原始数据。这使得数据湖能搭建真正的大规模数据平台, 数据存储成本也更为廉价。凭借该优点, Hadoop 在数年间逐步取代数据仓库软硬件一体机建设方案, 成为城轨数据中心建设的主流技术。例如, 青岛地铁线网运营管理与指挥中心(metro management & command center, MMCC)一期数据中心平台就采用 Hadoop 技术搭建, 很好地解决了数据仓库不能处理非结构化数据、不支持流处理的问题。大数据平台成为统一的基础平台, 既能支持离线指标计算, 也能支持调度指挥系统所需的实时监控。但 Hadoop 本身并不支持结构化数据分析, 使用 Hadoop 生态 HBase、Hive 等组件虽然可以实现类 SQL 语句查询, 但不支持删除、修改操作, 且执行效率不高、开发烦琐, 不具备数据仓库操作管理的便利性。
第 3 阶段, 湖仓一体(data lakehouse)阶段。随着云计算技术的兴起,依托云平台的新一代数据仓库—— 大规模并行处理数据库(massively parallel processing, MPP)逐渐发展成熟。MPP 能弥补 Hadoop 在结构化数据分析处理效率上的短板, 因此,“Hadoop+MPP” 混合架构理念被提出。例如, 苏州市轨道交通线网指挥中心(network control center, NCC)一期数据中心平台利用 Hadoop 技术实现非结构化数据的分布式存储与实时计算, 运用 MPP 实现结构化数据的快速分析, 在一定程度上解决了数据湖技术存在的问题。但 “Hadoop+ MPP”的模式只是数据湖与数据仓库的简单组合, 两套系统相对独立, 同时开发与维护两套系统成本较高, 且会造成数据冗余与逻辑不完全一致等问题, 因此城轨数据中心亟需一套完美解决上述问题的方案。针对这一需求,2020 年 “湖仓一体” 概念被提出 [ 4 ] 。湖仓一体是一种通过一套数据湖仓组件实现数据湖和数据仓库两者优势的新范式, 借助数据湖的低成本存储, 实现与数据仓库中类似的数据结构和数据管理功能, 这使得真正打通数据仓库和数据湖两套体系、构建一套有机的大数据技术生态体系成为可能。
湖仓一体大数据平台实现原理如 图 2 所示。数据湖仓由两部分组成: 底层的数据湖作为存储层, 用来存储包含结构化、半结构化和非结构化数据的任意种类数据; 上层是由元数据、缓存、索引组成的数据管理层。数据管理层读取底层的数据, 通过对数据的抽取、转化、加载(extract-transform-load, ETL)后,以接口的形式提供给上层应用访问。这些接口分为 3 大类: 元数据接口、高性能 SQL 接口以及申明性数据帧 API 接口。其中, 元数据接口实现数据湖仓对多源异构数据的统一管理, 高性能 SQL 接口提供高性能 SQL 引擎实现对数据分析、报表报告的支持, 申明性数据帧接口实现对数据科学与机器学习的支持。
数据仓库、数据湖和湖仓一体 3 种技术, 在数据格式、数据类型、数据访问、可靠性、应用场景支持等方面有明显区别 [ 6 ] ,具体如 表 1 所示。
从技术形态上来说, 数据仓库一般是独立的标准化系统, 如 Teradata Aster 数仓软硬件一体机、华为 GaussDB for DWS。数据湖更像是一种架构指导, 需要配合周边工具来实现业务需要。Hadoop 是最常用的数据湖技术, Hadoop 生态丰富的组件为其提供了高效的工具。湖仓一体也是一种架构, 以数据湖为中心, 把数据湖作为中央存储库,再围绕数据湖建立专用“数据服务环”, 环上的服务包括了数据仓库、大数据处理、 机器学习、交互式查询等一系列服务。目前,业界主流湖仓一体开源技术有 Apache Iceberg、Apache Hudi 和 Delta Lake。国内厂商也纷纷推出了自己的湖仓一体解决方案,如华为云 FusionInsight、阿里云 MaxCompute 等。
综上所述, 湖仓一体技术很好地避免了数据湖与数据仓库的局限性。基于湖仓一体技术搭建的城轨大数据平台有以下 4 大优势:
1) 存算分离。同时实现低成本与高性能。数据湖仓存储层通过分布式存储实现类似数据湖的大容量与低成本,计算层利用 Hudi 等数据湖仓组件实现类似数据仓库高性能分析能力, 支持轨道交通海量数据低成本存储、高效率分析。
2) 流批一体。同时支持实时处理与离线处理。平台既能满足海量离线数据的批处理计算需求(如夜间运行批处理计算前一天所有运营指标), 也能满足实时数据的流处理计算需求(例如, 持续处理当前进出站客流量, 实时推算线网断面客流等实时指标), 更好地支持运营状态监控与分析。
3) OLAP+OLTP。同时支持联机分析处理(online analytical processing, OLAP)与联机事务处理(online transaction processing, OLTP)。平台既能支持从数据湖仓获取原始数据并在数据仓库通过 OLAP 进行复杂的分析挖掘, 也能支持通过 OLTP 将处理结果反馈回数据湖仓, 及时更新数据源, 更好地支持复杂运营场景科学决策。
4) 多重负载。同时支持数据分析与机器学习。通过统一的数据管理, 平台既能支持敏捷分析, 也能支持人工智能, 打通了数据分析与机器学习, 使二者无缝集成,为 AI 大模型新技术在轨交领域的应用创造了条件, 为智慧地铁建设提供坚实支撑。
为了充分发挥 “湖仓一体” 技术的优势, 指导城轨大数据平台的建设和升级改造, 现结合城市轨道交通行业特点, 从系统架构、部署架构与数据架构 3 个方面开展分析。
依据湖仓一体架构 “存算分离、流批一体” 的机制, 城轨大数据平台的总体架构可分为 6 层(如 图 3 所示),自下而上分别是数据源、采集层、存储层、计算层、服务层和应用层。
数据源, 即大数据平台的数据来源系统, 为大数据平台提供了海量要存储和应用的数据。数据源既包括 ACC、ISCS 等生产系统,也包括 OA 系统等管理系统, 还包括气象信息系统、航班与公交等其他交通方式信息系统 [ 7 ]
采集层, 负责从数据源采集各类数据, 然后传递给存储层进行存储。数据采集时, 根据存储结构类型不同分别采用不同的采集方式。对于结构化数据(如 $\mathrm{{OA}}$ 系统的员工表),可通过数据迁移采集; 对于非结构化数据(如 Excel 文件),可通过 FTP 服务采集, CCTV 视频流可通过流媒体服务器采集; 对于半结构化数据 (如 Json 格式数据), 支持物联网的系统可以通过物联网网关系统采集, 支持数据服务的系统可以通过访问其 API 接口采集, 支持数据主动推送的系统可以通过消息队列接收数据。
存储层, 也就是数据湖仓的存储部分, 负责将采集层传递过来的数据进行存储, 数据湖仓应是企业中全量数据的单一存储系统。数据按照时效性不同可分为实时数据、离线数据和近线数据。为了响应不同类似数据的存储和应用特征,湖仓一体数据平台中的存储层设计了两种存储模式, 即实时存储和分布式存储。 对于实时数据, 为了保障其时效性和读取效率, 通常将其保存在消息队列或内存数据库,如 Kafka 或 Redis; 对于离线数据, 为保证其安全性与并行性应采用分布式存储 [ 8 ] ,也可以通过 Hadoop 分布式文件系统(hadoop distributed system, HDFS) [ 9 ] 或对象存储服务来存储; 对于近线数据, 可选内存数据库也可以选分布式存储, 具体根据业务需求确定。
计算层, 负责数据的处理、计算与管理。本层以 Apache Iceberg、Apache Hudi 和 Delta Lake 等数据湖仓组件为核心, 以存储层的分布式存储作为支撑, 利用流处理引擎与批处理引擎实现“流批一体”的数据处理机制, 实现对在线分析(OLAP)与事务处理 (on-line transaction processing, OLTP)的同时支持。流处理引擎用于以流处理的方式处理实时数据, 常用的有 Hadoop 生态的 Flink 引擎和 Spark Streaming 引擎; 批处理引擎用于以批处理的方式处理离线数据, 常用的有 Hadoop 内置的 MapReduce 引擎和 Hadoop 生态的 Spark 引擎。数据仓库作为湖仓一体架构的重要组成部分也建在本层,目前最常用的数据仓库是 MPP,它同时支持行存储与列存储, 支持事务处理机制, 提供 PB 级结构化数据的高效在线分析能力, 在结构化数据的处理方面具有明显优势, 是湖仓一体架构的重要补充。此外, 为了丰富数据库类型, 本层还应部署 NoSQL 数据库,如文档型数据库 MongoDB、图数据库 Neo4J; 为了支持 AI 计算, 本层还应部署机器学习与深度学习平台; 为了满足用户的多样化需求, 还应部署内存计算引擎与交互式查询引擎等。
服务层, 集成湖仓一体大数据平台对外提供服务。 具体包括数据集成与开发、实时计算、离线计算、数据资产目录、数据服务、数据科学、数据运维监管等一系列服务。
应用层, 即使用大数据平台的应用系统。大数据平台为应用系统提供数据支持与算法、算力支持, 但严格意义上, 应用层不划入大数据平台。在城市轨道交通领域, 核心的应用软件有综合决策平台、智能运行平台、智能客服平台、智能运维平台和主动安防平台等智慧地铁中心级平台,以及智慧车站平台、智慧车辆段平台、智慧列车平台等智慧地铁现场级平台。
在这 6 层之外, 还需要一些管理模块提供数据治理与数据安全等公共服务, 确保大数据平台平稳、安全地运行。如 图 3 系统架构所示, 统一数据治理与统一资源管理模块跨越大数据平台采集层、存储层和计算层, 提供大数据平台的数据管理服务; 统一数据安全管理与统一授权管理模块跨越采集层和服务层, 提供对数据安全与用户授权服务。
城轨大数据平台应部署在云平台上 [ 10 ] 。云平台为大数据平台统一提供计算资源、存储资源和安全资源 [ 11 ] 。大数据平台按照所在云平台的网络空间可分为 3 个域: 安全生产域、内部管理域和外部服务域。具体部署架构如 图 4 所示。
安全生产域连接 AFC/MLC/ACC、ATS、ISCS、 PSCADA、CCTV 等生产系统,获取实时数据用于支撑实时监控与生产大数据分析, 需要部署 Hadoop 集群、MPP 集群、Redis 集群、kafka 集群和应用服务器。 其中, Hadoop 集群需要部署 Hudi 数据湖仓、Spark 引擎、Flink 引擎等关键组件, 以实现对 “流批一体” 数据处理能力和 “多重负载” 机器学习能力的支持。 外部服务域主要用于发布面向互联网用户的服务和收发互联网数据的接口服务程序, 考虑现有业务对计算资源的需求并不大, 仅考虑部署应用服务器和关系数据库。内部管理域连接 $\mathrm{{OA}}$ 系统、 $\mathrm{{EAM}}$ 系统等管理系统,并接收从安全生产域输入的生产数据,以及从外部服务域输入的互联网数据, 进而实现三域数据的融合分析,因此需要部署安全生产域类似集群与组件。
依据湖仓一体技术 “存算分离、流批一体” 的机制, 按照城市轨道交通数据从采集、存储、处理到展示的过程, 城轨大数据平台的数据架构可分为 4 层(如 图 5 所示),自下而上分别是数据源、存储层、计算层、展示层。
数据源, 即大数据平台的数据来源系统, 与系统架构中的数据源一致。数据源包括各种生产系统、管理系统以及外部系统。这些系统为大数据平台提供数据, 但严格意义上不属于大数据平台。
从数据源传递过来的数据在存储层进行存储, 根据数据时效性不同分别采用不同的存储方式。实时数据以消息的形式按专业分别保存在 Kafka 消息队列的对应主题下;离线数据以 CSV 文件、日志文件、 Parquet 列式存储文件等形式保存在分布式文件系统 (HDFS)或者对象存储系统中, 作为数据湖仓的底层; 而近线数据可以根据业务需要任意选择上述两种方式。实时数据也可以根据业务需求通过累积的方式转变为历史数据, 然后作为离线数据进行存储。
数据在计算层进行处理、分析, 形成分析结果, 然后推送给展示层进行展示。对于离线数据, 依托批处理引擎或流批一体引擎进行处理, 在数据湖仓上层 Hudi 等组件或 MPP 中进行保存、分析。在数据湖仓中, 从存储层读取的原始数据保存在原始层, 分析过程的临时数据保存在临时层, 分析结果保存在最终层。MPP 中的保存、分析与数据湖仓类似, 只是 3 个内部层通常被称为贴源层、明细层、汇总层。对于实时数据, 从消息队列 kafka 读取数据后, 经流处理引擎或流批一体引擎处理, 直接推给展示层进行展示。对于近线数据, 同样既可以当作离线数据也可以作为实时数据来处理、分析。
展示层将计算层的分析结果提供给上层应用进行展示。对于分析结果中的离线数据, 按照专业分别保存到数据集市的对应域中, 数据集市通常选择关系型数据库。对于分析结果中的实时数据, 按照专业分别保存到内存数据库的对应域中, 内存数据库通常选择 Redis 键值库。对于分析结果中的近线数据, 同样既可以当作离线数据也可以作为实时数据来保存、 展示。
2022 年 1 月, 北京市地铁运营有限公司在既有全量数据仓库基础上, 在打造的下一代企业级大数据平台中突破性地采用了湖仓一体架构设计, 为智慧地铁建设更好地提供数据与算法支撑。如 图 6 所示, Hadoop 平台的分布式文件系统(HDFS)具有提供海量多源异构数据的存储能力作为数据湖仓的存储层, Spark、Flink 等批处理和流处理引擎实现了对流处理与批处理的同时支持, Hudi 数据湖仓组件实现了在线分析(OLAP)与事务处理(OLTP)的同步支持, MPP 具有提供快速数据分析能力, 既有全量数仓系统的接入确保了历史数据的延续性。此外, 统一的数据管理系统实现了湖仓共享存储资源池, 支持通过标准 SQL 访问跨域多源数据, 支持数据科学与 AI 训练推理, 减少了数据搬迁,实现了海量数据的快速价值挖掘。
在系统部署方面, 大数据平台基于云平台部署, 依照业务需求与网络安全要求, 在安全生产网和内部管理网均部署了数据湖仓集群(包含 Hadoop 节点、Kafka 节点、Redis 节点)、数据仓库集群(即 MPP 节点)和大数据业务集群(包含数据管理系统、各类大数据分析系统), 还在运维管理网部署了数据安全系统。在数据管理系统的协调下,打通了数据湖与数据仓库, 构建了一套拥有完整的、有机的湖仓一体大数据技术生态体系。
北京地铁大数据平台 (见 图 7 )作为新一代数据平台,与既有采用数据仓库技术的全量数据仓库系统相比,在 4 方面取得了突破性改善(见 表 2 )。
北京地铁智慧地铁大数据平台作为企业级大数据平台,接入了地铁运营所涉及的全专业数据, 依托 “湖仓一体” 技术, 不但具有了强大的运营指标融合计算能力, 还具有了高效的运营数据实时分析能力, 同时通过对 $\mathrm{{AI}}$ 平台的数据支持,保障了人工智能模型优化能力, 在提升地铁运营水平的同时支撑了智慧地铁建设诸多关键技术的科研攻关, 为国家重点研发计划 “超大城市轨道交通系统高效运输与安全服务关键技术”等项目的顺利实施奠定了坚实的基础,为北京地铁的数字化转型贡献了力量, 也为湖仓一体大数据平台架构做了成功的验证, 为城轨大数据平台建设与升级改造提供了新的解决方案。
本文研究了基于 “湖仓一体” 技术的大数据平台升级改造设计要点, 并在北京地铁数据中心的大数据平台升级改造中进行了应用验证, 取得了良好效果。 需要强调的是, 首先, 湖仓一体并不等同于数据湖+ 数据仓库。拥有数据湖和数据仓库的大数据平台必须具有统一的数据治理、统一的数据安全管理以及统一的资源管理等机制, 将数据湖和数据仓库有机地融合起来才是真正的湖仓一体架构。其次, 湖仓一体大数据平台架构在城市轨道交通领域的应用才刚刚起步, 如何充分发挥数据湖仓组件的作用, 使大数据平台摆脱对大规模并行处理数据库(MPP)的依赖还需进一步研究。总之, 从发展趋势来看,“湖仓一体” 技术必将在城市轨道交通企业数字化转型过程中发挥重要作用, 值得继续研究和不断探索。
参考文献 引证文献
排序方式:
[1]
2023年上半年中国内地城轨交通线路概况[EB/OL]. 北京: 中国城市轨道交通协会, [2023-07-01]. https://mp.weixin.qq.com/s/xtN_so61W2QtqKi2jNynsA. https://mp.weixin.qq.com/s/xtN_so61W2QtqKi2jNynsA
[2]
景亮, 方晖, 张森. 城市轨道交通信息化云平台及大数据平台建设[J]. 现代城市轨道交通, 2020, 2020(8): 129-134.
JING Liang , FANG Hui , ZHANG Sen . Construction of urban rail transit information Cloud and big data platform[J]. Modern urban transit, 2020, 2020(8): 129-134.
[3]
李中浩. 建设标准化的城市轨道交通云和大数据平台[J]. 城市轨道交通研究, 2021, 24(6): 12-12.
LI Zhonghao . Establish standardized urban rail transit cloud and big data platform[J]. Urban mass transit, 2021, 24(6): 12-12.
[4]
MICHAEL Armbrust , ALI Ghodsi , REYNOLD Xin , et al . Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics[EB/OL]. [2020-12-22]. https://www.databricks.com/research/lakehouse-anew-generation-of-open-platforms-that-unify-data-warehousing-and-advanced-analytics. https://www.databricks.com/research/lakehouse-anew-generation-of-open-platforms-that-unify-data-warehousing-and-advanced-analytics
[5]
王健, 徐炜, 张宁, 等. 南京地铁线网指挥中心大数据平台架构[J]. 都市快轨交通, 2021, 34(1): 138-143.
WANG Jian , XU Wei , ZHANG Ning , et al. The big data platform architecture of Nanjing metro network control center[J]. Urban rapid rail transit, 2021, 34(1): 138-143.
[6]
毛亮坚. 湖仓一体,构建企业数字化新基座[EB/OL].[2021-11-24]. https://live.eyunbo.cn/live/74984?uin=1729. https://live.eyunbo.cn/live/74984?uin=1729
[7]
徐炜, 张宁, 王健, 等. 城轨线网指挥中心的大数据组织[J]. 铁路通信信号工程技术, 2020, 17(8): 62-66.
XU Wei , ZHANG Ning , WANG Jian , et al. Big data organi-zation of network command center in urban rail transit[J]. Railway signalling & communication engineering, 2020, 17(8): 62-66.
[8]
胡彦. 城市轨道交通线网指挥中心大数据技术的应用[J]. 城市轨道交通研究, 2018, 21(增刊2): 43-46.
HU Yan . Application of big data technology in urban rail transit network command center[J]. Urban mass transit, 2018, 21(增刊2): 43-46.
[9]
贾福宁. 轨道交通运营大数据:青岛地铁线网运营管理与指挥中心应用实践[M]. 北京: 北京交通大学出版社, 2020.
JIA Funing . Big Data of Rail Transit Operation: Application Practice of Qingdao Metro Network Operation Management and Command Center[M]. Beijing: Beijing Jiaotong University Press, 2020.
[10]
城市轨道交通大数据平台技术规范: T/CAMET 11003—2020[S]. 北京: 中国城市轨道交通协会, 2020.
[11]
吴昊, 梁樑, 张月坤, 等. 超大线网标准城轨云及共享数据平台研究[J]. 都市快轨交通, 2022, 35(6): 69-74.
WU Hao , LIANG Liang , ZHANG Yuekun , et al. Standard urban rail cloud and shared data platform of a super-large line network[J]. Urban rapid rail transit, 2022, 35(6): 69-74.
2024年第37卷第1期
PDF下载
345
134
引用本文
BibTeX
文章信息
doi: 10.3969/j.issn.1672-6073.2024.01.009
  • 接收时间:2023-10-18
  • 首发时间:2025-07-09
补充材料
相关文章
文章信息
作者
出版历史
  • 收稿日期:2023-10-18
  • 修回日期:2023-11-10
基金
作者信息
    北京市地铁运营有限公司技术创新研究院分公司;地铁运营安全保障技术北京市重点实验室 北京 100082
参考文献
分享链接
https://castjournals.cast.org.cn/joweb/dskgjt/CN/10.3969/j.issn.1672-6073.2024.01.009
分享至
全文二维码

扫描看全文

引用本文
BibTeX
本文的引用情况
2种不同金属材料的力学参数

Family
属数
Number of
genus
种数
Number of
species
占总种数比例
Percentage of
total species (%)

Genus
种数
Number of
species
占总种数比例
Percentage of total
species (%)
鹅膏菌科Amanitaceae 2 11 5.26 鹅膏菌属 Amanita 10 4.78
小菇科 Mycenaceae 2 12 5.74 丝盖伞属 Inocybe 5 2.39
多孔菌科 Polyporaceae 8 14 6.70 蜡蘑属 Laccaria 5 2.39
红菇科 Russulaceae 3 23 11.00 小皮伞属 Marasmius 6 2.87
小菇属 Mycena 11 5.26
光柄菇属 Pluteus 5 2.39
红菇属 Russula 17 8.13
栓菌属 Trametes 5 2.39
关闭全屏