Article(id=1153992896337400555, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1153992893040677529, articleNumber=1671-1807(2025)06-0030-06, orderNo=null, doi=null, pmid=null, cstr=null, oa=null, hot=null, price=null, onlineType=0, articleFormat=0, articleType=null, articleTypeStr=research-article, receivedDate=1727020800000, receivedDateStr=2024-09-23, revisedDate=null, revisedDateStr=null, acceptedDate=null, acceptedDateStr=null, onlineDate=1753062946638, onlineDateStr=2025-07-21, pubDate=1742832000000, pubDateStr=2025-03-25, doiRegisterDate=null, doiRegisterDateStr=null, onlineIssueDate=1753062946638, onlineIssueDateStr=2025-07-21, onlineJustAcceptDate=null, onlineJustAcceptDateStr=null, onlineFirstDate=null, onlineFirstDateStr=null, sourceXml=null, magXml=null, createTime=1753062946638, creator=13701087609, updateTime=1753062946638, updator=13701087609, issue=Issue{id=1153992893040677529, tenantId=1146029695717560320, journalId=1146123222451335185, year='2025', volume='25', issue='6', pageStart='1', pageEnd='376', issueExtLink='null', onlineDate='null', pubDate='null', beforeIssueId=null, nextIssueId=null, price=null, status=1, issueComplete=1, articleOrder=1, issueType=-1, specialIssue=0, createTime=1753062945851, creator=13701087609, updateTime=1755224695430, updator=13701087609, preIssue=null, nextIssue=null, ext={EN=IssueExt(id=1163059927997072066, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1153992893040677529, language=EN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=), CN=IssueExt(id=1163059927997072067, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1153992893040677529, language=CN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=)}, issueFiles=null}, startPage=30, endPage=35, ext={EN=ArticleExt(id=1153992897067209476, articleId=1153992896337400555, tenantId=1146029695717560320, journalId=1146123222451335185, language=EN, title=Collaborative Filtering Recommendation Algorithm Based on Knowledge Graph for Sparse Data, columnId=1151876674645226399, journalTitle=Science Technology and Industry, columnName=Technology Innovation, runingTitle=null, highlight=null, articleAbstract=

Due to the lack of sufficient interaction support, the recommendation accuracy is poor. To address this, a sparse data collaborative filtering recommendation algorithm based on knowledge graph was proposed. Extract the interaction relationship between users and items, a knowledge graph was constructed, and the entity relationships in the knowledge graph was used to extend the representation of users and items. Combining CNN networks, interactive relationships was expanded into complex structures, contextual information was captured, and similarity using Euclidean distance was calculate. A set of similar neighbors was found for the target user, user collaboration filtering was used to predict ratings, the fusion time weighting strategy was dynamically adjusted, and a recommendation list was generated. Tests have shown that the algorithm has high NDCG values, low MAE and RMSE values, and ideal recommendation performance.

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=Xuejing XU, Chenwei LIN), CN=ArticleExt(id=1153992917325697294, articleId=1153992896337400555, tenantId=1146029695717560320, journalId=1146123222451335185, language=CN, title=基于知识图谱的稀疏数据协同过滤推荐算法, columnId=1151876674787832737, journalTitle=科技和产业, columnName=科技创新, runingTitle=null, highlight=null, articleAbstract=

因缺乏足够的交互关系支撑导致推荐精度不佳,对此,提出基于知识图谱的稀疏数据协同过滤推荐算法。抽取用户与物品的交互关系,构建知识图谱,利用知识图谱中的实体关系对用户和物品进行扩展表示。结合卷积神经网络(CNN)将交互关系扩为复杂结构,捕获上下文信息,以欧氏距离算相似度。找到目标用户相似邻居集,用用户协同过滤预测评分,融合时间加权策略动态调整,生成推荐列表。测试表明,该算法归一化折损累计增益(NDCG)值高,平均绝对误差(MAE)和均方根误差(RMSE)低,推荐效果较理想。

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=6Wq+BU3s5GcEBJ/yybBBNA==, magXml=F3Wphxzt4MAjUZ9QoFjktA==, pdfUrl=null, pdf=8bByswlaQd9yrZu98+X/pg==, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=yh6jcB+W7myHG7F1gsvi8Q==, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=ArGBlFm2CVNVjkzTBStf1g==, mapNumber=null, authorCompany=null, fund=null, authors=

许雪晶(1988—),女,福建莆田人,硕士,讲师,研究方向为数据挖掘研究;

林辰玮(1988—),男,福建莆田人,硕士,助理研究员,研究方向为信息化建设、大数据等。

, authorsList=许雪晶, 林辰玮)}, authors=[Author(id=1245461208313217653, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1245461208518738570, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, authorId=1245461208313217653, language=EN, stringName=Xuejing XU, firstName=Xuejing, middleName=null, lastName=XU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=1, address=1 School of Information Engineering, Putian University, Putian 351100, Fujian, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1245461208652956314, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, authorId=1245461208313217653, language=CN, stringName=许雪晶, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=1, address=1 莆田学院信息工程学院, 福建 莆田 351100, bio={"content":"

许雪晶(1988—),女,福建莆田人,硕士,讲师,研究方向为数据挖掘研究;

"}, bioImg=null, bioContent=

许雪晶(1988—),女,福建莆田人,硕士,讲师,研究方向为数据挖掘研究;

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1245461206891348549, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, xref=1, ext=[AuthorCompanyExt(id=1245461206908125769, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461206891348549, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=1 School of Information Engineering, Putian University, Putian 351100, Fujian, China), AuthorCompanyExt(id=1245461206933291599, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461206891348549, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=1 莆田学院信息工程学院, 福建 莆田 351100)])]), Author(id=1245461208824922793, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1245461209093358259, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, authorId=1245461208824922793, language=EN, stringName=Chenwei LIN, firstName=Chenwei, middleName=null, lastName=LIN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=2, address=2 Meizhouwan Vocational Technology College, Putian 351119, Fujian, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1245461209214993090, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, authorId=1245461208824922793, language=CN, stringName=林辰玮, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=2, address=2 湄洲湾职业技术学院, 福建 莆田 351119, bio={"content":"

林辰玮(1988—),男,福建莆田人,硕士,助理研究员,研究方向为信息化建设、大数据等。

"}, bioImg=null, bioContent=

林辰玮(1988—),男,福建莆田人,硕士,助理研究员,研究方向为信息化建设、大数据等。

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1245461208095113819, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, xref=2, ext=[AuthorCompanyExt(id=1245461208116085341, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461208095113819, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=2 Meizhouwan Vocational Technology College, Putian 351119, Fujian, China), AuthorCompanyExt(id=1245461208124473951, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461208095113819, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=2 湄洲湾职业技术学院, 福建 莆田 351119)])])], keywords=[Keyword(id=1245461209449874136, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, orderNo=1, keyword=knowledge graph), Keyword(id=1245461209630229220, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, orderNo=2, keyword=sparse data), Keyword(id=1245461209768641259, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, orderNo=3, keyword=recommendation algorithm), Keyword(id=1245461209869304569, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, orderNo=4, keyword=similarity), Keyword(id=1245461210058048264, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, orderNo=5, keyword=CNN), Keyword(id=1245461210200654612, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, orderNo=6, keyword=recommendation accuracy), Keyword(id=1245461210364232476, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, orderNo=1, keyword=知识图谱), Keyword(id=1245461210494255915, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, orderNo=2, keyword=稀疏数据), Keyword(id=1245461210636862267, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, orderNo=3, keyword=推荐算法), Keyword(id=1245461210783662918, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, orderNo=4, keyword=相似度), Keyword(id=1245461210955629398, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, orderNo=5, keyword=CNN网络), Keyword(id=1245461211102430048, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, orderNo=6, keyword=推荐精度)], refs=[Reference(id=1245461215552585733, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=50, issue=S2, pageStart=518, pageEnd=528, url=null, language=null, rfNumber=[1], rfOrder=0, authorNames=韩志耕, 范远哲, 陈耿, journalName=计算机科学, refType=null, unstructuredReference=韩志耕, 范远哲, 陈耿, . 一种基于时效近邻可信选取策略的协同过滤推荐方法[J]. 计算机科学, 2023, 50(S2): 518-528., articleTitle=一种基于时效近邻可信选取策略的协同过滤推荐方法, refAbstract=null), Reference(id=1245461215720357900, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=40, issue=2, pageStart=395, pageEnd=398, url=null, language=null, rfNumber=[2], rfOrder=1, authorNames=佘学兵, 熊蕾, 黄丽, journalName=计算机仿真, refType=null, unstructuredReference=佘学兵, 熊蕾, 黄丽, . 基于长短期记忆的稀疏数据过滤推荐算法[J]. 计算机仿真, 2023, 40(2): 395-398., articleTitle=基于长短期记忆的稀疏数据过滤推荐算法, refAbstract=null), Reference(id=1245461215909101591, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2024, volume=39, issue=3, pageStart=1048, pageEnd=1056, url=null, language=null, rfNumber=[3], rfOrder=2, authorNames=欧朝荣, 胡军, journalName=控制与决策, refType=null, unstructuredReference=欧朝荣, 胡军. 融合显隐式反馈的协同过滤推荐模型[J]. 控制与决策, 2024, 39(3): 1048-1056., articleTitle=融合显隐式反馈的协同过滤推荐模型, refAbstract=null), Reference(id=1245461216043319326, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2024, volume=19, issue=2, pageStart=299, pageEnd=306, url=null, language=null, rfNumber=[4], rfOrder=3, authorNames=史加荣, 何攀, journalName=智能系统学报, refType=null, unstructuredReference=史加荣, 何攀. 结合矩阵补全的宽度协同过滤推荐算法[J]. 智能系统学报, 2024, 19(2): 299-306., articleTitle=结合矩阵补全的宽度协同过滤推荐算法, refAbstract=null), Reference(id=1245461216311754793, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2024, volume=42, issue=3, pageStart=525, pageEnd=539, url=null, language=null, rfNumber=[5], rfOrder=4, authorNames=苏湛, 杨昊川, 艾均, journalName=应用科学学报, refType=null, unstructuredReference=苏湛, 杨昊川, 艾均. 基于模糊偏好标签向量的推荐算法[J]. 应用科学学报, 2024, 42(3): 525-539., articleTitle=基于模糊偏好标签向量的推荐算法, refAbstract=null), Reference(id=1245461216445972529, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=37, issue=11, pageStart=131, pageEnd=141, url=null, language=null, rfNumber=[6], rfOrder=5, authorNames=李驰, 游小钰, 张谧, journalName=中文信息学报, refType=null, unstructuredReference=李驰, 游小钰, 张谧. 基于解耦图卷积网络的协同过滤推荐模型[J]. 中文信息学报, 2023, 37(11): 131-141., articleTitle=基于解耦图卷积网络的协同过滤推荐模型, refAbstract=null), Reference(id=1245461216609550392, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=59, issue=5, pageStart=777, pageEnd=789, url=null, language=null, rfNumber=[7], rfOrder=6, authorNames=黄树添, 胡诗琳, 卜祥智, journalName=南京大学学报(自然科学), refType=null, unstructuredReference=黄树添, 胡诗琳, 卜祥智, . 融入用户风险偏好的三支协同过滤推荐模型[J]. 南京大学学报(自然科学), 2023, 59(5): 777-789., articleTitle=融入用户风险偏好的三支协同过滤推荐模型, refAbstract=null), Reference(id=1245461216794099781, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=44, issue=9, pageStart=2671, pageEnd=2678, url=null, language=null, rfNumber=[8], rfOrder=7, authorNames=张茂宇, 李海明, journalName=计算机工程与设计, refType=null, unstructuredReference=张茂宇, 李海明. 融合双重语义相似度的混合协同过滤推荐算法[J]. 计算机工程与设计, 2023, 44(9): 2671-2678., articleTitle=融合双重语义相似度的混合协同过滤推荐算法, refAbstract=null), Reference(id=1245461216945094733, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2024, volume=50, issue=5, pageStart=100, pageEnd=110, url=null, language=null, rfNumber=[9], rfOrder=8, authorNames=张宝鑫, 杨丹, 聂铁铮, journalName=计算机工程, refType=null, unstructuredReference=张宝鑫, 杨丹, 聂铁铮, . 基于自监督的多视角图协同过滤推荐方法[J]. 计算机工程, 2024, 50(5): 100-110., articleTitle=基于自监督的多视角图协同过滤推荐方法, refAbstract=null), Reference(id=1245461217083506773, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=43, issue=3, pageStart=90, pageEnd=95, url=null, language=null, rfNumber=[10], rfOrder=9, authorNames=向俊伟, 李玲娟, journalName=南京邮电大学学报(自然科学版), refType=null, unstructuredReference=向俊伟, 李玲娟. 融合PCA降维和均值漂移聚类的协同过滤推荐算法[J]. 南京邮电大学学报(自然科学版), 2023, 43(3): 90-95., articleTitle=融合PCA降维和均值漂移聚类的协同过滤推荐算法, refAbstract=null), Reference(id=1245461217242890336, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=42, issue=3, pageStart=354, pageEnd=361, url=null, language=null, rfNumber=[11], rfOrder=10, authorNames=杨本臣, 李依泽, journalName=辽宁工程技术大学学报(自然科学版), refType=null, unstructuredReference=杨本臣, 李依泽. 融合显隐式特征的深度协同过滤推荐算法[J]. 辽宁工程技术大学学报(自然科学版), 2023, 42(3): 354-361., articleTitle=融合显隐式特征的深度协同过滤推荐算法, refAbstract=null), Reference(id=1245461219755278436, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=42, issue=6, pageStart=137, pageEnd=140, url=null, language=null, rfNumber=[12], rfOrder=11, authorNames=成凌飞, 杨向峰, 陈天源, journalName=传感器与微系统, refType=null, unstructuredReference=成凌飞, 杨向峰, 陈天源, . 基于增强注意力机制的三通道神经协同过滤改进算法[J]. 传感器与微系统, 2023, 42(6): 137-140., articleTitle=基于增强注意力机制的三通道神经协同过滤改进算法, refAbstract=null), Reference(id=1245461219897884778, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=40, issue=5, pageStart=279, pageEnd=287, url=null, language=null, rfNumber=[13], rfOrder=12, authorNames=景楠, 周正茜, 袁戟, journalName=计算机应用与软件, refType=null, unstructuredReference=景楠, 周正茜, 袁戟. 基于宽度学习和协同过滤的在线信息推荐算法[J]. 计算机应用与软件, 2023, 40(5): 279-287., articleTitle=基于宽度学习和协同过滤的在线信息推荐算法, refAbstract=null), Reference(id=1245461220019519597, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2023, volume=55, issue=4, pageStart=1, pageEnd=7, url=null, language=null, rfNumber=[14], rfOrder=13, authorNames=张建华, 郭启迪, 曹子傲, journalName=郑州大学学报(理学版), refType=null, unstructuredReference=张建华, 郭启迪, 曹子傲, . 基于匹配度和谱聚类的知识推荐研究[J]. 郑州大学学报(理学版), 2023, 55(4): 1-7., articleTitle=基于匹配度和谱聚类的知识推荐研究, refAbstract=null), Reference(id=1245461220132765812, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, doi=null, pmid=null, pmcid=null, year=2022, volume=46, issue=6, pageStart=642, pageEnd=648, url=null, language=null, rfNumber=[15], rfOrder=14, authorNames=邓泓, 吴祎, 于程远, journalName=江西师范大学学报(自然科学版), refType=null, unstructuredReference=邓泓, 吴祎, 于程远, . 基于可信预测值的协同过滤推荐算法[J]. 江西师范大学学报(自然科学版), 2022, 46(6): 642-648., articleTitle=基于可信预测值的协同过滤推荐算法, refAbstract=null)], funds=[Fund(id=1245461214990549985, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, awardId=JAT210399, language=CN, fundingSource=福建省中青年教师教育科研项目(科技类)(JAT210399), fundOrder=null, country=null), Fund(id=1245461215162516464, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, awardId=JAT241369, language=CN, fundingSource=福建省中青年教师教育科研项目(科技类)(JAT241369), fundOrder=null, country=null)], companyList=[AuthorCompany(id=1245461206891348549, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, xref=1, ext=[AuthorCompanyExt(id=1245461206908125769, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461206891348549, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=1 School of Information Engineering, Putian University, Putian 351100, Fujian, China), AuthorCompanyExt(id=1245461206933291599, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461206891348549, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=1 莆田学院信息工程学院, 福建 莆田 351100)]), AuthorCompany(id=1245461208095113819, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, xref=2, ext=[AuthorCompanyExt(id=1245461208116085341, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461208095113819, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=2 Meizhouwan Vocational Technology College, Putian 351119, Fujian, China), AuthorCompanyExt(id=1245461208124473951, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, companyId=1245461208095113819, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=2 湄洲湾职业技术学院, 福建 莆田 351119)])], figs=[ArticleFig(id=1245461211412808569, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, label=null, caption=null, figureFileSmall=hmc1pnJTAqUAfWRh+EbJLA==, figureFileBig=jQR7+lxU1ziHFZmag2+XsA==, tableContent=null), ArticleFig(id=1245461211513471871, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, label=图1, caption=不同推荐方法下的NDCG值对比结果, figureFileSmall=hmc1pnJTAqUAfWRh+EbJLA==, figureFileBig=jQR7+lxU1ziHFZmag2+XsA==, tableContent=null), ArticleFig(id=1245461211618329481, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, label=null, caption=null, figureFileSmall=IiwXP3LTrGPy5I/3Q4VuxA==, figureFileBig=pNO/04zp1o2Vr1KRLTvfbg==, tableContent=null), ArticleFig(id=1245461211710604178, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, label=图2, caption=不同方法的MAE值对比结果, figureFileSmall=IiwXP3LTrGPy5I/3Q4VuxA==, figureFileBig=pNO/04zp1o2Vr1KRLTvfbg==, tableContent=null), ArticleFig(id=1245461211857404828, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, label=null, caption=null, figureFileSmall=dNWQebFayrU+phuHDsOLAA==, figureFileBig=ymANX66NcbDpCoFutT5i8A==, tableContent=null), ArticleFig(id=1245461212029371303, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, label=图3, caption=不同方法的RMSE值对比结果, figureFileSmall=dNWQebFayrU+phuHDsOLAA==, figureFileBig=ymANX66NcbDpCoFutT5i8A==, tableContent=null), ArticleFig(id=1245461212142617518, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
用户
ID
商品
ID
评论时
间戳
评论内容 评分
1 234 1626883200 我很喜欢这款手机的外观设计,屏幕也很清晰,但电池续航有待提高 4
1 567 1626897600 买了这本书很久了,内容很实用,但有些地方读起来有些吃力 3
2 123 1626984000 这是我第二次购买这个品牌的运动鞋,质量一如既往的好,强烈推荐 5
3 456 1626811200 这件衣服的材质很好,穿着很舒适,而且价格也很实惠 4
5 321 1626710400 这款耳机的音质很棒,但佩戴时间长了耳朵会有些不舒服 4
), ArticleFig(id=1245461212360721344, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, label=表1, caption=

用户商品评论数据集部分数据

, figureFileSmall=null, figureFileBig=null, tableContent=
用户
ID
商品
ID
评论时
间戳
评论内容 评分
1 234 1626883200 我很喜欢这款手机的外观设计,屏幕也很清晰,但电池续航有待提高 4
1 567 1626897600 买了这本书很久了,内容很实用,但有些地方读起来有些吃力 3
2 123 1626984000 这是我第二次购买这个品牌的运动鞋,质量一如既往的好,强烈推荐 5
3 456 1626811200 这件衣服的材质很好,穿着很舒适,而且价格也很实惠 4
5 321 1626710400 这款耳机的音质很棒,但佩戴时间长了耳朵会有些不舒服 4
), ArticleFig(id=1245461212532687815, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
用户ID 商品ID/推荐列表 预测评分 实际评分
User1 [005, 010, 115] 4.2 [5.0, 4.0, 3.5]
User2 [003, 047, 089] 3.8 [4.5, 3.0, 4.2]
User3 [002, 082, 018] 4.5 [5.0, 4.8, 4.0]
User4 [001, 056, 511] 3.5 [3.0, 3.5, 4.0]
User5 [008, 213, 319] 4.0 [4.5, 3.8, 4.2]
User6 [004, 014, 020] 4.3 [4.5, 4.0, 4.5]
User7 [002, 005, 517] 4.7 [5.0, 4.5, 4.0]
User8 [001, 029, 016] 3.2 [3.0, 3.5, 3.0]
User9 [027, 511, 215] 4.1 [4.5, 4.0, 3.5]
), ArticleFig(id=1245461212717237198, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1153992896337400555, language=CN, label=表2, caption=

所提方法下的商品推荐列表及预测评分

, figureFileSmall=null, figureFileBig=null, tableContent=
用户ID 商品ID/推荐列表 预测评分 实际评分
User1 [005, 010, 115] 4.2 [5.0, 4.0, 3.5]
User2 [003, 047, 089] 3.8 [4.5, 3.0, 4.2]
User3 [002, 082, 018] 4.5 [5.0, 4.8, 4.0]
User4 [001, 056, 511] 3.5 [3.0, 3.5, 4.0]
User5 [008, 213, 319] 4.0 [4.5, 3.8, 4.2]
User6 [004, 014, 020] 4.3 [4.5, 4.0, 4.5]
User7 [002, 005, 517] 4.7 [5.0, 4.5, 4.0]
User8 [001, 029, 016] 3.2 [3.0, 3.5, 3.0]
User9 [027, 511, 215] 4.1 [4.5, 4.0, 3.5]
)], attaches=null, journal=Journal(id=1146119232468656133, delFlag=0, nameCn=科技和产业, nameEn=Science Technology and Industry, nameHistory1=null, nameHistory2=null, issn=1671-1807, eissn=, cn=11-4671/T, coden=null, periodic=3, language=CN, oaType=是, ccby=null, superviseOffice=null, ownerOffice=null, pubOffice=null, editorOffice=null, officeType=null, aims=null, clcCode=null, officeProv=null, officeCity=null, officeAddr=null, officeZip=null, officeEmail=null, officePhone=null, editDirector=null, officeDirector=null, officeDirectorPhone=null, officeStaffNum=null, officeEmpNum=null, coverPicUrl=65omA9nasEwsJtKyya4q2A==, journalPrice=null, startedYear=null, abbrevIsoEn=Sci Technol Ind, journalRemark=null, publicationField=null, createdTime=null, updatedTime=1755589264235, createdBy=null, updatedBy=15831073675, firstLetterCn=S, firstLetterEn=S, subjectCode=Engineering, subjectName=工程, subjectCodeEn=Engineering, subjectNameEn=null, picCn=65omA9nasEwsJtKyya4q2A==, picEn=/wwFtLNQXxKpecNSjAf1AQ==, jcr=null, cjcr=null, exts=[JournalExt(id=1164589040427811221, language=CN, name=科技和产业, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264256, updatedTime=1755589264256, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=http://www.kjhcy.org/kjycy/site/menu/20110121105642001, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""}), JournalExt(id=1164589040473948566, language=EN, name=Science Technology and Industry, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264267, updatedTime=1755589264267, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""})], databaseList=null, tenantJournalId=1146123222451335185, websiteList=[Website(id=1148243202395595182, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/CN, language=CN, createTime=1751692112778, createBy=18614031015, updateTime=1753522130587, updateBy=18614031015, name=科技和产业-中文站点, tplId=1146099689490845704, title=科技和产业, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919343281103033, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=articleTextType, value=kx, createTime=1753522247381, updateTime=1753522247381, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343260131510, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=banner, value=null, createTime=1753522247376, updateTime=1753522247376, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343251742901, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522247374, updateTime=1753522247374, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343272714424, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522247379, updateTime=1753522247379, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343268520119, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522247378, updateTime=1753522247378, creator=18614031015, updator=18614031015)]), Website(id=1155919131955314719, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/EN, language=EN, createTime=1753522197002, createBy=18614031015, updateTime=1753522207756, updateBy=18614031015, name=科技和产业-英文站点, tplId=1146101810881728533, title=Science Technology and Industry, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919498877194448, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=articleTextType, value=kx, createTime=1753522284478, updateTime=1753522284478, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498860417229, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=banner, value=null, createTime=1753522284474, updateTime=1753522284474, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498852028620, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522284472, updateTime=1753522284472, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498873000143, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522284477, updateTime=1753522284477, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498864611534, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522284476, updateTime=1753522284476, creator=18614031015, updator=18614031015)])], journalTitle=科技和产业, weixinUrl=null, journalUrl=null, iacademicId=null, status=0, seqNo=null, journalTitleEn=Science Technology and Industry, journalPhotoCn=65omA9nasEwsJtKyya4q2A==, journalPhotoEn=/wwFtLNQXxKpecNSjAf1AQ==, journalFirstLetter=S, journalRecommend=null, journalNew=null, journalCollection=null, jcrJf=null, cjcrJf=null, jcrJfStr=null, cjcrJfStr=null, submissionFirstDecision=null, sciSubjectClassification=null, casSubjectClassification=null, citeScore=null, totalCitationFrequency=null, icpCode=null, psCode=null, advertisingLicenseCode=null, copyrightInformation=null, country=null, option=, provinceCode=null, provinceName=null, collectFlag=false), detailUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/Y2025/V25/I6/30, detailUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/Y2025/V25/I6/30, pdfUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/PDF/Y2025/V25/I6/30, pdfUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/PDF/Y2025/V25/I6/30, aliStartDate=null, aliEndDate=null, collectionFlag=false, citedCount=null, citedUrl=null, reference=null)
收藏切换
基于知识图谱的稀疏数据协同过滤推荐算法
收藏切换
PDF下载
许雪晶 1 , 林辰玮 2
科技和产业 | 科技创新 2025,25(6): 30-35
收起
收藏切换
科技和产业 | 科技创新 2025, 25(6): 30-35
基于知识图谱的稀疏数据协同过滤推荐算法
全屏
许雪晶1, 林辰玮2
作者信息
  • 1 莆田学院信息工程学院, 福建 莆田 351100
  • 2 湄洲湾职业技术学院, 福建 莆田 351119
  • 许雪晶(1988—),女,福建莆田人,硕士,讲师,研究方向为数据挖掘研究;

    林辰玮(1988—),男,福建莆田人,硕士,助理研究员,研究方向为信息化建设、大数据等。

Collaborative Filtering Recommendation Algorithm Based on Knowledge Graph for Sparse Data
Xuejing XU1, Chenwei LIN2
Affiliations
  • 1 School of Information Engineering, Putian University, Putian 351100, Fujian, China
  • 2 Meizhouwan Vocational Technology College, Putian 351119, Fujian, China
出版时间: 2025-03-25
文章导航
收藏切换

因缺乏足够的交互关系支撑导致推荐精度不佳,对此,提出基于知识图谱的稀疏数据协同过滤推荐算法。抽取用户与物品的交互关系,构建知识图谱,利用知识图谱中的实体关系对用户和物品进行扩展表示。结合卷积神经网络(CNN)将交互关系扩为复杂结构,捕获上下文信息,以欧氏距离算相似度。找到目标用户相似邻居集,用用户协同过滤预测评分,融合时间加权策略动态调整,生成推荐列表。测试表明,该算法归一化折损累计增益(NDCG)值高,平均绝对误差(MAE)和均方根误差(RMSE)低,推荐效果较理想。

知识图谱  /  稀疏数据  /  推荐算法  /  相似度  /  CNN网络  /  推荐精度

Due to the lack of sufficient interaction support, the recommendation accuracy is poor. To address this, a sparse data collaborative filtering recommendation algorithm based on knowledge graph was proposed. Extract the interaction relationship between users and items, a knowledge graph was constructed, and the entity relationships in the knowledge graph was used to extend the representation of users and items. Combining CNN networks, interactive relationships was expanded into complex structures, contextual information was captured, and similarity using Euclidean distance was calculate. A set of similar neighbors was found for the target user, user collaboration filtering was used to predict ratings, the fusion time weighting strategy was dynamically adjusted, and a recommendation list was generated. Tests have shown that the algorithm has high NDCG values, low MAE and RMSE values, and ideal recommendation performance.

knowledge graph  /  sparse data  /  recommendation algorithm  /  similarity  /  CNN  /  recommendation accuracy
许雪晶, 林辰玮. 基于知识图谱的稀疏数据协同过滤推荐算法. 科技和产业, 2025 , 25 (6) : 30 -35 .
Xuejing XU, Chenwei LIN. Collaborative Filtering Recommendation Algorithm Based on Knowledge Graph for Sparse Data[J]. Science Technology and Industry, 2025 , 25 (6) : 30 -35 .
用户在享受丰富网络资源的同时,也面临着“信息过载”的困扰。如何帮助用户在海量数据中迅速找到符合自己兴趣的信息,成为当前信息科学领域研究的热点。推荐系统作为解决这一问题的有效工具,已广泛应用于电子商务、社交媒体、视频流媒体等多个领域。然而,传统的推荐算法,如基于内容的推荐和基于行为的推荐,在面对数据稀疏性和冷启动问题时,往往表现不佳。因此,探索新的推荐算法,以提高推荐系统的准确性和效率,具有重要的研究意义和实践价值。
近年来,国内外学者已经从多种不同的角度对推荐算法进行了优化研究。例如,韩志耕等[1]通过时间窗口机制筛选用户近期的行为数据,然后基于用户-项目评分矩阵计算用户之间的相似度,并引入近邻可信度因子来评估近邻用户的可靠性。在推荐过程中,选择可信度高的近邻用户进行预测评分,进而生成推荐列表。但由于数据稀疏性,相似度计算的准确性受到限制,可能导致部分用户无法得到有效的推荐。此外,时效性的引入也增加了算法对数据更新的敏感性,需要频繁更新数据以保持推荐的时效性。佘学兵等[2]通过相关因子计算数据相似性,利用云模型补全数据缺失项,在上述数据处理的基础上,通过长短期记忆网络构建稀疏数据过滤推荐模型,基于该模型实现数据过滤推荐。该方法能够有效处理数据缺失问题,提高数据过滤推荐的全面性,但是相关因子的选择可能存在局限性,如果选择不当可能导致相似性计算的偏差,影响整个数据处理流程的准确性,进而影响推荐结果的准确性。欧朝荣和胡军[3]不仅考虑了用户的显式评分数据,还充分利用了用户的隐式反馈(如点击、浏览等行为),以更全面地捕捉用户的兴趣偏好。通过显隐式反馈的融合,算法能够更准确地计算用户之间的相似度,并为用户推荐更符合其兴趣的物品。但由于隐式反馈的获取和处理相对复杂,且存在较大的噪声干扰,可能导致推荐的精度受到一定影响。史加荣和何攀[4]利用矩阵补全技术对用户-物品评分矩阵进行填充,以缓解数据稀疏性问题。然后采用宽度学习模型对用户和物品进行特征提取和表示,以更深入地挖掘用户和物品之间的潜在关系。但矩阵补全技术的准确性受到多种因素的影响,如补全算法的选择、补全数据的来源等,若这些因素处理不当,可能导致补全后的矩阵存在误差,进而影响推荐的精度。
针对现有问题,本文提出了一种基于知识图谱的稀疏数据协同过滤推荐算法,通过将知识图谱的丰富知识结构和关系信息与传统的协同过滤推荐算法相结合,不仅克服了传统协同过滤算法在处理稀疏数据时的局限性,也有效提升了推荐结果的准确性和个性化程度。这种结合不仅丰富了推荐系统的数据源,也增强了推荐系统的解释性和可理解性,使得推荐结果更加符合用户的实际需求。
利用知识图谱技术,将图谱中的实体和关系嵌入到低维向量空间中,得到每个实体和关系的向量表示,实现用户和物品的扩展表示。利用知识图谱技术将图谱中的实体和关系嵌入低维向量空间,能够有效扩展用户和物品的表示,通过捕捉实体间的语义关系和上下文信息,增强对用户和物品特征的理解,从而在数据稀疏的情况下提高推荐算法的准确性和鲁棒性。
首先从电子商务网站的购买记录、用户评分系统以及用户浏览历史等多个渠道,对用户的行为数据进行收集。以此可以结合用户的购买行为或商品评价行为,对用户与物品的交互关系进行抽取,这些关系可以表示为<用户,交互关系,物品>形式的三元组。通过上述方式可以构建出一个标注数据集$D=\left\{\right({t}_{1},{e}_{1},{r}_{1}),({t}_{2},{e}_{2},{r}_{2}),\dots,({t}_{n},{e}_{n},{r}_{n}\left)\right\},$其中,ti为用户评价文本,ei为文本中的实体集合,ri为实体之间的关系集合[5]。在完成用户-物品关系抽取后,通过对实体以及关系进行整合,可以构建知识图谱。假设知识图谱中的三元组集合为T,则整合过程可以表示为
$T=f(E,R)$
式中:f(·)为整合函数;E为知识图谱中的实体集合;R为知识图谱中的关系集合。将构建的知识图谱与上文抽取得到的<用户,交互关系,物品>进行关联,可以得到关于用户和物品的学习表示。对于用户,除了考虑其与物品的交互关系,还需要结合知识图谱中的相关信息进行扩展表示[6]。考虑用户购买的物品所属的品牌、类别等,以及这些品牌、类别之间的关系,由此得到的用户u的扩展表示为
$User\left(u\right)={\sum }_{i\in I\left(u\right)}^{}Item\left(i\right)+{\sum }_{b\in B\left(u\right)}^{}Brand\left(b\right)+{\sum }_{c\in C\left(u\right)}^{}Category\left(c\right)$
式中:I(u)为用户u购买或交互过的物品集合;B(u)C(u)分别为用户u购买或交互过的物品所属品牌和类别集合;Item(i)为物品i的扩展表示;Brand(b)Category(c)分别为品牌b和类别c的扩展表示[7]。同理,对于物品,除了考虑其与用户的交互关系,还需要结合知识图谱中的相关实体和关系进行扩展表示。物品i的扩展表示为
$Item\left(i\right)=E\left(i\right)+{\sum }_{a\in A\left(u\right)}^{}Attribute\left(a\right){\sum }_{b\in B\left(u\right)}^{}Brand\left(b\right)+{\sum }_{c\in C\left(u\right)}^{}Category\left(c\right)$
式中:E(i)为物品i在知识图谱中的嵌入向量;A(u)为物品的属性集合,Attribute(a)为属性a的扩展表示。
通过上述步骤即可完成对于用户和物品的扩展表示处理,具体通过从用户的行为数据中抽取出用户与物品的交互关系,并对知识图谱进行构建,然后利用知识图谱中的实体关系对用户和物品进行扩展表示。
考虑到在稀疏数据的情况下,直接计算用户-用户或物品-物品的相似度可能会受到数据稀疏性的影响,因此为实现协同过滤推荐效果,在得到用户和物品的嵌入向量后,采用卷积神经网络(convolutional neural network,CNN)来捕获嵌入向量的上下文信息,并使用这些上下文嵌入向量,对用户-用户与物品-物品之间的相似度进行计算[8]。CNN能够有效地利用图结构中的节点关系,通过信息聚合和传递机制,增强节点(即用户和物品)的嵌入表示,从而更全面地反映其上下文特征。这种方法克服了传统方法在处理稀疏数据时的不足,能够更准确地计算用户-用户与物品-物品之间的相似度,进而提升协同过滤推荐的精度和效果。
首先,将用户-物品交互数据构建成一个图G=(V,E)。在这个图中,用户和物品这两个实体可以作为节点,而用户与物品的交互关系,如购买行为或评价行为则可以作为边,其中,V和E分别为节点集合和边集合。然后采用随机生成的方式,为每个节点(用户和物品)初始化一个嵌入向量,然后通过在图上传播节点信息来更新节点嵌入[9]。在每一层CNN中,节点都会聚合其邻居节点的信息,并据此更新自己的嵌入。假设实体节点集合为N(v),则每一层的更新表达式为
${h}_{v}^{l+1}=\sigma \left({\sum }_{u\in N\left(v\right)}^{}\frac{1}{\sqrt{\left|N\left(v\right)\right|}\sqrt{\left|N\left(u\right)\right|}}{W}^{l}{h}_{v}^{l}+{b}^{l}\right)$
式中:${h}_{v}^{l}$为在第l层网络结构中实体节点的嵌入;N(u)为实体节点的邻居节点集合;Wlbl分别为该层对应的权值矩阵和偏置项;σ为激活函数[10]。采用上述更新方式,可以实现多层CNN传播,每个节点都会得到一个融合其邻居节点信息的嵌入向量,这个嵌入向量可以视为该节点的上下文嵌入。上下文嵌入不仅包含节点自身的信息,还包含与之相连的其他节点(如历史交互、社交关系等)的信息[11]。基于上述提取得到的上下文嵌入,结合欧几里得距离对用户-用户和物品-物品的相似度进行计算,具体计算公式为
$sim(u,v)=\sqrt{\sum _{i=1}^{d}({u}_{i}-{v}_{i}{)}^{2}}$
式中:d为嵌入向量的维度;uivi分别为用户u和用户v的分量;sim(u,v)为两个用户之间的相似度。
通过上述步骤即可完成对于用户及物品的相似度计算。通过结合卷积神经网络(CNN)对用户和物品的嵌入向量的上下文信息进行捕获,并结合欧几里得距离,对用户-用户和物品-物品的相似度进行计算。CNN可以将用户和物品的交互关系扩展为一个更复杂的网络结构,从而有效规避数据稀疏性带来的协同推荐精度不佳的问题。
在完成相似度计算后,选择基于用户进行协同过滤,从而得到预测评分,对未评价的物品进行排序,从而生成推荐列表,实现稀疏数据协同过滤推荐,这样能够充分利用用户间的相似性来填补评分数据的空白,提高推荐的针对性和准确性,同时在数据稀疏的情况下依然能够为用户提供个性化的推荐服务。
由于在稀疏数据环境中,许多用户-物品的评分存在缺失情况,因此为缓解这个问题,结合均值填充的方式,对稀疏数据进行处理[12]。在评分数据缺失严重的情况下,直接计算相似度或进行推荐可能导致结果偏差较大。均值填充通过用已有评分的平均值来填补缺失值,能够在一定程度上平滑数据分布,减少极端值的影响,从而提高后续相似度计算和推荐算法的稳定性与准确性。稀疏数据均值$\stackrel{-}{r}$填充表达式为
$\stackrel{-}{r}=\frac{{\sum }_{u,i\in {N}_{r}}^{}{r}_{ui}}{\left|{N}_{r}\right|}$
式中:Nr为所有已知的用户评分集合;$\left|{N}_{r}\right|$为已知评分数量;rui为用户u对物品i的评分。对于目标用户u和未评价物品i,通过找到与用户u最相似的K个用户邻居,然后利用这些邻居对物品i的评分对用户u对物品i的评分进行预测,从而实现基于用户的协同过滤,预测评分r' ui的计算公式为
$r\text{'}{ }_{ui}=\frac{{\sum }_{u\in N\left(u\right)}^{}sim(u,v)·{r}_{vi}}{{\sum }_{u\in N\left(u\right)}^{}\left|sim(u,v)\right|}$
式中:rvi为用户v对物品i的评分。考虑到用户兴趣以及物品流行度可能会随着时间变化,因此选择引入时间加权策略,来对预测评分进行动态调整[13]。假设tcurrent为当前时间;tui为用户u对物品i给出评分的时间,则时间间隔为Δtui=tcurrent-tui,由此对时间衰减函数f(Δtui)进行定义,具体表达式为
$f\left(\Delta \right.{t}_{ui})={e}^{-{\alpha }_{ui}\Delta {t}_{ui}}$
式中:αui为衰减因子,用于控制衰减速度,当衰减因子αui较大时,评分随时间的衰减速度更快。结合上述构建的时间衰减函数,对式(7)进行优化,由此可以得到融合时间加权策略的预测评分表达式为
$r\text{'}{ }_{ui}=\frac{{\sum }_{u\in N\left(u\right)}^{}sim(u,v)·f\left(\Delta \right.{t}_{ui})·{r}_{vi}}{{\sum }_{u\in N\left(u\right)}^{}\left|sim(u,v)\right|·f\left(\Delta \right.{t}_{ui})}$
通过上述步骤即可完成稀疏数据协同过滤推荐。首先结合均值填充法,对数据稀疏性进行缓解。然后通过找到与目标用户最相似的用户邻居集合,结合用户协同过滤对用户评分进行预测[14]。最后融合时间加权策略,对预测评分进行动态调整,并生成对应的推荐列表。至此,基于知识图谱的稀疏数据协同过滤推荐算法设计完成[15]
为了证明提出的基于知识图谱的稀疏数据协同过滤推荐算法在实际推荐效果方面优于常规的协同过滤推荐算法,在完成算法方面的设计后,通过构建实验对比环节,对所提方法的实际推荐效果进行检验。
为验证所提的基于知识图谱的稀疏数据协同过滤推荐算法在实际推荐效果方面的优越性,实验选取两组常规的协同过滤推荐算法作为对比对象,分别为基于显隐式反馈的协同过滤推荐算法(常规方法A),以及基于矩阵补全的协同过滤推荐算法(常规方法B)。通过构建实验平台,采用三种方法对同一组稀疏数据进行模拟推荐,对比不同方法的实际推荐效果。
实验所构建的用户商品评论数据集共包括两个部分,即用户评论信息和用户/商品属性信息。首先使用随机数生成器为每个用户分配一个唯一的ID(范围1~10000),并使用另一个随机数生成器为每个商品分配一个唯一的ID(范围1~50000)。对于每个用户,根据其兴趣分布选择一定数量的商品进行评论。对于每个选定的商品,基于当前时间减去一个随机时间间隔,生成一个评论时间戳,然后分别基于商品属性以及用户评分分布,生成评论内容以及具体评分分值。由于用户通常不会对所有的商品进行评论,因此为保证数据集的稀疏性,实验所生成的评论总数为800 000条,远低于用户数×商品数。用户商品评论数据集中部分数据,如表1所示。
针对上述构建出的数据集,将评论内容转化为适合知识图谱构建的形式。将用户实体选为评论数据中的用户ID,并将商品实体选为商品ID,并直接建立用户与商品之间的交互关系。同时,在将实体和关系添加到知识图谱之前,进行唯一性检查。通过结合数据库的唯一性约束,来确保不会添加重复的实体。如果发现在不同评论中提到了相同但表达方式略有不同的实体(如同义词、缩写等),则需要进行实体合并,以确保它们在知识图谱中只有一个表示。
实验选取了9位用户作为推荐对象,分别基于这些用户的评论数据,采用不同的方法对其生成推荐列表。在采用所提方法进行模拟协同过滤推荐时,设定CNN网络层数为2层,节点嵌入维度为64,批量大小为32,设定衰减因子αui为0.08。待实验完成后,对不同方法的推荐结果进行记录,从而实现实验对比。
所提方法所得到的商品ID推荐列表以及用户对于商品的预测评分,如表2所示。
通过表2实验结果可以看出,提出的推荐算法能够有效根据用户的评论数据,对用户的评分进行预测,从而生成对应的商品推荐列表,同时预测评分在实际评分区间之内。这是因为所提方法通过将用户和物品的交互关系在知识图谱中扩展为复杂的网络结构,并利用CNN对这些复杂关系进行建模,能够更深入地捕捉用户和物品嵌入向量的上下文信息。这种处理方式相比传统方法更能理解用户偏好和物品特征之间的复杂关系,提高了推荐的准确性。
为对不同方法的实际推荐精度进行对比分析,实验以不同推荐结果的归一化折损累计增益(normalized discounted cumulative gain,NDCG)作为对比指标,该值可以反映算法对结果的排序性能。实验考虑了不同用户群体的影响,由此得到的不同活跃度的用户群体对应的NDCG值对比结果,如图1所示。
通过上述实验结果可以看出,NDCG值可能会受到用户活跃度的影响更大。对于活跃度较低的用户,由于缺乏足够的用户行为数据,算法可能难以准确地捕捉其兴趣,导致NDCG值较低。通过对比NDCG值变化情况可以明显看出,所提出的基于知识图谱的稀疏数据协同过滤推荐算法在实际推荐精度方面明显优于两种常规的推荐算法,基于显隐式反馈的协同过滤推荐算法在处理稀疏数据时,其局限性明显,由于显隐式反馈数据本身可能就不丰富,在数据稀疏情况下难以准确找到足够相似的用户或物品,导致推荐准确性下降。基于矩阵补全的协同过滤推荐算法在实际应用中,其对数据结构的假设可能与实际情况不符,如果数据不满足低秩假设,补全的效果就会大打折扣,而且在处理高度稀疏的数据时,由于可利用的已知元素过少,也很难准确补全矩阵,从而影响推荐的质量。而所提方法在预测用户评分时,不仅基于找到的最相似用户邻居集合进行协同过滤,还融入了时间加权策略。充分考虑到了用户兴趣随时间变化的可能性,通过动态调整评分预测,使得推荐结果更加符合用户的当前需求和偏好,增强了推荐结果的个性化程度。
为了进一步验证所提方法的推荐效果,选取平均绝对误差(mean absolute error,MAE)和均方根误差(root mean square error, RMSE)作为实验指标,MAE通过计算预测评分与实际评分之间的差的绝对值来衡量推荐方法的精度。在稀疏数据场景下,MAE能够直观地反映算法对用户偏好的预测准确性。RMSE对预测误差进行了平方处理,因此它对较大的误差更为敏感。在稀疏数据下,RMSE能够揭示算法在预测极端偏好或极端评分时的稳定性。二者的计算公式为
$MAE=\frac{1}{N}\sum _{i=1}^{N}\left|{p}_{i}-{q}_{i}\right|$
$RMSE=\sqrt{\frac{1}{N}\sum _{i=1}^{N}({p}_{i}-{q}_{i}{)}^{2}}$
式中:pi为预测评分;qi为实际评分。
通过式(10)和式(11)计算所提方法、常规方法A和常规方法B的MAE和RMSE,如图2图3所示。
图2图3可知,所提方法的MAE始终低于0.5,RMSE始终低于0.4,且明显低于基于显隐式反馈的协同过滤推荐算法和基于矩阵补全的协同过滤推荐算法,说明所提方法的推荐结果精度更高。常规推荐算法在面临数据稀疏性问题时,推荐精度常受影响。而所提方法创新性地引入了知识图谱技术,通过构建用户与物品之间的复杂关系网络,有效缓解了数据稀疏性问题。知识图谱不仅包含了直接的用户-物品交互信息,还蕴含了丰富的实体关系,为推荐算法提供了额外的上下文信息,从而提高了推荐结果精度。
综上所述,提出的基于知识图谱的稀疏数据协同过滤推荐算法,通过深入挖掘用户与物品的复杂交互关系,并利用知识图谱的丰富语义和结构化特性,有效缓解了数据稀疏性问题,显著提升了推荐系统的精度和性能。实验结果表明,采用该方法进行商品推荐时,能够显著提高NDCG值,这直接反映了推荐结果与用户实际需求的匹配程度较高,证明了该方法在提升推荐精度和效果方面的有效性。同时该方法在降低预测误差(MAE和RMSE较低)方面也展现显著优势,说明其有效提高了推荐的准确性。这不仅验证了算法的有效性,也为未来在更复杂、更稀疏的数据环境下实现高质量推荐提供了新思路。随着知识图谱技术和深度学习方法的不断进步,相信该方法将在实际应用中展现更加广阔的前景,为用户带来更加个性化、精准的推荐体验。未来的研究重点将聚焦于如何更有效地利用辅助信息与深度学习技术相结合,以更精确地建模用户与物品之间的复杂关系,从而进一步提升在稀疏数据环境下的推荐效果与用户体验。
  • 福建省中青年教师教育科研项目(科技类)(JAT210399)
  • 福建省中青年教师教育科研项目(科技类)(JAT241369)
参考文献 引证文献
排序方式:
[1]
韩志耕, 范远哲, 陈耿, . 一种基于时效近邻可信选取策略的协同过滤推荐方法[J]. 计算机科学, 2023, 50(S2): 518-528.
[2]
佘学兵, 熊蕾, 黄丽, . 基于长短期记忆的稀疏数据过滤推荐算法[J]. 计算机仿真, 2023, 40(2): 395-398.
[3]
欧朝荣, 胡军. 融合显隐式反馈的协同过滤推荐模型[J]. 控制与决策, 2024, 39(3): 1048-1056.
[4]
史加荣, 何攀. 结合矩阵补全的宽度协同过滤推荐算法[J]. 智能系统学报, 2024, 19(2): 299-306.
[5]
苏湛, 杨昊川, 艾均. 基于模糊偏好标签向量的推荐算法[J]. 应用科学学报, 2024, 42(3): 525-539.
[6]
李驰, 游小钰, 张谧. 基于解耦图卷积网络的协同过滤推荐模型[J]. 中文信息学报, 2023, 37(11): 131-141.
[7]
黄树添, 胡诗琳, 卜祥智, . 融入用户风险偏好的三支协同过滤推荐模型[J]. 南京大学学报(自然科学), 2023, 59(5): 777-789.
[8]
张茂宇, 李海明. 融合双重语义相似度的混合协同过滤推荐算法[J]. 计算机工程与设计, 2023, 44(9): 2671-2678.
[9]
张宝鑫, 杨丹, 聂铁铮, . 基于自监督的多视角图协同过滤推荐方法[J]. 计算机工程, 2024, 50(5): 100-110.
[10]
向俊伟, 李玲娟. 融合PCA降维和均值漂移聚类的协同过滤推荐算法[J]. 南京邮电大学学报(自然科学版), 2023, 43(3): 90-95.
[11]
杨本臣, 李依泽. 融合显隐式特征的深度协同过滤推荐算法[J]. 辽宁工程技术大学学报(自然科学版), 2023, 42(3): 354-361.
[12]
成凌飞, 杨向峰, 陈天源, . 基于增强注意力机制的三通道神经协同过滤改进算法[J]. 传感器与微系统, 2023, 42(6): 137-140.
[13]
景楠, 周正茜, 袁戟. 基于宽度学习和协同过滤的在线信息推荐算法[J]. 计算机应用与软件, 2023, 40(5): 279-287.
[14]
张建华, 郭启迪, 曹子傲, . 基于匹配度和谱聚类的知识推荐研究[J]. 郑州大学学报(理学版), 2023, 55(4): 1-7.
[15]
邓泓, 吴祎, 于程远, . 基于可信预测值的协同过滤推荐算法[J]. 江西师范大学学报(自然科学版), 2022, 46(6): 642-648.
2025年第25卷第6期
PDF下载
244
119
引用本文
BibTeX
文章信息
  • 接收时间:2024-09-23
  • 首发时间:2025-07-21
  • 出版时间:2025-03-25
补充材料
相关文章
文章信息
作者
出版历史
  • 收稿日期:2024-09-23
基金
福建省中青年教师教育科研项目(科技类)(JAT210399)
福建省中青年教师教育科研项目(科技类)(JAT241369)
作者信息
    1 莆田学院信息工程学院, 福建 莆田 351100
    2 湄洲湾职业技术学院, 福建 莆田 351119
参考文献
分享链接
https://castjournals.cast.org.cn/joweb/kjhcy/CN/1153992896337400555
分享至
全文二维码

扫描看全文

引用本文
BibTeX
本文的引用情况
2种不同金属材料的力学参数

Family
属数
Number of
genus
种数
Number of
species
占总种数比例
Percentage of
total species (%)

Genus
种数
Number of
species
占总种数比例
Percentage of total
species (%)
鹅膏菌科Amanitaceae 2 11 5.26 鹅膏菌属 Amanita 10 4.78
小菇科 Mycenaceae 2 12 5.74 丝盖伞属 Inocybe 5 2.39
多孔菌科 Polyporaceae 8 14 6.70 蜡蘑属 Laccaria 5 2.39
红菇科 Russulaceae 3 23 11.00 小皮伞属 Marasmius 6 2.87
小菇属 Mycena 11 5.26
光柄菇属 Pluteus 5 2.39
红菇属 Russula 17 8.13
栓菌属 Trametes 5 2.39
关闭全屏