Article(id=1163882773975618298, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1153982211868053862, articleNumber=1671-1807(2025)02-0121-07, orderNo=null, doi=null, pmid=null, cstr=null, oa=null, hot=null, price=null, onlineType=0, articleFormat=0, articleType=null, articleTypeStr=research-article, receivedDate=1724515200000, receivedDateStr=2024-08-25, revisedDate=null, revisedDateStr=null, acceptedDate=null, acceptedDateStr=null, onlineDate=1755420877211, onlineDateStr=2025-08-17, pubDate=1737734400000, pubDateStr=2025-01-25, doiRegisterDate=null, doiRegisterDateStr=null, onlineIssueDate=1755420877211, onlineIssueDateStr=2025-08-17, onlineJustAcceptDate=null, onlineJustAcceptDateStr=null, onlineFirstDate=null, onlineFirstDateStr=null, sourceXml=null, magXml=null, createTime=1755420877211, creator=13701087609, updateTime=1755420877211, updator=13701087609, issue=Issue{id=1153982211868053862, tenantId=1146029695717560320, journalId=1146123222451335185, year='2025', volume='25', issue='2', pageStart='1', pageEnd='360', issueExtLink='null', onlineDate='null', pubDate='null', beforeIssueId=null, nextIssueId=null, price=null, status=1, issueComplete=1, articleOrder=1, issueType=-1, specialIssue=0, createTime=1753060399262, creator=13701087609, updateTime=1753063120267, updator=13701087609, preIssue=null, nextIssue=null, ext={EN=IssueExt(id=1153993624627958610, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1153982211868053862, language=EN, specialIssueTitle=, coverIllustrator=null, specialIssueEditor=, specialIssueAbout=), CN=IssueExt(id=1153993624627958611, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1153982211868053862, language=CN, specialIssueTitle=, coverIllustrator=null, specialIssueEditor=, specialIssueAbout=)}, issueFiles=null}, startPage=121, endPage=127, ext={EN=ArticleExt(id=1163882774302774012, articleId=1163882773975618298, tenantId=1146029695717560320, journalId=1146123222451335185, language=EN, title=Application of Sentiment Classification in Digital Education Reviews Based on Convolutional Neural Networks, columnId=1151877660386357290, journalTitle=Science Technology and Industry, columnName=Industrial Development, runingTitle=null, highlight=null, articleAbstract=

With the advancement of technology and digital transformation, understanding and enhancing students’ emotional experiences are key concerns for educators and policymakers. In this study, 2 000 manually labeled review data were first used to train three machine learning models. The trained SVM model was then used to automatically label 76 000 review data. These labeled datasets were subsequently used to train a Convolutional Neural Network (CNN) model. The CNN model converged successfully after 10 iterations and achieved an accuracy of 94.96% on the validation set, significantly outperforming the SVM model. The results show that combining traditional machine learning with deep learning methods can effectively improve the accuracy of sentiment analysis. This provides data support for optimizing educational strategies.

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=Mingyao TIAN, Yang CHEN), CN=ArticleExt(id=1163882933535331037, articleId=1163882773975618298, tenantId=1146029695717560320, journalId=1146123222451335185, language=CN, title=基于卷积神经网络的数字化教育评论情感分类应用, columnId=1151877660528963628, journalTitle=科技和产业, columnName=产业发展, runingTitle=null, highlight=null, articleAbstract=

随着科技发展和数字化转型,如何理解和提升学生的情感体验是教育工作者和政策制定者关注的重点。首先对2 000条人工标注的评论数据使用三种机器学习模型进行训练,利用已训练支持向量机(SVM)模型对76 000条评论数据进行自动标注,并使用这些标注数据集训练卷积神经网络(CNN)模型。CNN模型在10次迭代后成功收敛,并在验证集上取得94.96%的准确率,显著优于SVM模型。结果显示,结合传统机器学习与深度学习的方法可有效提高情感分析的准确性,为教育策略优化提供数据支持。

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=pKJOcAIa/Sawsy2ksasBEA==, magXml=+G9c4p3l11cpldXqyQ2MJQ==, pdfUrl=null, pdf=tYia5s5oO8p+ldI5Ku5DDg==, pdfFileSize=2369749, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=ZuQLaKuZEoQf3njvLhtJ5Q==, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=3dJsCF9fTOlPZw0s/oY8yg==, mapNumber=null, authorCompany=null, fund=null, authors=

田茗瑶(2002—),女,河北正定人,研究方向为自然语言处理与情感分析;

陈洋(2004—),男,江苏扬州人,研究方向为自然语言处理与情感分析。

, authorsList=田茗瑶, 陈洋)}, authors=[Author(id=1274400303965348843, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1274400304074400749, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, authorId=1274400303965348843, language=EN, stringName=Mingyao TIAN, firstName=Mingyao, middleName=null, lastName=TIAN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mathematics and Physics, Hebei University of Engineering, Handan 056038, Hebei, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1274400304388973550, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, authorId=1274400303965348843, language=CN, stringName=田茗瑶, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=河北工程大学数理科学与工程学院, 河北 邯郸 056038, bio={"content":"

田茗瑶(2002—),女,河北正定人,研究方向为自然语言处理与情感分析;

"}, bioImg=null, bioContent=

田茗瑶(2002—),女,河北正定人,研究方向为自然语言处理与情感分析;

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1274400303835325415, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, xref=null, ext=[AuthorCompanyExt(id=1274400303864685544, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, companyId=1274400303835325415, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mathematics and Physics, Hebei University of Engineering, Handan 056038, Hebei, China), AuthorCompanyExt(id=1274400303877268457, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, companyId=1274400303835325415, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=河北工程大学数理科学与工程学院, 河北 邯郸 056038)])]), Author(id=1274400304699352048, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1274400305148142578, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, authorId=1274400304699352048, language=EN, stringName=Yang CHEN, firstName=Yang, middleName=null, lastName=CHEN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mathematics and Physics, Hebei University of Engineering, Handan 056038, Hebei, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1274400305320109043, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, authorId=1274400304699352048, language=CN, stringName=陈洋, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=河北工程大学数理科学与工程学院, 河北 邯郸 056038, bio={"content":"

陈洋(2004—),男,江苏扬州人,研究方向为自然语言处理与情感分析。

"}, bioImg=null, bioContent=

陈洋(2004—),男,江苏扬州人,研究方向为自然语言处理与情感分析。

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1274400303835325415, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, xref=null, ext=[AuthorCompanyExt(id=1274400303864685544, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, companyId=1274400303835325415, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mathematics and Physics, Hebei University of Engineering, Handan 056038, Hebei, China), AuthorCompanyExt(id=1274400303877268457, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, companyId=1274400303835325415, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=河北工程大学数理科学与工程学院, 河北 邯郸 056038)])])], keywords=[Keyword(id=1274400305995391988, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, orderNo=1, keyword=convolutional neural network), Keyword(id=1274400306393850869, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, orderNo=2, keyword=digital education), Keyword(id=1274400306779726838, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, orderNo=3, keyword=sentiment analysis), Keyword(id=1274400307249488887, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, orderNo=4, keyword=machine learning), Keyword(id=1274400307610199032, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, orderNo=1, keyword=卷积神经网络), Keyword(id=1274400308209984505, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, orderNo=2, keyword=数字化教育), Keyword(id=1274400308503585786, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, orderNo=3, keyword=情感分析), Keyword(id=1274400309417944059, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, orderNo=4, keyword=机器学习)], refs=[Reference(id=1274400315218665487, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2024, volume=null, issue=7, pageStart=27, pageEnd=29, url=null, language=null, rfNumber=[1], rfOrder=0, authorNames=张珺, journalName=互联网周刊, refType=null, unstructuredReference=张珺. 互联网推动教育数字化转型的逻辑机理与现实路径[J]. 互联网周刊, 2024(7): 27-29., articleTitle=互联网推动教育数字化转型的逻辑机理与现实路径, refAbstract=null), Reference(id=1274400315369660432, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2021, volume=459, issue=null, pageStart=249, pageEnd=289, url=null, language=null, rfNumber=[2], rfOrder=1, authorNames=HOI S C H, SAHOO D, LUJ, journalName=Neurocomputing, refType=null, unstructuredReference=HOI S C H, SAHOO D, LUJ, et al. Online learning: a comprehensive survey[J]. Neurocomputing, 2021, 459: 249-289., articleTitle=Online learning: a comprehensive survey, refAbstract=null), Reference(id=1274400315457740817, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2023, volume=20, issue=5, pageStart=117, pageEnd=119, url=null, language=null, rfNumber=[3], rfOrder=2, authorNames=关志广, 程乔, journalName=无线互联科技, refType=null, unstructuredReference=关志广, 程乔. 基于NLP的文本挖掘技术在提升电信客户满意度中的应用[J]. 无线互联科技, 2023, 20(5): 117-119., articleTitle=基于NLP的文本挖掘技术在提升电信客户满意度中的应用, refAbstract=null), Reference(id=1274400315646484498, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2022, volume=34, issue=2, pageStart=38, pageEnd=41, url=null, language=null, rfNumber=[4], rfOrder=3, authorNames=桑倩, 王生花, journalName=信息与电脑(理论版), refType=null, unstructuredReference=桑倩, 王生花. 基于文本挖掘技术的学生评语情感分析[J]. 信息与电脑(理论版), 2022, 34(2): 38-41., articleTitle=基于文本挖掘技术的学生评语情感分析, refAbstract=null), Reference(id=1274400315784896531, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=1, pageEnd=14, url=null, language=null, rfNumber=[5], rfOrder=4, authorNames=张财, 马自强, 闫博, journalName=计算机工程, refType=null, unstructuredReference=张财, 马自强, 闫博. 基于机器学习的政务微博情感分析模型设计[J/OL]. 计算机工程, 1-14.[2024-08-01]. https://link.cnki.net/urlid/31.1289.TP.20240423.1801.006., articleTitle=基于机器学习的政务微博情感分析模型设计, refAbstract=null), Reference(id=1274400315852005396, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2023, volume=13, issue=2, pageStart=210, pageEnd=212, url=null, language=null, rfNumber=[6], rfOrder=5, authorNames=邓慈云, 余国清, journalName=智能计算机与应用, refType=null, unstructuredReference=邓慈云, 余国清. 基于朴素贝叶斯的影评情感分析研究[J]. 智能计算机与应用, 2023, 13(2): 210-212., articleTitle=基于朴素贝叶斯的影评情感分析研究, refAbstract=null), Reference(id=1274400316049137685, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2023, volume=35, issue=4, pageStart=49, pageEnd=56, url=null, language=null, rfNumber=[7], rfOrder=6, authorNames=孙昊男, journalName=黄河水利职业技术学院学报, refType=null, unstructuredReference=孙昊男. 机器学习下网络平台文本的中文情感分析[J]. 黄河水利职业技术学院学报, 2023, 35(4): 49-56., articleTitle=机器学习下网络平台文本的中文情感分析, refAbstract=null), Reference(id=1274400316149800982, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2023, volume=null, issue=null, pageStart=null, pageEnd=null, url=null, language=null, rfNumber=[8], rfOrder=7, authorNames=黄丹婷, journalName=基于集成学习的微博评论情感分析, refType=null, unstructuredReference=黄丹婷. 基于集成学习的微博评论情感分析[D]. 大连: 大连交通大学, 2023., articleTitle=null, refAbstract=null), Reference(id=1274400316212715543, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, doi=null, pmid=null, pmcid=null, year=2024, volume=40, issue=5, pageStart=21, pageEnd=26, url=null, language=null, rfNumber=[9], rfOrder=8, authorNames=郑锐斌, 贺丹, 王凯, journalName=福建电脑, refType=null, unstructuredReference=郑锐斌, 贺丹, 王凯, . 深度学习技术在高校网络舆情分析中的应用[J]. 福建电脑, 2024, 40(5): 21-26., articleTitle=深度学习技术在高校网络舆情分析中的应用, refAbstract=null)], funds=null, companyList=[AuthorCompany(id=1274400303835325415, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, xref=null, ext=[AuthorCompanyExt(id=1274400303864685544, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, companyId=1274400303835325415, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mathematics and Physics, Hebei University of Engineering, Handan 056038, Hebei, China), AuthorCompanyExt(id=1274400303877268457, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, companyId=1274400303835325415, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=河北工程大学数理科学与工程学院, 河北 邯郸 056038)])], figs=[ArticleFig(id=1274400311150191612, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=OSgxKqqnezw1Md8BSDxtFQ==, figureFileBig=11qXRH2usxcZuK/QFAMr+A==, tableContent=null), ArticleFig(id=1274400311431209981, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=图1, caption=部分数据集, figureFileSmall=OSgxKqqnezw1Md8BSDxtFQ==, figureFileBig=11qXRH2usxcZuK/QFAMr+A==, tableContent=null), ArticleFig(id=1274400311817085950, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=gEmg6Li0BDFF2f8hwPZBMg==, figureFileBig=/AXJBO12+wOfA6uONM9mrw==, tableContent=null), ArticleFig(id=1274400311976469503, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=图2, caption=分词及去除停用词结果, figureFileSmall=gEmg6Li0BDFF2f8hwPZBMg==, figureFileBig=/AXJBO12+wOfA6uONM9mrw==, tableContent=null), ArticleFig(id=1274400312253293568, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=ZH2kQZPhyrrx5VxuTHIWbQ==, figureFileBig=YY8I+2626ir5qNZAkVZlGw==, tableContent=null), ArticleFig(id=1274400312458813440, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=图3, caption=部分语料库, figureFileSmall=ZH2kQZPhyrrx5VxuTHIWbQ==, figureFileBig=YY8I+2626ir5qNZAkVZlGw==, tableContent=null), ArticleFig(id=1274400312697888769, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=TgfsxHifzb9JWjttep7Evg==, figureFileBig=wIui8ezsrmTbt58JBsgS1g==, tableContent=null), ArticleFig(id=1274400312798552066, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=图4, caption=朴素贝叶斯算法流程, figureFileSmall=TgfsxHifzb9JWjttep7Evg==, figureFileBig=wIui8ezsrmTbt58JBsgS1g==, tableContent=null), ArticleFig(id=1274400313117319171, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=RFpraMfKzmmCLxLaC6sqEw==, figureFileBig=OMBbYKt9VFgrsq/vP6uEvg==, tableContent=null), ArticleFig(id=1274400313251536900, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=图5, caption=卷积神经网络模型流程, figureFileSmall=RFpraMfKzmmCLxLaC6sqEw==, figureFileBig=OMBbYKt9VFgrsq/vP6uEvg==, tableContent=null), ArticleFig(id=1274400313322840069, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=eFZ0veKrAo6FoaJY/XHP5Q==, figureFileBig=CVcU9HZhV63oTiPQdcyfpg==, tableContent=null), ArticleFig(id=1274400313415114758, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=图6, caption=CNN模型的准确率曲线和损失值曲线, figureFileSmall=eFZ0veKrAo6FoaJY/XHP5Q==, figureFileBig=CVcU9HZhV63oTiPQdcyfpg==, tableContent=null), ArticleFig(id=1274400313591275527, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
原句 我们要开线上课程啦
分词后 我们要开线上课程啦
), ArticleFig(id=1274400313717104648, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=表1, caption=

Jieba分词示例

, figureFileSmall=null, figureFileBig=null, tableContent=
原句 我们要开线上课程啦
分词后 我们要开线上课程啦
), ArticleFig(id=1274400314073620489, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
分类器 准确率 召回率 F1分数
朴素贝叶斯 0.86 0.85 0.83
支持向量机 0.91 0.91 0.91
随机森林 0.90 0.91 0.90
), ArticleFig(id=1274400314178478090, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=表2, caption=

不同分类模型的实验结果

, figureFileSmall=null, figureFileBig=null, tableContent=
分类器 准确率 召回率 F1分数
朴素贝叶斯 0.86 0.85 0.83
支持向量机 0.91 0.91 0.91
随机森林 0.90 0.91 0.90
), ArticleFig(id=1274400314363027467, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
批量大小 准确率/%
学习率= 0.001 学习率= 0.01 学习率= 0.1
32 91.55 91.11 91.45
64 91.65 90.89 90.57
128 91.14 91.26 91.51
), ArticleFig(id=1274400314497245196, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=表3, caption=

模型超参数组合的验证集准确率

, figureFileSmall=null, figureFileBig=null, tableContent=
批量大小 准确率/%
学习率= 0.001 学习率= 0.01 学习率= 0.1
32 91.55 91.11 91.45
64 91.65 90.89 90.57
128 91.14 91.26 91.51
), ArticleFig(id=1274400314602102797, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
模型 准确率 召回率 F1分数
SVM 0.91 0.91 0.91
CNN 0.95 0.94 0.94
), ArticleFig(id=1274400314954424334, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1163882773975618298, language=CN, label=表4, caption=

模型性能对照

, figureFileSmall=null, figureFileBig=null, tableContent=
模型 准确率 召回率 F1分数
SVM 0.91 0.91 0.91
CNN 0.95 0.94 0.94
)], attaches=null, journal=Journal(id=1146119232468656133, delFlag=0, nameCn=科技和产业, nameEn=Science Technology and Industry, nameHistory1=null, nameHistory2=null, issn=1671-1807, eissn=, cn=11-4671/T, coden=null, periodic=3, language=CN, oaType=是, ccby=null, superviseOffice=null, ownerOffice=null, pubOffice=null, editorOffice=null, officeType=null, aims=null, clcCode=null, officeProv=null, officeCity=null, officeAddr=null, officeZip=null, officeEmail=null, officePhone=null, editDirector=null, officeDirector=null, officeDirectorPhone=null, officeStaffNum=null, officeEmpNum=null, coverPicUrl=65omA9nasEwsJtKyya4q2A==, journalPrice=null, startedYear=null, abbrevIsoEn=Sci Technol Ind, journalRemark=null, publicationField=null, createdTime=null, updatedTime=1755589264235, createdBy=null, updatedBy=15831073675, firstLetterCn=S, firstLetterEn=S, subjectCode=Engineering, subjectName=工程, subjectCodeEn=Engineering, subjectNameEn=null, picCn=65omA9nasEwsJtKyya4q2A==, picEn=/wwFtLNQXxKpecNSjAf1AQ==, jcr=null, cjcr=null, exts=[JournalExt(id=1164589040427811221, language=CN, name=科技和产业, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264256, updatedTime=1755589264256, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=http://www.kjhcy.org/kjycy/site/menu/20110121105642001, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""}), JournalExt(id=1164589040473948566, language=EN, name=Science Technology and Industry, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264267, updatedTime=1755589264267, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""})], databaseList=null, tenantJournalId=1146123222451335185, websiteList=[Website(id=1148243202395595182, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/CN, language=CN, createTime=1751692112778, createBy=18614031015, updateTime=1753522130587, updateBy=18614031015, name=科技和产业-中文站点, tplId=1146099689490845704, title=科技和产业, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919343281103033, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=articleTextType, value=kx, createTime=1753522247381, updateTime=1753522247381, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343260131510, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=banner, value=null, createTime=1753522247376, updateTime=1753522247376, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343251742901, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522247374, updateTime=1753522247374, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343272714424, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522247379, updateTime=1753522247379, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343268520119, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522247378, updateTime=1753522247378, creator=18614031015, updator=18614031015)]), Website(id=1155919131955314719, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/EN, language=EN, createTime=1753522197002, createBy=18614031015, updateTime=1753522207756, updateBy=18614031015, name=科技和产业-英文站点, tplId=1146101810881728533, title=Science Technology and Industry, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919498877194448, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=articleTextType, value=kx, createTime=1753522284478, updateTime=1753522284478, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498860417229, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=banner, value=null, createTime=1753522284474, updateTime=1753522284474, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498852028620, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522284472, updateTime=1753522284472, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498873000143, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522284477, updateTime=1753522284477, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498864611534, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522284476, updateTime=1753522284476, creator=18614031015, updator=18614031015)])], journalTitle=科技和产业, weixinUrl=null, journalUrl=null, iacademicId=null, status=0, seqNo=null, journalTitleEn=Science Technology and Industry, journalPhotoCn=65omA9nasEwsJtKyya4q2A==, journalPhotoEn=/wwFtLNQXxKpecNSjAf1AQ==, journalFirstLetter=S, journalRecommend=null, journalNew=null, journalCollection=null, jcrJf=null, cjcrJf=null, jcrJfStr=null, cjcrJfStr=null, submissionFirstDecision=null, sciSubjectClassification=null, casSubjectClassification=null, citeScore=null, totalCitationFrequency=null, icpCode=null, psCode=null, advertisingLicenseCode=null, copyrightInformation=null, country=null, option=, provinceCode=null, provinceName=null, collectFlag=false), detailUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/Y2025/V25/I2/121, detailUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/Y2025/V25/I2/121, pdfUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/PDF/Y2025/V25/I2/121, pdfUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/PDF/Y2025/V25/I2/121, aliStartDate=null, aliEndDate=null, collectionFlag=false, citedCount=null, citedUrl=null, reference=null)
收藏切换
基于卷积神经网络的数字化教育评论情感分类应用
收藏切换
PDF下载
田茗瑶 , 陈洋
科技和产业 | 产业发展 2025,25(2): 121-127
收起
收藏切换
科技和产业 | 产业发展 2025, 25(2): 121-127
基于卷积神经网络的数字化教育评论情感分类应用
全屏
田茗瑶, 陈洋
作者信息
  • 河北工程大学数理科学与工程学院, 河北 邯郸 056038
  • 田茗瑶(2002—),女,河北正定人,研究方向为自然语言处理与情感分析;

    陈洋(2004—),男,江苏扬州人,研究方向为自然语言处理与情感分析。

Application of Sentiment Classification in Digital Education Reviews Based on Convolutional Neural Networks
Mingyao TIAN, Yang CHEN
Affiliations
  • School of Mathematics and Physics, Hebei University of Engineering, Handan 056038, Hebei, China
出版时间: 2025-01-25
文章导航
收藏切换

随着科技发展和数字化转型,如何理解和提升学生的情感体验是教育工作者和政策制定者关注的重点。首先对2 000条人工标注的评论数据使用三种机器学习模型进行训练,利用已训练支持向量机(SVM)模型对76 000条评论数据进行自动标注,并使用这些标注数据集训练卷积神经网络(CNN)模型。CNN模型在10次迭代后成功收敛,并在验证集上取得94.96%的准确率,显著优于SVM模型。结果显示,结合传统机器学习与深度学习的方法可有效提高情感分析的准确性,为教育策略优化提供数据支持。

卷积神经网络  /  数字化教育  /  情感分析  /  机器学习

With the advancement of technology and digital transformation, understanding and enhancing students’ emotional experiences are key concerns for educators and policymakers. In this study, 2 000 manually labeled review data were first used to train three machine learning models. The trained SVM model was then used to automatically label 76 000 review data. These labeled datasets were subsequently used to train a Convolutional Neural Network (CNN) model. The CNN model converged successfully after 10 iterations and achieved an accuracy of 94.96% on the validation set, significantly outperforming the SVM model. The results show that combining traditional machine learning with deep learning methods can effectively improve the accuracy of sentiment analysis. This provides data support for optimizing educational strategies.

convolutional neural network  /  digital education  /  sentiment analysis  /  machine learning
田茗瑶, 陈洋. 基于卷积神经网络的数字化教育评论情感分类应用. 科技和产业, 2025 , 25 (2) : 121 -127 .
Mingyao TIAN, Yang CHEN. Application of Sentiment Classification in Digital Education Reviews Based on Convolutional Neural Networks[J]. Science Technology and Industry, 2025 , 25 (2) : 121 -127 .
随着科技的迅速发展和数字化转型的推进,数字化学习逐渐成为现代教育体系的重要组成部分。线上教育平台的普及,极大地改变了传统的教学方式,也带来了丰富的学生反馈数据[1-2]。这些反馈数据,特别是学生对线上课程的评论和意见,蕴含着大量关于课程质量、教学效果以及学生学习体验的情感信息。如何高效、准确地分析这些情感信息,已成为教育工作者和政策制定者关注的焦点。
情感分类作为自然语言处理的重要分支,旨在从文本数据中自动提取用户的情感倾向。传统的情感分类方法主要分为基于词典的方法和基于机器学习的方法[3]。基于词典的方法依赖于预定义的情感词典,通过匹配文本中的情感词来判断情感倾向;而基于机器学习的方法,使用人工标注的数据,通过支持向量机(support vector machine,SVM)、朴素贝叶斯等算法对文本进行分类。然而,这些方法在处理大规模复杂数据时存在显著的局限性,尤其是大量人工标注的需求不仅耗费时间和成本,且标注效果难以保证一致性[4,5]
近年来,深度学习技术的迅猛发展为情感分析带来了新的契机。卷积神经网络(convolutional neural networks,CNN)作为深度学习的重要模型之一,凭借其在图像处理和特征提取方面的优越性能,逐步被应用于文本情感分类领域。CNN能够自动从数据中学习出高层次的特征,在处理大规模数据时展现出卓越的性能。
为应对大量人工标注的挑战,本文首先选择了适合处理小规模数据集的传统机器学习模型,对2 000条人工标注的评论数据进行训练。通过这种方法,能够减少人工标注的负担,同时确保标注的准确性和一致性。在此基础上,利用经过训练的SVM模型对大规模评论数据进行自动标注。
之后,采用CNN模型对这些自动标注的数据进行情感分类。CNN在特征提取和处理大规模数据集方面表现出色,显著提升了情感分类的整体性能。实验结果表明,CNN模型在验证集上取得了更高的准确率,且在大规模数据集上的表现优于传统的机器学习方法。
本文通过结合传统机器学习和深度学习的方法,不仅提升了情感分析的准确性,也有效减少了人工标注的工作量,为线上教育评论的情感分析提供了一种高效且可靠的解决方案。
通过对中国五大社交媒体平台——Bilibili(b站)、抖音、快手、小红书和微博的评论进行情感分析,深入了解学生对线上学习的看法和感受。这些平台覆盖了广泛的用户群体,从小学生到大学生,均在这些平台上积极发表关于线上教育的评论和反馈。
数据采集利用Python编写的网络爬虫程序,模拟用户登录,并通过平台的搜索接口根据预设关键词(如“线上学习”“远程教育”等)捕捉相关的评论。
数据收集时间跨度为2020—2024年,共计爬取了约76 000条有效评论。这些评论不仅提供了学生对线上学习模式的直接反馈,也反映了他们对于教育内容、教学质量及互动体验的看法。
通过利用社交媒体平台作为数据来源,获取了丰富、多维度的实时数据资源,有助于全面理解学生对数字化教育的态度和需求。这些洞察对于制定教育政策和优化教育模式提供了有力的支持,从而更好地适应当代教育环境的变化。
部分数据集如图1所示。
在进行数据分析之前,首先需要对非结构化的文本数据进行预处理,以转换为计算机可处理的结构化信息。此阶段的关键步骤包括分词和去除停用词,这些操作有助于清理和规范化数据,为之后的深入分析打下坚实的基础。
在进行中文文本处理前,由于中文缺乏明确的词界标识,如空格等,使得词与词之间的界限不明显。因此,分词成为文本分析中一个关键且必不可少的步骤。准确的分词不仅有助于提升后续文本挖掘的质量,还是获取有效信息的基础。
本文采用Python的jieba库进行中文分词,以有效处理并分析从社交媒体平台收集到的评论数据。选择精确模式进行分词,这种模式能够精确地将句子切分成词语,避免冗余和歧义的产生,非常适合用于精细的文本分析(表1)。
经过分词处理后,文本数据中往往含有大量的停用词,如“的”“这个”“那个”等,这些词虽频繁出现,但对于深入分析文本并无实质帮助。因此为提升数据分析的质量和效率,需在词频统计前进行一项关键的数据清洗工作——去除停用词。
为了高效地执行这一步骤,首先构建了一个停用词列表。该列表融合了多个来源的停用词表,并针对社交媒体文本的特点进行了定制和优化。
清洗过程中,每一条经过分词的文本数据都将与停用词表列表进行匹配检查,所有列表中的词汇将被从文本中删除。这一步骤不仅清理了无关信息,也为提取每条评论中的关键词和进行深入分析奠定了坚实基础。
通过这种方法,确保了数据的清洁度和分析的准确性,为后续的文本分析和信息提取提供了高质量的输入。
分词及去除停用词后的部分结果如图2所示。
首先选择部分爬取的相关文本数据,进行细致的人工情感标注(1表示积极,0表示中性,-1表示消极情绪),并创建了包含2 000条评论的专门语料库。这一数据规模既避免了过大数据量导致的模型训练复杂度增加和过拟合问题,同时也足够保证数据的多样性和全面性,从而有效地支持模型的训练和验证。通过精心设计的数据集,本文能够有效平衡模型的泛化能力和识别精度,适应教育环境下复杂多变的情绪分类需求。
部分语料库如图3所示。
采用三种不同的机器学习算法——朴素贝叶斯、支持向量机(SVM)及随机森林来构建情感分类模型。算法的选择是在广泛查阅相关文献后进行的,这些算法被广泛认为在文本情感分类任务中表现良好,尤其是在处理高维数据时,其在各自的领域内已经被证明能有效地提高情感分类的准确性和可靠性,因此将其运用在自建的语料库上进行测试和比较[6-7]
朴素贝叶斯的核心思想在于利用特征之间相互独立的假设[6]。在训练阶段,计算先验概率、条件概率和联合概率分布。在预测阶段,通过应用贝叶斯定理来计算后验概率,并根据后验概率的大小确定测试数据的分类结果。其训练和分类过程大致如下:
(1)对于任意一个数据样本,n维特征向量X(x1,x2,…,xn)表示n个特征属性的特征向量。输出类别分别为C1,C2,…,Cm,共计m个类别。
(2)计算类先验概率:对于类别Ci(1≤im),先验概率的公式为
P(Ci)=$\frac{{N}_{i}}{N}$
式中:N为训练集中样本总数。
(3)计算条件概率:朴素贝叶斯算法是基于条件独立的基础,即
P(X|Ci)=P(x1,x2,…,xn|Ci)=
P(xi|Ci)(x2|Ci)…P(xn|Ci)=$\prod _{}^{n}$P(xk|Ci)
式中:k用于标记第k个特征值xk;P(xi|Ci)(1≤ik,1≤im)由训练过的数据计算得出。条件概率计算公式为
P(xk|Ci)=$\frac{N({x}_{k},C={C}_{i})}{N(C={C}_{i})}$
(4)计算后验概率:基于贝叶斯定理,可推出后验概率P(Ci|X)的计算公式为
P(Ci|X)=$\frac{P\left(\left.X\right|{C}_{i}\right)P\left({C}_{i}\right)}{P\left(X\right)}$
式中:P(X|Ci)为条件概率;P(Ci)为类先验概率;P(X)为常数。
(5)输出类别:比较全部后验概率的大小,朴素贝叶斯分类器对未分类的样本进行分类,最终输出结果是类别Ci,当且仅当Ci满足:P(Ci|X)<P(Cj|X),1≤im,ji
具体流程如图4所示。
首先从“自建语料库.xlsx”文件中加载数据。为了保证数据质量,在加载数据后首先对其进行清洗,删除包含空值的行。此外,为了提高文本数据的处理效率和效果,使用jieba分词库对文本内容进行分词处理。分词后的文本以空格分隔单词,便于后续的向量化处理。
在文本预处理完成后,使用TfidfVectorizer对文本数据进行向量化。TF-IDF向量化不仅考虑词频(term frequency,TF),也考虑词语在整个数据集中的逆文档频率(inverse document frequency,IDF),这有助于减少常见词的影响,同时突出重要词汇。通过这种方式,每条文本数据被转换为一个数值型特征向量,为模型训练提供了适合的输入格式。
采用朴素贝叶斯分类器(MultinomialNB)进行模型训练。选择α=0.5作为平滑参数,该参数有助于调节模型对未见词的处理,从而避免过拟合。数据集被分为70%的训练集和30%的测试集,使用随机种子42来保证结果的可重复性。模型训练完成后,对测试集进行预测,并通过classification_report输出了模型的性能评估,包括准确率、召回率和F1分数等指标,这些指标有助于理解模型在各类情感分类任务上的表现。
经过训练,模型在所有情绪类别上的准确率为86%。加权平均的准确率、召回率和F1分数均在83%至86%之间,显示出模型在处理不同情绪类别时的均衡性和有效性。
支持向量机(SVM)是一种常见的二分类算法,可用于解决二分类和多分类问题,SVM在文本分类任务中表现出色,因其可有效地处理高维数据和小样本问题。继朴素贝叶斯方法之后,本文进一步采用支持向量机(SVM)进行文本情感分类。
在实施支持向量机之前,利用同一TF-IDF向量化的文本数据作为输入。选择线性核函数的SVM模型,因为线性模型在文本分类任务中通常能提供良好的结果,同时计算效率较高。
设置正则化参数C=1.0,该设置为经验值,通常能够在训练和泛化之间达到良好的平衡。模型训练采用了与朴素贝叶斯相同的数据划分,即70%的数据用于训练,30%用于测试。
训练完成后,支持向量机的性能通过相同的性能评估指标进行了评估。结果表明,SVM在总体准确率上达到了91%,且在召回率和F1分数方面也表现出较高的水平。
在朴素贝叶斯和支持向量机(SVM)的研究基础上,进一步采用随机森林算法来进行文本情感分类,以探索和比较不同机器学习算法在同一数据集上的性能表现。
随机森林是一种集成学习技术,通过构建多个决策树并汇总它们的预测结果来提高整体性能,特别是在减少过拟合和提高预测准确性方面表现出色。
首先配置了一个由100棵决策树组成的随机森林模型。这些决策树在训练过程中随机选择特征子集进行学习,这不仅增强了模型的泛化能力,也有效避免了单一决策树可能出现的过拟合问题。与前两种模型一样,随机森林也利用了TF-IDF向量化的文本数据作为输入,确保了实验的一致性。数据的分割策略维持为70%用于训练,30%用于测试。
通过运行,随机森林模型在所有情绪类别上的整体准确率达到了90%,表现出较好的平衡性和有效性。加权平均的准确率、召回率和F1分数均为90%~91%,显示出该模型在处理不同情绪类别时的一致性和效率。
通过使用三种不同的机器学习算法——朴素贝叶斯、支持向量机(SVM)和随机森林,旨在深入探索这些算法在该情感分类任务上的表现。每种算法都有其独特的处理方法和对高维数据的不同适应性,以期找到最适合分析和解读数字化教育环境中学生情绪反应的技术[5-6]
特别关注这些模型在准确性、计算效率和对不平衡数据的处理能力方面的表现,旨在识别出哪一种模型不仅能提供高精度的情感识别,同时也能适应教育领域数据分析的实际需求。通过对比这些模型在同一数据集上的性能,希望揭示各算法的优势和局限,为未来在数字化教育平台上实施情感分析提供科学依据和方法指导。
表2展示了朴素贝叶斯、支持向量机(SVM)和随机森林这三种机器学习算法在本次情感分类任务中的性能对比,包括各自的准确率、召回率和F1分数,从而提供了一个直观的性能评估视角。
在本次情感分类任务中,通过比较朴素贝叶斯、支持向量机(SVM)、和随机森林三种不同的机器学习算法,分析结果表明,支持向量机在所有性能指标上均表现最优,整体准确率、召回率和F1分数均为0.91,显示其在高维数据处理和复杂模式识别中的优势,但训练速度较慢,对参数调整较为敏感。朴素贝叶斯以0.86的准确率较快地完成任务,适用于初步分析,但在处理相关特征时效果受限。随机森林的准确率达0.90,表现出良好的鲁棒性和对大规模数据的适应性,不过计算资源消耗相对较大。
尽管每种模型都有其优点和局限,支持向量机(SVM)在本文表现最为突出,显示了其在处理数字化教育环境下学生情感态度分类时的高准确性和良好的平衡性。
基于上述工作,选择已训练的SVM模型对全部爬取的76 000条评论进行自动情感标注。目的是利用支持向量机模型对大规模数据集进行快速且准确的标注, 该过程显著减少了人工标注的工作量,并且借助已训练模型的高准确性,确保了大规模数据标注的可靠性,为后续的深度学习模型训练提供更为丰富的数据支持。
采用PyTorch框架构建了一个用于文本情感分类的卷积神经网络(CNN)模型[8-9]。模型包括输入层、嵌入层、卷积层、全局池化层、全连接层和输出层。嵌入层的维度设定为64,用于捕捉输入文本的语义信息。卷积层使用了100个卷积核,每个卷积核的尺寸为6,以便有效提取文本中的局部特征。卷积操作后的输出通过全局池化层进行降维,从而保留关键特征。随后,这些特征被送入由100个节点组成的全连接层,用于进一步提取高级抽象特征。输出层采用softmax激活函数,将每条文本归类为三类情感(积极、中性、消极)中的一种(图5)。
为了优化模型参数,模型通过反向传播算法和Adam优化器进行训练。在此过程中,为了找到最优的超参数组合,使用网格搜索法通过调整学习率(learning rate)和批量大小(batch size)的不同组合,并以训练一轮在验证集上的准确率作为评估指标来选择最佳参数。
首先设置多个学习率的候选值(0.01、0.001、0.000 1),以及不同的批量大小(32、64、128)。对于每一个超参数组合,对模型进行训练,并记录每个组合在验证集上的表现。通过对所有组合的结果进行对比分析,最终确定了学习率为0.001和批量大小为64的组合在验证集上取得了最高的准确率。
表3展示了不同学习率和批量大小组合下的验证集准确率,通过表3可以清晰地看到每个超参数组合的效果,并直观地找出最优的参数设置。
接着在整个训练过程中,模型的学习率设为0.001,批量大小为64。为了保证模型的泛化能力,整个数据集被划分为训练集和验证集。模型在10次迭代中训练,每次迭代时通过交叉熵损失函数对模型进行监督学习,并根据验证集的表现评估模型的泛化性能。最终,通过比较验证集上的准确率、精度、召回率等指标,验证了模型在情感分类任务中的有效性。训练过程中,模型的损失函数收敛情况和验证集的准确率如图6所示。
我们对训练的神经网络模型(CNN)与传统机器学习模型支持向量机(SVM)在情感分类任务上的表现进行了对比分析。模型的性能通过准确率(accuracy)、召回率(recall)和F1分数(F1 Score)三个主要指标来评估。表4总结了这两种模型在验证集上的表现。
根据表4中对比的两种模型在情感分类任务上的性能表现可以发现,随着语料库的扩充和更深度的训练,模型的效果得到了显著提升。相较于传统的支持向量机(SVM)模型,卷积神经网络(CNN)在多个评价指标上展示了更为优越的性能。
CNN模型准确率达到了0.95,而SVM模型的准确率为0.91。这一差距表明,CNN在更大规模的数据集上能够更有效地学习和捕捉评论中的情感特征。特别是在处理复杂语言模式和上下文信息时,CNN的深度特征提取能力显得更加突出。通过多层次的卷积操作,CNN能够从评论文本中提取更丰富的特征表示,从而显著提高了分类的准确性。
在召回率方面,CNN模型的表现也优于SVM,达到了0.94,相较于SVM的0.91,CNN在检测多样化情感表达时具有更高的覆盖率,能够有效减少漏检的情况。CNN的多层次网络结构使其能够捕捉情感分类中的细微差异,因此在处理具有高复杂度和多样性的情感数据时表现更为优越。
CNN模型不仅在准确性和召回率上表现出色,而且在应对不平衡数据集的情感分类任务中更具鲁棒性和适应性。CNN通过卷积层的多通道操作和池化层的特征筛选,能够更高效地学习并优化情感特征,使其在整体性能上超越传统机器学习方法。
研究结果显示,随着语料库的扩充和深度学习方法的应用,卷积神经网络模型在情感分类任务中的表现显著优于传统的SVM模型。这表明CNN模型在准确率、召回率和F1分数等关键指标上具有更高的有效性和稳定性,进一步证明了其在大规模、复杂数据环境下进行情感分析的潜力和优势。这为未来在数字化教育领域更广泛应用深度学习技术进行情感分析提供了重要的依据。
参考文献 引证文献
排序方式:
[1]
张珺. 互联网推动教育数字化转型的逻辑机理与现实路径[J]. 互联网周刊, 2024(7): 27-29.
[2]
HOI S C H, SAHOO D, LUJ, et al. Online learning: a comprehensive survey[J]. Neurocomputing, 2021, 459: 249-289.
[3]
关志广, 程乔. 基于NLP的文本挖掘技术在提升电信客户满意度中的应用[J]. 无线互联科技, 2023, 20(5): 117-119.
[4]
桑倩, 王生花. 基于文本挖掘技术的学生评语情感分析[J]. 信息与电脑(理论版), 2022, 34(2): 38-41.
[5]
张财, 马自强, 闫博. 基于机器学习的政务微博情感分析模型设计[J/OL]. 计算机工程, 1-14.[2024-08-01]. https://link.cnki.net/urlid/31.1289.TP.20240423.1801.006.
[6]
邓慈云, 余国清. 基于朴素贝叶斯的影评情感分析研究[J]. 智能计算机与应用, 2023, 13(2): 210-212.
[7]
孙昊男. 机器学习下网络平台文本的中文情感分析[J]. 黄河水利职业技术学院学报, 2023, 35(4): 49-56.
[8]
黄丹婷. 基于集成学习的微博评论情感分析[D]. 大连: 大连交通大学, 2023.
[9]
郑锐斌, 贺丹, 王凯, . 深度学习技术在高校网络舆情分析中的应用[J]. 福建电脑, 2024, 40(5): 21-26.
2025年第25卷第2期
PDF下载
306
156
引用本文
BibTeX
文章信息
  • 接收时间:2024-08-25
  • 首发时间:2025-08-17
  • 出版时间:2025-01-25
补充材料
相关文章
文章信息
作者
出版历史
  • 收稿日期:2024-08-25
基金
作者信息
    河北工程大学数理科学与工程学院, 河北 邯郸 056038
参考文献
分享链接
https://castjournals.cast.org.cn/joweb/kjhcy/CN/1163882773975618298
分享至
全文二维码

扫描看全文

引用本文
BibTeX
本文的引用情况
2种不同金属材料的力学参数

Family
属数
Number of
genus
种数
Number of
species
占总种数比例
Percentage of
total species (%)

Genus
种数
Number of
species
占总种数比例
Percentage of total
species (%)
鹅膏菌科Amanitaceae 2 11 5.26 鹅膏菌属 Amanita 10 4.78
小菇科 Mycenaceae 2 12 5.74 丝盖伞属 Inocybe 5 2.39
多孔菌科 Polyporaceae 8 14 6.70 蜡蘑属 Laccaria 5 2.39
红菇科 Russulaceae 3 23 11.00 小皮伞属 Marasmius 6 2.87
小菇属 Mycena 11 5.26
光柄菇属 Pluteus 5 2.39
红菇属 Russula 17 8.13
栓菌属 Trametes 5 2.39
关闭全屏