Article(id=1149673291520061764, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1149670639897854094, articleNumber=1671-1807(2025)10-0069-08, orderNo=null, doi=, pmid=null, cstr=null, oa=null, hot=null, price=null, onlineType=0, articleFormat=0, articleType=null, articleTypeStr=null, receivedDate=1732118400000, receivedDateStr=2024-11-21, revisedDate=null, revisedDateStr=null, acceptedDate=null, acceptedDateStr=null, onlineDate=1752033072594, onlineDateStr=2025-07-09, pubDate=1748102400000, pubDateStr=2025-05-25, doiRegisterDate=null, doiRegisterDateStr=null, onlineIssueDate=1752033072594, onlineIssueDateStr=2025-07-09, onlineJustAcceptDate=null, onlineJustAcceptDateStr=null, onlineFirstDate=null, onlineFirstDateStr=null, sourceXml=null, magXml=null, createTime=1752033072594, creator=13701087609, updateTime=1757563390568, updator=13701087609, issue=Issue{id=1149670639897854094, tenantId=1146029695717560320, journalId=1146123222451335185, year='2025', volume='25', issue='10', pageStart='1', pageEnd='377', issueExtLink='null', onlineDate='null', pubDate='null', beforeIssueId=null, nextIssueId=null, price=null, status=1, issueComplete=1, articleOrder=1, issueType=-1, specialIssue=0, createTime=1752032440399, creator=13701087609, updateTime=1756780756355, updator=15831073675, preIssue=null, nextIssue=null, ext={EN=IssueExt(id=1169586520596947842, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1149670639897854094, language=EN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=), CN=IssueExt(id=1169586520596947843, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1149670639897854094, language=CN, specialIssueTitle=, coverIllustrator=, specialIssueEditor=, specialIssueAbout=)}, issueFiles=null}, startPage=69, endPage=76, ext={EN=ArticleExt(id=1151877665683763401, articleId=1149673291520061764, tenantId=1146029695717560320, journalId=1146123222451335185, language=EN, title=Research and Design of Handwritten Digit Recognition Based on Convolutional Neural Network, columnId=1151876674645226399, journalTitle=Science Technology and Industry, columnName=Technology Innovation, runingTitle=null, highlight=null, articleAbstract=

In the era of informatization, handwritten digit recognition has wide applications in computer vision and pattern recognition. In order to improve the accuracy and efficiency of handwritten digit recognition, four convolutional neural network (CNN)-based algorithm models were designed and tested. An empirical study was conducted on the MNIST dataset to compare the training performance of different models. The experimental results show that the multilayer CNN model performs best, with an accuracy rate of 98.9%, and each training cycle takes about 20 seconds. This indicates that increasing the number of convolutional layers and using high-level APIs help improve recognition accuracy, further enhancing the application performance of CNN in handwritten digit recognition. New insights and methods are provided for designing efficient and accurate handwritten digit recognition models.

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=Jiaorong ZHU), CN=ArticleExt(id=1151877705487708591, articleId=1149673291520061764, tenantId=1146029695717560320, journalId=1146123222451335185, language=CN, title=基于卷积神经网络的手写数字识别研究与设计, columnId=1151876674787832737, journalTitle=科技和产业, columnName=科技创新, runingTitle=null, highlight=null, articleAbstract=

在信息化时代,手写数字识别在计算机视觉和模式识别中具有广泛应用。为了提升手写数字识别的精度和效率,设计并测试了四种基于卷积神经网络(CNN)的算法模型。通过对MNIST数据集的实证研究,比较不同模型的训练效果。实验结果表明,多层卷积神经网络模型表现最优,准确率达到98.9%,且每轮训练时间仅需约20 s。研究表明,增加卷积层数和选择高阶API(application programming interface)有助于提升识别精度,进一步推动CNN在手写数字识别中的应用性能。这一结果为高效、准确的手写数字识别模型设计提供了新的思路和方法。

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=ChoOoyHJwuIHlNJKv1/Wig==, magXml=iaN4lC7lEZIfHG+M+tUTXQ==, pdfUrl=null, pdf=zUs1cc9ZxS38W/z4B32hvA==, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=DRJkzN6n0YFGrJTv4qt1nw==, mapNumber=null, authorCompany=null, fund=null, authors=

朱姣蓉(2000—),女,浙江湖州人,硕士研究生,研究方向为深度学习。

, authorsList=朱姣蓉), CHT=ArticleExt(id=1172868648474653122, articleId=1149673291520061764, tenantId=1146029695717560320, journalId=1146123222451335185, language=CHT, title=null, columnId=null, journalTitle=科技和产业, columnName=null, runingTitle=null, highlight=null, articleAbstract=null, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=null)}, authors=[Author(id=1173173879137775977, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1173173879196496235, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, authorId=1173173879137775977, language=EN, stringName=Jiaorong ZHU, firstName=Jiaorong, middleName=null, lastName=ZHU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Cultural Heritage and Information Management, Shanghai University, Shanghai 201900, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1173173879259410796, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, authorId=1173173879137775977, language=CN, stringName=朱姣蓉, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=上海大学文化遗产与信息管理学院, 上海 201900, bio={"content":"

朱姣蓉(2000—),女,浙江湖州人,硕士研究生,研究方向为深度学习。

"}, bioImg=null, bioContent=

朱姣蓉(2000—),女,浙江湖州人,硕士研究生,研究方向为深度学习。

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1173173879070667109, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, xref=null, ext=[AuthorCompanyExt(id=1173173879079055718, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, companyId=1173173879070667109, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Cultural Heritage and Information Management, Shanghai University, Shanghai 201900, China), AuthorCompanyExt(id=1173173879087444327, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, companyId=1173173879070667109, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=上海大学文化遗产与信息管理学院, 上海 201900)])])], keywords=[Keyword(id=1173173879376851309, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, orderNo=1, keyword=convolutional neural network), Keyword(id=1173173879431377262, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, orderNo=2, keyword=handwritten digit recognition), Keyword(id=1173173879494291823, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, orderNo=3, keyword=MNIST dataset), Keyword(id=1173173879557206384, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, orderNo=4, keyword=deep learning), Keyword(id=1173173879615926641, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, orderNo=1, keyword=卷积神经网络), Keyword(id=1173173879678841202, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, orderNo=2, keyword=手写数字识别), Keyword(id=1173173879729172851, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, orderNo=3, keyword=MNIST数据集), Keyword(id=1173173879783698804, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, orderNo=4, keyword=深度学习)], refs=[Reference(id=1173173881746633107, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2022, volume=30, issue=21, pageStart=189, pageEnd=193, url=null, language=null, rfNumber=[1], rfOrder=0, authorNames=唐鉴波, 李维军, 赵波, journalName=电子设计工程, refType=null, unstructuredReference=唐鉴波, 李维军, 赵波, 等. 基于卷积神经网络的手写数字识别方法研究[J]. 电子设计工程, 2022, 30(21): 189-193., articleTitle=基于卷积神经网络的手写数字识别方法研究, refAbstract=null), Reference(id=1173173881809547668, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2016, volume=null, issue=null, pageStart=null, pageEnd=null, url=null, language=null, rfNumber=[2], rfOrder=1, authorNames=GOODFELLOW I, BENGIO Y, COURVILLE A, journalName=Deep learning(Vol. 1), refType=null, unstructuredReference=GOODFELLOW I, BENGIO Y, COURVILLE A. Deep learning(Vol. 1)[M]. Cambridge: MIT press, 2016., articleTitle=null, refAbstract=null), Reference(id=1173173881880850837, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2021, volume=57, issue=7, pageStart=44, pageEnd=58, url=null, language=null, rfNumber=[3], rfOrder=2, authorNames=杨培伟, 周余红, 邢岗, journalName=计算机工程与应用, refType=null, unstructuredReference=杨培伟, 周余红, 邢岗, 等. 卷积神经网络在生物医学图像上的应用进展[J]. 计算机工程与应用, 2021, 57(7): 44-58., articleTitle=卷积神经网络在生物医学图像上的应用进展, refAbstract=null), Reference(id=1173173881943765398, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=1989, volume=null, issue=4, pageStart=541, pageEnd=551, url=null, language=null, rfNumber=[4], rfOrder=3, authorNames=LECUN Y, BOSER B, DENKER J S, journalName=Neural Computation, refType=null, unstructuredReference=LECUN Y, BOSER B, DENKER J S, et al. Backpropagation applied to handwritten zip code recognition[J]. Neural Computation, 1989(4): 541-551., articleTitle=Backpropagation applied to handwritten zip code recognition, refAbstract=null), Reference(id=1173173882002485655, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=1995, volume=null, issue=10, pageStart=96, pageEnd=104, url=null, language=null, rfNumber=[5], rfOrder=4, authorNames=LECUN Y, BENGIO Y, journalName=The Handbook of Brain Theory and Neural Networks, refType=null, unstructuredReference=LECUN Y, BENGIO Y. Convolutional networks for images, speech, and time series[J]. The Handbook of Brain Theory and Neural Networks, 1995(10): 96-104., articleTitle=Convolutional networks for images, speech, and time series, refAbstract=null), Reference(id=1173173882061205912, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2006, volume=313, issue=3, pageStart=504, pageEnd=507, url=null, language=null, rfNumber=[6], rfOrder=5, authorNames=HINTON G E, SALAKHUTDINOV R R, journalName=Science, refType=null, unstructuredReference=HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(3): 504-507., articleTitle=Reducing the dimensionality of data with neural networks, refAbstract=null), Reference(id=1173173882119926169, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=24, issue=1, pageStart=281, pageEnd=286, url=null, language=null, rfNumber=[7], rfOrder=6, authorNames=崔兆韵, 崔焕淼, 宋德娟, journalName=科技和产业, refType=null, unstructuredReference=崔兆韵, 崔焕淼, 宋德娟, 等. 改进卷积神经网络的冬小麦提取方法[J]. 科技和产业, 2024, 24(1): 281-286., articleTitle=改进卷积神经网络的冬小麦提取方法, refAbstract=null), Reference(id=1173173882182840730, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2023, volume=23, issue=17, pageStart=266, pageEnd=272, url=null, language=null, rfNumber=[8], rfOrder=7, authorNames=胡敏, 陈楠, 毕进娜, journalName=科技和产业, refType=null, unstructuredReference=胡敏, 陈楠, 毕进娜. 基于SegNet网络和概率图模型的工区障碍物提取[J]. 科技和产业, 2023, 23(17): 266-272., articleTitle=基于SegNet网络和概率图模型的工区障碍物提取, refAbstract=null), Reference(id=1173173882237366683, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=null, volume=null, issue=null, pageStart=1, pageEnd=13, url=null, language=null, rfNumber=[9], rfOrder=8, authorNames=刘善伟, 马志伟, 魏世清, journalName=地质科技通报, refType=null, unstructuredReference=刘善伟, 马志伟, 魏世清, 等. 基于轻量级卷积神经网络的岩石图像岩性识别方法[J/OL]. 地质科技通报, 1-13[2024-12-13]. https://doi.org/10.19509/j.cnki.dzkq.tb20240348., articleTitle=基于轻量级卷积神经网络的岩石图像岩性识别方法, refAbstract=null), Reference(id=1173173882300281244, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=23, issue=3, pageStart=1, pageEnd=5, url=null, language=null, rfNumber=[10], rfOrder=9, authorNames=余国庆, 杨燕婷, 宗兆星, journalName=安徽电子信息职业技术学院学报, refType=null, unstructuredReference=余国庆, 杨燕婷, 宗兆星, 等. 基于卷积神经网络的手写数字识别技术研究[J]. 安徽电子信息职业技术学院学报, 2024, 23(3): 1-5., articleTitle=基于卷积神经网络的手写数字识别技术研究, refAbstract=null), Reference(id=1173173882354807197, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=14, issue=8, pageStart=138, pageEnd=142, url=null, language=null, rfNumber=[11], rfOrder=10, authorNames=谭琬滢, 左珊珊, 邱佩琳, journalName=智能计算机与应用, refType=null, unstructuredReference=谭琬滢, 左珊珊, 邱佩琳, 等. 基于深度卷积神经网络的手写数字识别研究[J]. 智能计算机与应用, 2024, 14(8): 138-142., articleTitle=基于深度卷积神经网络的手写数字识别研究, refAbstract=null), Reference(id=1173173882405138846, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2004, volume=null, issue=14, pageStart=204, pageEnd=206, url=null, language=null, rfNumber=[12], rfOrder=11, authorNames=雷国伟, 吕迎阳, 纪安妮, journalName=计算机工程与应用, refType=null, unstructuredReference=雷国伟, 吕迎阳, 纪安妮, 等. 图像特征的CNN提取方法及其应用[J]. 计算机工程与应用, 2004(14): 204-206., articleTitle=图像特征的CNN提取方法及其应用, refAbstract=null), Reference(id=1173173882463859103, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2022, volume=49, issue=12, pageStart=244, pageEnd=249, url=null, language=null, rfNumber=[13], rfOrder=12, authorNames=樊继慧, 滕少华, 金弘林, journalName=计算机科学, refType=null, unstructuredReference=樊继慧, 滕少华, 金弘林. 基于改进Sigmoid卷积神经网络的手写体数字识别[J]. 计算机科学, 2022, 49(12): 244-249., articleTitle=基于改进Sigmoid卷积神经网络的手写体数字识别, refAbstract=null), Reference(id=1173173882514190752, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2021, volume=38, issue=4, pageStart=102, pageEnd=106, url=null, language=null, rfNumber=[14], rfOrder=13, authorNames=谢东阳, 李丽宏, 苗长胜, journalName=河北工程大学学报(自然科学版), refType=null, unstructuredReference=谢东阳, 李丽宏, 苗长胜. 基于改进AlexNet卷积神经网络的手写体数字识别[J]. 河北工程大学学报(自然科学版), 2021, 38(4): 102-106., articleTitle=基于改进AlexNet卷积神经网络的手写体数字识别, refAbstract=null), Reference(id=1173173882568716705, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2022, volume=23, issue=9, pageStart=159, pageEnd=161, url=null, language=null, rfNumber=[15], rfOrder=14, authorNames=陈群贤, journalName=信息记录材料, refType=null, unstructuredReference=陈群贤. TensorFlow下基于CNN卷积神经网络的手写数字识别研究[J]. 信息记录材料, 2022, 23(9): 159-161., articleTitle=TensorFlow下基于CNN卷积神经网络的手写数字识别研究, refAbstract=null), Reference(id=1173173882619048354, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2020, volume=53, issue=9/10, pageStart=2041, pageEnd=2054, url=null, language=null, rfNumber=[16], rfOrder=15, authorNames=SULAIMAN K, HAFEEZ A, HAZRAT A, journalName=Measurement and Control, refType=null, unstructuredReference=SULAIMAN K, HAFEEZ A, HAZRAT A, et al. Pioneer dataset and recognition of handwritten pashto characters using convolution neural networks[J]. Measurement and Control, 2020, 53(9/10): 2041-2054., articleTitle=Pioneer dataset and recognition of handwritten pashto characters using convolution neural networks, refAbstract=null), Reference(id=1173173882673574307, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2022, volume=35, issue=5, pageStart=1, pageEnd=5, url=null, language=null, rfNumber=[17], rfOrder=16, authorNames=ZHOU L J, YU W H, journalName=Journal of Computer Networks and Communications, refType=null, unstructuredReference=ZHOU L J, YU W H. Improved convolutional neural image recognition algorithm based on LeNet-5[J]. Journal of Computer Networks and Communications, 2022, 35(5): 1-5., articleTitle=Improved convolutional neural image recognition algorithm based on LeNet-5, refAbstract=null), Reference(id=1173173882728100260, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=23, issue=3, pageStart=1, pageEnd=5, url=null, language=null, rfNumber=[18], rfOrder=17, authorNames=余国庆, 杨燕婷, 宗兆星, journalName=安徽电子信息职业技术学院学报, refType=null, unstructuredReference=余国庆, 杨燕婷, 宗兆星, 等. 基于卷积神经网络的手写数字识别技术研究[J]. 安徽电子信息职业技术学院学报, 2024, 23(3): 1-5., articleTitle=基于卷积神经网络的手写数字识别技术研究, refAbstract=null), Reference(id=1173173882778431909, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2023, volume=35, issue=12, pageStart=169, pageEnd=171, url=null, language=null, rfNumber=[19], rfOrder=18, authorNames=纪绪, journalName=信息与电脑(理论版), refType=null, unstructuredReference=纪绪. 基于卷积神经网络的手写数字识别研究与实现[J]. 信息与电脑(理论版), 2023, 35(12): 169-171., articleTitle=基于卷积神经网络的手写数字识别研究与实现, refAbstract=null), Reference(id=1173173882832957862, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=20, issue=12, pageStart=27, pageEnd=30, url=null, language=null, rfNumber=[20], rfOrder=19, authorNames=张趁香, 陈黄宇, journalName=电脑知识与技术, refType=null, unstructuredReference=张趁香, 陈黄宇. 基于LeNet-5的手写数字识别的改进方法[J]. 电脑知识与技术, 2024, 20(12): 27-30., articleTitle=基于LeNet-5的手写数字识别的改进方法, refAbstract=null), Reference(id=1173173882895872423, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2022, volume=39, issue=4, pageStart=328, pageEnd=334, url=null, language=null, rfNumber=[21], rfOrder=20, authorNames=张焕, 张庆, 于纪言, journalName=计算机仿真, refType=null, unstructuredReference=张焕, 张庆, 于纪言. 卷积神经网络中激活函数的性质分析与改进[J]. 计算机仿真, 2022, 39(4): 328-334., articleTitle=卷积神经网络中激活函数的性质分析与改进, refAbstract=null), Reference(id=1173173882950398376, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=null, issue=14, pageStart=133, pageEnd=143, url=null, language=null, rfNumber=[22], rfOrder=21, authorNames=闫建红, 段运会, journalName=计算机工程与应用, refType=null, unstructuredReference=闫建红, 段运会. 动量余弦相似度梯度优化图卷积神经网络[J]. 计算机工程与应用, 2024(14): 133-143., articleTitle=动量余弦相似度梯度优化图卷积神经网络, refAbstract=null), Reference(id=1173173883017507241, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, doi=null, pmid=null, pmcid=null, year=2024, volume=null, issue=11, pageStart=42, pageEnd=46, url=null, language=null, rfNumber=[23], rfOrder=22, authorNames=蔡靖, 谷承睿, 刘光达, journalName=电子技术应用, refType=null, unstructuredReference=蔡靖, 谷承睿, 刘光达, 等. 基于改进AlexNet卷积神经网络人脸识别的研究[J]. 电子技术应用, 2024(11): 42-46., articleTitle=基于改进AlexNet卷积神经网络人脸识别的研究, refAbstract=null)], funds=null, companyList=[AuthorCompany(id=1173173879070667109, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, xref=null, ext=[AuthorCompanyExt(id=1173173879079055718, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, companyId=1173173879070667109, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Cultural Heritage and Information Management, Shanghai University, Shanghai 201900, China), AuthorCompanyExt(id=1173173879087444327, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, companyId=1173173879070667109, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=上海大学文化遗产与信息管理学院, 上海 201900)])], figs=[ArticleFig(id=1173173879905333621, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=GZ7vpbvORD2YvYCQ+xZU/A==, figureFileBig=f6XKBq6/q3b58r+c44CjiQ==, tableContent=null), ArticleFig(id=1173173879968248182, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图1, caption=损失率变化, figureFileSmall=GZ7vpbvORD2YvYCQ+xZU/A==, figureFileBig=f6XKBq6/q3b58r+c44CjiQ==, tableContent=null), ArticleFig(id=1173173880018579831, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=BwroFdKL4mOUXUI1fOY4Qw==, figureFileBig=OqTbtYOKSNFwwRmkL94Iww==, tableContent=null), ArticleFig(id=1173173880064717176, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图2, caption=准确率变化, figureFileSmall=BwroFdKL4mOUXUI1fOY4Qw==, figureFileBig=OqTbtYOKSNFwwRmkL94Iww==, tableContent=null), ArticleFig(id=1173173880123437433, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=8P+YPZO2KC2s++v31QnROA==, figureFileBig=e35DeN+vyogik6MkwmDcGQ==, tableContent=null), ArticleFig(id=1173173880182157690, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图3, caption=部分预测结果, figureFileSmall=8P+YPZO2KC2s++v31QnROA==, figureFileBig=e35DeN+vyogik6MkwmDcGQ==, tableContent=null), ArticleFig(id=1173173880245072251, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=aBBMylj3Ds+I8pNN/7+TzA==, figureFileBig=xpc2PWgtCU7HED/+UGxBoQ==, tableContent=null), ArticleFig(id=1173173880299598204, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图4, caption=损失率变化, figureFileSmall=aBBMylj3Ds+I8pNN/7+TzA==, figureFileBig=xpc2PWgtCU7HED/+UGxBoQ==, tableContent=null), ArticleFig(id=1173173880358318461, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=QyXc0iff+ypQAo9kFJGS5A==, figureFileBig=ex5SZS7qtZtjZCH9BgtRvA==, tableContent=null), ArticleFig(id=1173173880404455806, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图5, caption=准确率变化, figureFileSmall=QyXc0iff+ypQAo9kFJGS5A==, figureFileBig=ex5SZS7qtZtjZCH9BgtRvA==, tableContent=null), ArticleFig(id=1173173880467370367, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=wKHLIjd95yH4lI953K9sIg==, figureFileBig=WooAQoyK8fSA7mDNz43TtQ==, tableContent=null), ArticleFig(id=1173173880521896320, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图6, caption=模型信息, figureFileSmall=wKHLIjd95yH4lI953K9sIg==, figureFileBig=WooAQoyK8fSA7mDNz43TtQ==, tableContent=null), ArticleFig(id=1173173880576422273, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=pgFVDJO49Mx03Fxrrid0cw==, figureFileBig=nZgVlNcKZtwC7Sz2XQYoMA==, tableContent=null), ArticleFig(id=1173173880635142530, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图7, caption=损失率变化, figureFileSmall=pgFVDJO49Mx03Fxrrid0cw==, figureFileBig=nZgVlNcKZtwC7Sz2XQYoMA==, tableContent=null), ArticleFig(id=1173173880702251395, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=JQiaOWj1tWzpS7zT/wVmXg==, figureFileBig=vL1OYr/pLerwmN4eaTu1tQ==, tableContent=null), ArticleFig(id=1173173880760971652, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图8, caption=准确率变化, figureFileSmall=JQiaOWj1tWzpS7zT/wVmXg==, figureFileBig=vL1OYr/pLerwmN4eaTu1tQ==, tableContent=null), ArticleFig(id=1173173880815497605, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=XedLgZjD2j/adiN/jQCSzw==, figureFileBig=fTqIAvyxtjPLjttwftxGwA==, tableContent=null), ArticleFig(id=1173173880878412166, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图9, caption=模型信息, figureFileSmall=XedLgZjD2j/adiN/jQCSzw==, figureFileBig=fTqIAvyxtjPLjttwftxGwA==, tableContent=null), ArticleFig(id=1173173880949715335, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=NfoFvfYVEySksezihr+zBg==, figureFileBig=KkwCgkwH0QFpu0/uQV56IA==, tableContent=null), ArticleFig(id=1173173881004241288, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图10, caption=损失率变化, figureFileSmall=NfoFvfYVEySksezihr+zBg==, figureFileBig=KkwCgkwH0QFpu0/uQV56IA==, tableContent=null), ArticleFig(id=1173173881071350153, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=/hHZPg450sLY9sIZBkkcSQ==, figureFileBig=z4xdF8kfhkLsiFwNCd7z6g==, tableContent=null), ArticleFig(id=1173173881130070410, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图11, caption=准确率变化, figureFileSmall=/hHZPg450sLY9sIZBkkcSQ==, figureFileBig=z4xdF8kfhkLsiFwNCd7z6g==, tableContent=null), ArticleFig(id=1173173881188790667, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=O0EoTqsG15qUUhtzx0LR1w==, figureFileBig=6zLe8jy8t74ZKpklMkOsaw==, tableContent=null), ArticleFig(id=1173173881251705228, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图12, caption=自己的手写数字, figureFileSmall=O0EoTqsG15qUUhtzx0LR1w==, figureFileBig=6zLe8jy8t74ZKpklMkOsaw==, tableContent=null), ArticleFig(id=1173173881306231181, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=9BFROQV1kfeFgI/w8hut7A==, figureFileBig=KLvzl8fNd5+aiSrm61Di/A==, tableContent=null), ArticleFig(id=1173173881373340046, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图13, caption=处理后的手写数字, figureFileSmall=9BFROQV1kfeFgI/w8hut7A==, figureFileBig=KLvzl8fNd5+aiSrm61Di/A==, tableContent=null), ArticleFig(id=1173173881427865999, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=EWCBdG595r1MuLRVz8zgqA==, figureFileBig=0Z5rg37XEG/DOcrUyBWZVA==, tableContent=null), ArticleFig(id=1173173881482391952, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=图14, caption=预测数字, figureFileSmall=EWCBdG595r1MuLRVz8zgqA==, figureFileBig=0Z5rg37XEG/DOcrUyBWZVA==, tableContent=null), ArticleFig(id=1173173881541112209, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
模型 训练
损失率
测试
损失率
训练
准确率
测试
准确率
单层卷积神经网络低阶API 0.335 0.367 0.914 0.910
单层卷积神经网络高阶API 0.114 0.303 0.974 0.953
双层卷积神经网络高阶API 0.112 0.106 0.985 0.987
三层卷积神经网络高阶API 0.107 0.098 0.986 0.989
), ArticleFig(id=1173173881595638162, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1149673291520061764, language=CN, label=表1, caption=

各模型在MNIST数据集上的性能

, figureFileSmall=null, figureFileBig=null, tableContent=
模型 训练
损失率
测试
损失率
训练
准确率
测试
准确率
单层卷积神经网络低阶API 0.335 0.367 0.914 0.910
单层卷积神经网络高阶API 0.114 0.303 0.974 0.953
双层卷积神经网络高阶API 0.112 0.106 0.985 0.987
三层卷积神经网络高阶API 0.107 0.098 0.986 0.989
)], attaches=null, journal=Journal(id=1146119232468656133, delFlag=0, nameCn=科技和产业, nameEn=Science Technology and Industry, nameHistory1=null, nameHistory2=null, issn=1671-1807, eissn=, cn=11-4671/T, coden=null, periodic=3, language=CN, oaType=是, ccby=null, superviseOffice=null, ownerOffice=null, pubOffice=null, editorOffice=null, officeType=null, aims=null, clcCode=null, officeProv=null, officeCity=null, officeAddr=null, officeZip=null, officeEmail=null, officePhone=null, editDirector=null, officeDirector=null, officeDirectorPhone=null, officeStaffNum=null, officeEmpNum=null, coverPicUrl=65omA9nasEwsJtKyya4q2A==, journalPrice=null, startedYear=null, abbrevIsoEn=Sci Technol Ind, journalRemark=null, publicationField=null, createdTime=null, updatedTime=1755589264235, createdBy=null, updatedBy=15831073675, firstLetterCn=S, firstLetterEn=S, subjectCode=Engineering, subjectName=工程, subjectCodeEn=Engineering, subjectNameEn=null, picCn=65omA9nasEwsJtKyya4q2A==, picEn=/wwFtLNQXxKpecNSjAf1AQ==, jcr=null, cjcr=null, exts=[JournalExt(id=1164589040427811221, language=CN, name=科技和产业, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264256, updatedTime=1755589264256, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=http://www.kjhcy.org/kjycy/site/menu/20110121105642001, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""}), JournalExt(id=1164589040473948566, language=EN, name=Science Technology and Industry, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264267, updatedTime=1755589264267, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""})], databaseList=null, tenantJournalId=1146123222451335185, websiteList=[Website(id=1148243202395595182, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/CN, language=CN, createTime=1751692112778, createBy=18614031015, updateTime=1753522130587, updateBy=18614031015, name=科技和产业-中文站点, tplId=1146099689490845704, title=科技和产业, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919343281103033, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=articleTextType, value=kx, createTime=1753522247381, updateTime=1753522247381, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343260131510, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=banner, value=null, createTime=1753522247376, updateTime=1753522247376, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343251742901, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522247374, updateTime=1753522247374, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343272714424, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522247379, updateTime=1753522247379, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343268520119, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522247378, updateTime=1753522247378, creator=18614031015, updator=18614031015)]), Website(id=1155919131955314719, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/EN, language=EN, createTime=1753522197002, createBy=18614031015, updateTime=1753522207756, updateBy=18614031015, name=科技和产业-英文站点, tplId=1146101810881728533, title=Science Technology and Industry, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919498877194448, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=articleTextType, value=kx, createTime=1753522284478, updateTime=1753522284478, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498860417229, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=banner, value=null, createTime=1753522284474, updateTime=1753522284474, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498852028620, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522284472, updateTime=1753522284472, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498873000143, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522284477, updateTime=1753522284477, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498864611534, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522284476, updateTime=1753522284476, creator=18614031015, updator=18614031015)])], journalTitle=科技和产业, weixinUrl=null, journalUrl=null, iacademicId=null, status=0, seqNo=null, journalTitleEn=Science Technology and Industry, journalPhotoCn=65omA9nasEwsJtKyya4q2A==, journalPhotoEn=/wwFtLNQXxKpecNSjAf1AQ==, journalFirstLetter=S, journalRecommend=null, journalNew=null, journalCollection=null, jcrJf=null, cjcrJf=null, jcrJfStr=null, cjcrJfStr=null, submissionFirstDecision=null, sciSubjectClassification=null, casSubjectClassification=null, citeScore=null, totalCitationFrequency=null, icpCode=null, psCode=null, advertisingLicenseCode=null, copyrightInformation=null, country=null, option=, provinceCode=null, provinceName=null, collectFlag=false), detailUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/Y2025/V25/I10/69, detailUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/Y2025/V25/I10/69, pdfUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/PDF/Y2025/V25/I10/69, pdfUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/PDF/Y2025/V25/I10/69, aliStartDate=null, aliEndDate=null, collectionFlag=false, citedCount=null, citedUrl=null, reference=null)
收藏切换
基于卷积神经网络的手写数字识别研究与设计
收藏切换
PDF下载
朱姣蓉
科技和产业 | 科技创新 2025,25(10): 69-76
收起
收藏切换
科技和产业 | 科技创新 2025, 25(10): 69-76
基于卷积神经网络的手写数字识别研究与设计
全屏
朱姣蓉
作者信息
  • 上海大学文化遗产与信息管理学院, 上海 201900
  • 朱姣蓉(2000—),女,浙江湖州人,硕士研究生,研究方向为深度学习。

Research and Design of Handwritten Digit Recognition Based on Convolutional Neural Network
Jiaorong ZHU
Affiliations
  • School of Cultural Heritage and Information Management, Shanghai University, Shanghai 201900, China
出版时间: 2025-05-25 doi:
文章导航
收藏切换

在信息化时代,手写数字识别在计算机视觉和模式识别中具有广泛应用。为了提升手写数字识别的精度和效率,设计并测试了四种基于卷积神经网络(CNN)的算法模型。通过对MNIST数据集的实证研究,比较不同模型的训练效果。实验结果表明,多层卷积神经网络模型表现最优,准确率达到98.9%,且每轮训练时间仅需约20 s。研究表明,增加卷积层数和选择高阶API(application programming interface)有助于提升识别精度,进一步推动CNN在手写数字识别中的应用性能。这一结果为高效、准确的手写数字识别模型设计提供了新的思路和方法。

卷积神经网络  /  手写数字识别  /  MNIST数据集  /  深度学习

In the era of informatization, handwritten digit recognition has wide applications in computer vision and pattern recognition. In order to improve the accuracy and efficiency of handwritten digit recognition, four convolutional neural network (CNN)-based algorithm models were designed and tested. An empirical study was conducted on the MNIST dataset to compare the training performance of different models. The experimental results show that the multilayer CNN model performs best, with an accuracy rate of 98.9%, and each training cycle takes about 20 seconds. This indicates that increasing the number of convolutional layers and using high-level APIs help improve recognition accuracy, further enhancing the application performance of CNN in handwritten digit recognition. New insights and methods are provided for designing efficient and accurate handwritten digit recognition models.

convolutional neural network  /  handwritten digit recognition  /  MNIST dataset  /  deep learning
朱姣蓉. 基于卷积神经网络的手写数字识别研究与设计. 科技和产业, 2025 , 25 (10) : 69 -76 .
Jiaorong ZHU. Research and Design of Handwritten Digit Recognition Based on Convolutional Neural Network[J]. Science Technology and Industry, 2025 , 25 (10) : 69 -76 .
随着现代科技的不断发展,人工智能成为一个备受关注的领域。在人工智能的诸多应用领域中,图像识别一直是备受关注的研究方向之一。手写识别作为一种常见的静态图像识别,广泛应用于数据统计、财务金融及成绩判定等多个领域[1]。在这些领域中,使用最频繁且最便利人们生活的便是手写数字识别(handwritten digit recognition),它属于光学字符识别技术的一个分支,是模式识别学科的传统研究领域。
深度学习作为人工智能实现的重要技术,它的发展是时代的大势所趋。其中,卷积神经网络(convolutional neural network, CNN)是一类包含卷积计算且具有深度解构的前馈神经网络,是深度学习的代表算法之一[2],具有自动学习特征的能力,其应用涉及制造业、农业等多个领域,用于完成图像分类、目标检测等任务。
近年来,卷积神经网络技术在图像识别领域广泛应用,各种算法层出不穷,以LeNet-5为起点,学者们对模型不断优化,衍生出AlexNet、VGG、GoogLeNet等模型[3]。随着卷积神经网络技术的发展,利用卷积神经网络的各种框架对图像进行分割与识别,可以更好地对模型训练,实现对手写静态图像的识别,尤其是在手写数字识别中表现出良好的性能。
本文旨在研究和设计几种基于卷积神经网络的用以实现手写数字识别的不同模型,并对其进行实证研究。具体而言,使用Python语言,通过对手写数字数据集MNIST进行预处理和特征提取,完成测试和训练,再利用卷积神经网络的各种不同算法构建模型框架、进行特征学习,形成可视化的结果图用以比较分析算法优劣。最终实现准确性高、损失率低的手写数字识别。
因此,本文的实现从研究意义上说,许多机器学习和模式识别领域的新理论和算法都是先用手写数字识别验证有效性的,便于研究与验证。从社会意义上来说,本文的完成可以帮助人们实现对手写数字的自动识别,便利人们使用电子设备的输入;从经济意义上来说,本文的完成可以减少手工输入的工作量,提高工作效率,节约人工成本。
卷积神经网络(CNN)在手写数字识别领域的应用始于1989年,当时LeCun等[4]首次提出反向传播算法在手写邮政编码识别中的应用,为卷积神经网络的发展奠定基础。此后,LeCun及其团队在1998年推出具有里程碑意义的LeNet-5模型[5],为CNN的研究开辟了新篇章。随着深度学习的兴起,Hinton和Salakhutdinov[6]于2006年在Science上发表了关于深层神经网络的开创性论文,进一步推动了卷积神经网络模型的优化与发展。这一研究不仅推动了CNN模型的多层次结构设计,也开启了深度学习在农业[7]、工业[8]、地质[9]等图像识别任务中的广泛应用,尤其是在手写数字识别领域,卷积神经网络的优越性能得到了充分验证[10-11]
然而,在中国卷积神经网络的研究热潮直到2004年雷国伟等[12]提出基于CNN的图像特征提取方法时才真正起步。此后,随着深度学习理论的逐步普及,中国学者也开始专注于卷积神经网络模型的创新与优化,尤其是在手写数字识别中的应用。例如,樊继慧等[13]通过改进Sigmoid激活函数提升了卷积神经网络在手写数字数据集上的分类精度,谢东阳等[14]基于AlexNet模型引入Inception-ResNet模块,显著提高了数字特征的提取能力。此外,陈群贤[15]在TensorFlow框架下应用Keras接口,构建了一种具有更高运行效率和鲁棒性的手写数字识别系统。这些研究成果不仅为CNN模型的发展提供了理论基础,也为实践中各类数字识别任务提供技术支持。
国外的研究也呈现类似的趋势,Sulaiman等[16]提出一种高效的离线字符识别OCR系统,并在多种手写数字识别场景中取得了显著成果。同时,Zhou和Yu[17]对LeNet-5进行改进,加入局部二值模式(LBP)图像信息,进一步提高模型的准确性,达到99.8%的识别率。全球科技公司如IBM、HP、东芝等也在这一领域投入大量的资源,不仅在手写数字识别的基础研究中取得突破,也推动了相关技术在智能医疗、自动驾驶和人脸识别等领域的应用。
尽管已有诸多研究取得了重要进展,但仍存在一些局限。首先,目前的卷积神经网络模型在手写数字识别中的准确性仍未达到100%,因此模型的优化和迭代仍是一个重要的研究方向。其次,尽管新兴模块和网络架构的引入确实提升了模型的性能,但这一过程往往忽视了模型本身结构优化的潜力。在快速发展的背景下,学者们更多地专注引入新的模块和技术,却较少关注如何在现有结构上进行有效的优化,以提升模型的泛化能力和稳定性。这使得卷积神经网络在处理复杂、噪声较多的手写数字图像时仍面临一定的挑战。
本文正是在这一背景下展开的,通过对现有卷积神经网络结构的分析与优化,尤其是应用程序编程接口(application programming interface,API)选择和卷积层数的调节,旨在深入探讨不同设计对模型性能的影响,并在此基础上提出新的改进方向,从而提升模型在手写数字识别任务中的应用效果。
本文以在手写体数字识别系统性能测试方面具有较高认可度的MNIST数据库为实验样本集,其中包含7万张图片,6万张为训练样本,1万个为测试样本,用于对模型的训练及验证。在NIST中,手写数字MNIST是目前被最多人使用且数据最多的数据库,经常被用在深度学习中[18]。采集步骤如下。
(1)原始图像收集:使用手写数字的原始图像,这些图像可能来自多种来源。
(2)图像标注:手动标注每个图像的正确数字标签,以便用于监督学习。
(3)数据集划分:将整个数据集分为训练集、验证集和测试集,确保模型能够在不同的数据集上进行评估。
数据预处理是确保数据适合模型训练的关键步骤。本文采取以下预处理步骤。
(1)图像归一化:将像素值缩放到特定的范围,通常是[0,1]。这有助于提高模型训练的稳定性。
(2)图像标准化:对图像进行标准化处理,使其具有零均值和单位方差。这有助于加速模型的收敛。
(3)图像大小调整:将图像调整为模型输入的固定大小,通常是28×28像素。这有助于确保所有输入数据具有相同的格式。
(4)标签编码:将数字标签进行独热编码(one-hot encoding),将其转换为模型能够理解的格式。
卷积神经网络是感知器(MLP)的一种扩展和扩展,是一种基于监督学习的多层神经网络模型[19]。它包括输入层、隐藏层(卷积层、池化层)和输出层,其中,隐藏层可以有多层,每一层都包含一个或更多的二维平面,每一层又包含若干个单独的神经元。
卷积神经网络中最关键的两个步骤是卷积和池化运算,前一步的目的是从这一层的图像样本中抽取特征,并去噪;后一步的目的是对前一层的特征矢量进行降维(降低图像分辨率,以获取有效的信息)。由此,可以得出结论,卷积神经网络是一种由两个不同的层间交替构造而成的模型。卷积神经网络的导出层通常选用线性全联结,当下最为常见的应当是 Softmax划分类别的方式。
卷积神经网络是以多个卷积核为基础,对不同的特征进行卷积运算,并对其进行训练,并由此获得对应的特征表达式。通过将上一层的多个输出图像(上一层是输入图像,下一层是特征图)通过学习得到的卷积图,在特征图上“滑动”,每滑动一次,即可得到下一层的特征图,并与上一层的特征图形成内在联系。每个卷积核可以抽取一种类型的特征,通过n个卷积核可以获得n个特征图,也就是表示已经抽取n种类型的特征,之后再加上偏移b,就可以得到卷积的结果[16]。卷积层的计算公式为
${a}_{j}^{\left(l\right)}={\sum }_{i\in {M}_{j}}^{}{x}_{j}^{(l-1)}*{k}_{ij}^{\left(l\right)}+{b}_{j}^{\left(l\right)}$
${x}_{j}^{\left(l\right)}=f\left({a}_{j}^{\left(l\right)}\right)$
式中:*为卷积云运算符号;$a_{j}^{(l)}$为第l层第j个神经元节点的输入;$x_{j}^{(l)}$为第l层卷积后第j个神经元的输出;$x_{j}^{(l-1)}$为第l-1层的第j个神经元的输出;$k_{j}^{(l)}$为第l层卷积核;$b_{j}^{(l)}$为第l层第j个神经元的偏置;$f(\bullet)$为非线性函数;Mj为第j个神经元的局部感受野。
池化的目的是使图像具有某种空间不变性,以降低图像分辨率。在此基础上,提出一种新的图像处理算法,该算法将特征图与之相应卷积层的特征图相关联,并对特征图进行采集。可以用以下公式来计算池化层:
$x_{j}^{(l)}=f\left[\beta_{j}^{(l)} \operatorname{down}\left(x_{j}^{(l-1)}\right)+b_{j}^{(l)}\right]$
式中:β为不同的Feature Map的系数;down(·)为一个下采样函数,如果下采样因子是n,输出的图像分辨率就变为原来的1/n
在神经网络中,激活函数(activation function)是一类重要的映射函数。人工神经网络的计算模式是每一层神经网络的特征值和权值相乘,从本质上来说,就是一种矩阵的乘法运算。这便意味着即使加深了神经网络的层数,仍然是多次的矩阵相乘,层与层之间也是线性相关的[20]。因此,该神经网络从本质上来说,仍然是一个原始的多层感知器模型,对某些非线性函数具有很强的拟合能力。为了确保卷积神经网络可以对非凸函数进行拟合,需要采用非线性激活函数,在每一层的操作完成之后,经过激活函数的映射后,输出计算结果。因此,要对卷积结果使用激活函数,来获得新的特征图。
Sigmoid(S型非线性函数)作为最早的激活函数,它的具体实现是将输出实数规整到 0~1使输出幅度有界(取值范围为[0,1]),此函数使网络具备对非线性信息处理的能力,一直被广泛地使用,其数学表达式为
$f\left(x\right)=\frac{1}{1+{e}^{-x}}$
为解决这些传统函数存在的梯度弥散问题,提出使用非饱和修正线性ReLU 作为激活函数。ReLU 在近些年的研究中表现出色。ReLU 是一个分段函数,它可以使数据特征最大限度得以保留,具体方法是:将为正的所有数据全部保留,其他部分清零,其实数学表达式为
$f\left(x\right)=\left\{\begin{array}{ll}max(0,x),& x\ge 0\\ 0,& x<0\end{array}\right.$
为防止卷积神经网络在学习过程中出现局部极值,需对其学习算法进行优化。该方法将学习过程划分为两个阶段。一是信息从底层传递到高层的正向传播;二是在当前向传播得出的结果与预期不一致时,从高层面向低层面传播训练的反向传播[21]。训练过程如下。
(1)对加权网络进行初始化。
(2)通过卷积层、池化层和全连接层,将输入的数据向前传递,获得输出数值。
(3)对上述网络目标值与所述输出值之间的误差进行计算。
(4)返回基于以上得到的结果并进行分析,如果错误误差与我们的预期一致,则停止训练。
(5)根据求得误差进行权值更新,然后再进入到第二步。
尽管随机梯度下降方法对传统的梯度降阶方法进行一定的改进,但是该方法仍存在着易陷入局部极值和易出现振荡等问题。为了对此进行改善,提出动量法,这是一种在物理学中模仿动量的概念,用积累以前的动量来代替真正的梯度[22],参数更新公式如下:
${v}_{t}={w}_{t}+\eta {\Delta }_{\theta }J\left(\theta \right)$
$\theta =\theta -{v}_{t}$
式中:vt为表示时刻的动量值; ${\Delta }_{\theta }$为学习率; $\gamma $为动量因子。
通过对基于动量的随机梯度下降法的计算公式进行分析,发现当梯度的方向和动量相同时,调整参数的振幅将增大,从而加快收敛速度;反之,调整参数的振幅会降低,从而降低振荡的发生。若在局部极值情形中,则可能出现由动能累积而跳脱出极值情形。
模型训练的另一个困难的问题时如何设定学习率[23]。学习率的的设定对整体模型的效果和训练效率有直接影响。较大的学习率,会造成参数更新的幅度较大、训练的时间较短,更容易陷入局部最优,或在最优范围内震荡;较低的学习率,意味着时间越长,所需的计算资源越多。所以,如何选择合适的学习量,是一个相当困难的问题。由于损失通常对参数空间中的某个维度或者其他维度非常敏感,因此,理论上可以在敏感度更高的情形下选择更低的学习率,或者在训练速度更快的情形下选择更高的学习率。
本文使用深度学习框架TensorFlow,它提供了很多API,可以被简单地分为高低两个级别,因此本文用于对比的四个模型的区别之一就在于高阶和低阶API的选择;理论上来说,多层卷积可以更有效地更新权重来拟合训练数据,使得准确率更高,因此本文四个模型的区别之二在于针对卷积层的数量设计了单层、双层、三层卷积进行识别性能对比。
第一个模型利用单层卷积神经网络低阶API实现手写数字识别。低阶API主要包括各种张量操作、计算图和自动微分,如在该模型中用到的tf.ragged张量操作、tf.random随机数生成等。具体的实现步骤如下。
(1)导入库及获取数据集。首先需要导入TensorFlow和Keras库。数据集采用的是Keras中常用的数据集Datasets中的MNIST手写字符数据集。
(2)整理数据集。将数据集拉伸为二维,并划分为训练集和验证集,并将其归一化处理。
(3)定义参数创建模型。对数据处理完成后,需要定义模型的参数,并使用激活函数将线性模型转为非线性,在该模型中使用的是Softmax函数。
(4)神经网络训练。在训练模型之前需要先编译模型,定义训练的次数、速率等,使用梯度下降速度快且容易在最优值附近震荡的Adam优化器。训练模型时要指定训练/测试样本和训练/测试标签以及损失率和准确率,并打印进度和日志信息。最后,将准确率和损失率的变化绘制成可视化的二维图展示,图1图2所示。
(5)模型及图像预测。在测试集上评估模型准确率。再从索引的第0个开始及其后10个对图像识别进行预测,把图像送入模型进行预测,返回结果按照实际数字、预测数字及数字图像可视化展示,识别结果如图3所示。
从低阶API的训练过程可以看出,整个训练过程都被暴露出来。第二个模型使用了高阶API,一般为按照OOP方式封装的高级API,在该模型中便增加高阶API提供的函数,如激励函数ReLU及评估函数metrics。具体实现同第一个模型,但与第一个模型不同的是,在该模型中定义第一层隐藏层和输出层的权重和偏执项变量,并增加激励函数ReLU用以解决gradient vanishing问题及加快收敛速度。损失率和准确率的变化结果分别如图4图5所示。
不同于只有一层卷积的卷积神经网络,双层卷积神经网络有两层卷积层。多层神经网络可以从各个角度分析复杂数据,而单层只能做简单的分类和分析。在该模型中,最重要的就是有两层卷积,并且卷积模式相同,在每次卷积完成后都需要进入池化层对特征图进行压缩,再一起进入全连接层进行后续输出。与前两个模型同样使用训练轮数(epoch)将训练集中每个样本都参与训练一次,打印出模型信息、损失率及准确率变化图,如图6~图8所示。
第四个模型在双层卷积的基础上又增加了一个卷积层,由此可以纵向比较单层、双层、三层卷积层模型的识别效果,并且利用该模型识别自己手写的数字。需要特别注意的是,与双层卷积模型不同的是,该模型有三层卷积并且卷积模式相同,在每次卷积完成后分别进入池化层,再一起进入全连接层进行后续输出,此处使用的激活函数是ReLU以及使用Softmax分为10类。最后展示该模型的信息及损失率、准确率变化,如图9~图11所示。
模型训练完成后保存可用于预测,如果预测样本没有发生比较大的变化,那么训练好的模型理论上可以一直使用。根据以上训练,模型识别准确率很高,可以使用画图板手写数字,此处手写了如图12所示的数字“3”进行识别,手写数字图片保存为jpg.格式后,对该图片进行预处理、读取(图13)、预测(图14)。
本文尝试了四种不同的模型进行训练,对训练结果进行对比,模型区别的依据其一是根据API的不同对比低阶和高阶API的模型性能,其二是根据卷积层数的不同对比单层、双层和三层的模型性能。表1展示了同一数据集(MNIST)下,按1∶4划分训练集和测试集,采用不同模型的卷积神经网络训练20次后的训练损失率和验证准确率。
训练损失率是用于评估模型如何拟合训练数据的指标,也就是说,它评估模型在训练集上的误差,损失越大误差越大;测试准确率用于评估模型在测试集上的准确性,准确率越高越准确。
实验结果表明,在同样是单个卷积层的卷积神经网络下,低阶API训练损失率高达0.335而高阶API仅0.114。高阶API不仅通过封装复杂计算步骤,简化了模型构建流程,还通过内置优化算法提高模型的计算效率和泛化能力,因此显著降低了识别误差。测试准确率也从0.910提升至0.953,表明高阶API能够更高效地捕捉特征并提升模型性能。
在增加了卷积层之后,多层卷积模型的训练损失率进一步降低至0.112(双层)和0.107(三层),而测试准确率分别提升至0.987和0.989。这是因为增加卷积层数可以提取更丰富、更深层次的特征,从而增强了模型的表达能力和对复杂数据的适应性。此外,尽管卷积层的增加延长了训练时间,但由于单次训练仅需20 s左右,因此计算成本仍在可接受范围内。
进一步分析表明,多层模型的性能提升还得益于卷积层对噪声的抑制和对局部特征的强化,使得特征提取更加精准。然而,卷积层数的增加也可能带来过拟合风险,因此在实际应用中需根据数据集的复杂性和任务需求,合理选择卷积层数和模型参数,以实现性能与效率的平衡。
在人工智能技术高速发展的信息化时代,基于人们对全球信息化和自动化程度的要求不断提升,以及在诸多领域中仍存在耗费大量人物财力实现人工识别手写数字的情况,一种利用深度学习技术高效准确的手写数字识别方式是极具研究价值、社会价值和经济价值的。本文理清了卷积神经网络及手写数字识别的发展趋势;实现使用基于卷积神经网络的手写数字识别的四种模型。最后的结果表明,在四个模型中高阶API三个卷积层的模型识别效果最优,在未来的研究中以及在各个行业领域中具有很大的应用潜力。
参考文献 引证文献
排序方式:
[1]
唐鉴波, 李维军, 赵波, 等. 基于卷积神经网络的手写数字识别方法研究[J]. 电子设计工程, 2022, 30(21): 189-193.
[2]
GOODFELLOW I, BENGIO Y, COURVILLE A. Deep learning(Vol. 1)[M]. Cambridge: MIT press, 2016.
[3]
杨培伟, 周余红, 邢岗, 等. 卷积神经网络在生物医学图像上的应用进展[J]. 计算机工程与应用, 2021, 57(7): 44-58.
[4]
LECUN Y, BOSER B, DENKER J S, et al. Backpropagation applied to handwritten zip code recognition[J]. Neural Computation, 1989(4): 541-551.
[5]
LECUN Y, BENGIO Y. Convolutional networks for images, speech, and time series[J]. The Handbook of Brain Theory and Neural Networks, 1995(10): 96-104.
[6]
HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(3): 504-507.
[7]
崔兆韵, 崔焕淼, 宋德娟, 等. 改进卷积神经网络的冬小麦提取方法[J]. 科技和产业, 2024, 24(1): 281-286.
[8]
胡敏, 陈楠, 毕进娜. 基于SegNet网络和概率图模型的工区障碍物提取[J]. 科技和产业, 2023, 23(17): 266-272.
[9]
刘善伟, 马志伟, 魏世清, 等. 基于轻量级卷积神经网络的岩石图像岩性识别方法[J/OL]. 地质科技通报, 1-13[2024-12-13]. https://doi.org/10.19509/j.cnki.dzkq.tb20240348.
[10]
余国庆, 杨燕婷, 宗兆星, 等. 基于卷积神经网络的手写数字识别技术研究[J]. 安徽电子信息职业技术学院学报, 2024, 23(3): 1-5.
[11]
谭琬滢, 左珊珊, 邱佩琳, 等. 基于深度卷积神经网络的手写数字识别研究[J]. 智能计算机与应用, 2024, 14(8): 138-142.
[12]
雷国伟, 吕迎阳, 纪安妮, 等. 图像特征的CNN提取方法及其应用[J]. 计算机工程与应用, 2004(14): 204-206.
[13]
樊继慧, 滕少华, 金弘林. 基于改进Sigmoid卷积神经网络的手写体数字识别[J]. 计算机科学, 2022, 49(12): 244-249.
[14]
谢东阳, 李丽宏, 苗长胜. 基于改进AlexNet卷积神经网络的手写体数字识别[J]. 河北工程大学学报(自然科学版), 2021, 38(4): 102-106.
[15]
陈群贤. TensorFlow下基于CNN卷积神经网络的手写数字识别研究[J]. 信息记录材料, 2022, 23(9): 159-161.
[16]
SULAIMAN K, HAFEEZ A, HAZRAT A, et al. Pioneer dataset and recognition of handwritten pashto characters using convolution neural networks[J]. Measurement and Control, 2020, 53(9/10): 2041-2054.
[17]
ZHOU L J, YU W H. Improved convolutional neural image recognition algorithm based on LeNet-5[J]. Journal of Computer Networks and Communications, 2022, 35(5): 1-5.
[18]
余国庆, 杨燕婷, 宗兆星, 等. 基于卷积神经网络的手写数字识别技术研究[J]. 安徽电子信息职业技术学院学报, 2024, 23(3): 1-5.
[19]
纪绪. 基于卷积神经网络的手写数字识别研究与实现[J]. 信息与电脑(理论版), 2023, 35(12): 169-171.
[20]
张趁香, 陈黄宇. 基于LeNet-5的手写数字识别的改进方法[J]. 电脑知识与技术, 2024, 20(12): 27-30.
[21]
张焕, 张庆, 于纪言. 卷积神经网络中激活函数的性质分析与改进[J]. 计算机仿真, 2022, 39(4): 328-334.
[22]
闫建红, 段运会. 动量余弦相似度梯度优化图卷积神经网络[J]. 计算机工程与应用, 2024(14): 133-143.
[23]
蔡靖, 谷承睿, 刘光达, 等. 基于改进AlexNet卷积神经网络人脸识别的研究[J]. 电子技术应用, 2024(11): 42-46.
2025年第25卷第10期
PDF下载
267
77
引用本文
BibTeX
文章信息
  • 接收时间:2024-11-21
  • 首发时间:2025-07-09
  • 出版时间:2025-05-25
补充材料
相关文章
文章信息
作者
出版历史
  • 收稿日期:2024-11-21
基金
作者信息
    上海大学文化遗产与信息管理学院, 上海 201900
参考文献
分享链接
https://castjournals.cast.org.cn/joweb/kjhcy/CN/1149673291520061764
分享至
全文二维码

扫描看全文

引用本文
BibTeX
本文的引用情况
2种不同金属材料的力学参数

Family
属数
Number of
genus
种数
Number of
species
占总种数比例
Percentage of
total species (%)

Genus
种数
Number of
species
占总种数比例
Percentage of total
species (%)
鹅膏菌科Amanitaceae 2 11 5.26 鹅膏菌属 Amanita 10 4.78
小菇科 Mycenaceae 2 12 5.74 丝盖伞属 Inocybe 5 2.39
多孔菌科 Polyporaceae 8 14 6.70 蜡蘑属 Laccaria 5 2.39
红菇科 Russulaceae 3 23 11.00 小皮伞属 Marasmius 6 2.87
小菇属 Mycena 11 5.26
光柄菇属 Pluteus 5 2.39
红菇属 Russula 17 8.13
栓菌属 Trametes 5 2.39
关闭全屏