Article(id=1206288140143231997, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1206288129569387042, articleNumber=1671-1807(2025)11-0008-09, orderNo=null, doi=null, pmid=null, cstr=null, oa=null, hot=null, price=null, onlineType=0, articleFormat=0, articleType=null, articleTypeStr=research-article, receivedDate=1734451200000, receivedDateStr=2024-12-18, revisedDate=null, revisedDateStr=null, acceptedDate=null, acceptedDateStr=null, onlineDate=1765531104360, onlineDateStr=2025-12-12, pubDate=1749484800000, pubDateStr=2025-06-10, doiRegisterDate=null, doiRegisterDateStr=null, onlineIssueDate=1765531104360, onlineIssueDateStr=2025-12-12, onlineJustAcceptDate=null, onlineJustAcceptDateStr=null, onlineFirstDate=null, onlineFirstDateStr=null, sourceXml=null, magXml=null, createTime=1765531104360, creator=13701087609, updateTime=1765531104360, updator=13701087609, issue=Issue{id=1206288129569387042, tenantId=1146029695717560320, journalId=1146123222451335185, year='2025', volume='25', issue='11', pageStart='1', pageEnd='389', issueExtLink='null', onlineDate='null', pubDate='null', beforeIssueId=null, nextIssueId=null, price=null, status=1, issueComplete=1, articleOrder=1, issueType=-1, specialIssue=null, createTime=1765531101838, creator=13701087609, updateTime=1765531429788, updator=13701087609, preIssue=null, nextIssue=null, ext={EN=IssueExt(id=1206289505120744207, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1206288129569387042, language=EN, specialIssueTitle=, coverIllustrator=null, specialIssueEditor=, specialIssueAbout=), CN=IssueExt(id=1206289505120744208, tenantId=1146029695717560320, journalId=1146123222451335185, issueId=1206288129569387042, language=CN, specialIssueTitle=, coverIllustrator=null, specialIssueEditor=, specialIssueAbout=)}, issueFiles=null}, startPage=8, endPage=16, ext={EN=ArticleExt(id=1206288141007257678, articleId=1206288140143231997, tenantId=1146029695717560320, journalId=1146123222451335185, language=EN, title=Dimensionality Reduction Comparison Based on Stock Prediction Model LSTM, columnId=1151876674645226399, journalTitle=Science Technology and Industry, columnName=Technology Innovation, runingTitle=null, highlight=null, articleAbstract=

Quantitative models are one of the core challenges for investors in stock dynamic prediction. The original LSTM(long short-term memory) stock prediction model was affected by noise in the input data, which interfered with the prediction effect. In this paper, there are 259 indicators that affect stock prices. Firstly, the input data was reduced in dimensionality using dimensionality reduction methods to preserve key information, and then input into LSTM to form an improved prediction model, namely PCA-LSTM model, ISOMAP-LSTM model, and PCA-ISOMAP-LSTM model. Through empirical comparison, compared with the original LSTM prediction model and the attention mechanism model MHA-LSTM, the PCA-LSTM model and ISOMAP-LSTM model reduce training time. The average absolute error (MAE), average relative error (MAPE), and root mean square error (RMSE) in the prediction error evaluation indicators are significantly reduced, and the average rise and fall accuracy (ARRF) is significantly improved. However, the PCA-ISOMAP-LSTM model has an increase in error rate and a certain decrease in accuracy. The Diebold Mariano test also showed that the PCA-LSTM model and ISOMAP-LSTM model have stronger stock prediction abilities than the original LSTM model and MHA-LSTM model, while the PCA-ISOMAP-LSTM model and MHA-LSTM model have weaker prediction abilities than the original LSTM model. The difference in prediction accuracy between the PCA-LSTM and ISOMAP-LSTM models is not significant, and both can be used as a new technical support for quantitative stock investment.

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=null, magXml=null, pdfUrl=null, pdf=null, pdfFileSize=null, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=null, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=null, mapNumber=null, authorCompany=null, fund=null, authors=null, authorsList=Zhiyuan MA), CN=ArticleExt(id=1206288144358506817, articleId=1206288140143231997, tenantId=1146029695717560320, journalId=1146123222451335185, language=CN, title=基于股票预测模型LSTM的降维比较, columnId=1151876674787832737, journalTitle=科技和产业, columnName=科技创新, runingTitle=null, highlight=null, articleAbstract=

量化模型是投资者挑战股票动态预测的核心之一,原始LSTM(长短期记忆网络)股票预测模型由于输入的数据存在噪声,干扰了预测效果。针对影响股价的因子有259项指标,先用降维方法对输入数据进行降维,保留了关键信息,再输入LSTM,组成改进的预测模型,即PCA-LSTM(主成分分析-长短期记忆网络)模型、ISOMAP-LSTM(等距映射-长短期记忆网络)模型与PCA-ISOMAP-LSTM模型。通过实证对比,相较于原始LSTM预测模型和注意力机制模型(MHA-LSTM),PCA-LSTM模型与ISOMAP-LSTM模型减少了训练时间,预测误差评估指标中平均绝对误差(MAE),平均相对误差(MAPE),均方根误差(RMSE)都有显著降低,平均涨跌准确率(ARRF)有显著提高,但PCA-ISOMAP-LSTM模型误差率有所增长,准确率有一定降低。Diebold-Mariano检验也表明,PCA-LS TM模型、ISOMAP-LSTM模型股票预测能力都强于原始LSTM模型和MHA-LSTM,而PCA-ISOMAP-LSTM模型和MHA-LSTM模型均比原始LSTM模型预测能力弱,PCA-LSTM与ISOMAP-LSTM两种模型预测精度差异不显著,都可作为股票量化投资的一种新的技术支持。

, correspAuthors=null, authorNote=null, correspAuthorsNote=null, copyrightStatement=null, copyrightOwner=null, extLink=null, articleAbsUrl=null, sourceXml=Ev73W1VcgoPm//yii2oGdg==, magXml=5bdO8rEzm6JPXwD1K8DwvQ==, pdfUrl=null, pdf=xN2IxXsGRMMsj3RyTvAp6w==, pdfFileSize=3496322, pdfExtLink=null, richHtmlUrl=null, mobilePdfUrl=null, reviewReport=null, pdfFirstPage=null, abstractGraph=a45WotaZYh103YWXOmnMGw==, abstractGraphContent=null, abstractVideo=null, citation=null, cebUrl=null, magXmlContent=pXYG8gSKbIM5P87bn41Rww==, mapNumber=null, authorCompany=null, fund=null, authors=

马致远(1971—),男,四川宜宾人,硕士,讲师,研究方向为人工神经网络与数值计算。

, authorsList=马致远)}, authors=[Author(id=1207055641437356561, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1207055641647071780, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, authorId=1207055641437356561, language=EN, stringName=Zhiyuan MA, firstName=Zhiyuan, middleName=null, lastName=MA, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=The Engineering & Technical College of Chengdu University of Technology, Leshan 614007, Sichuan, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1207055641785483820, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, authorId=1207055641437356561, language=CN, stringName=马致远, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=成都理工大学工程技术学院, 四川 乐山 614007, bio={"content":"

马致远(1971—),男,四川宜宾人,硕士,讲师,研究方向为人工神经网络与数值计算。

"}, bioImg=null, bioContent=

马致远(1971—),男,四川宜宾人,硕士,讲师,研究方向为人工神经网络与数值计算。

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1207055641223447050, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, xref=null, ext=[AuthorCompanyExt(id=1207055641231835657, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, companyId=1207055641223447050, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=The Engineering & Technical College of Chengdu University of Technology, Leshan 614007, Sichuan, China), AuthorCompanyExt(id=1207055641244418571, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, companyId=1207055641223447050, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=成都理工大学工程技术学院, 四川 乐山 614007)])])], keywords=[Keyword(id=1207055643148632640, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, orderNo=1, keyword=dimensionality reduction), Keyword(id=1207055643278656071, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, orderNo=2, keyword=principal component analysis), Keyword(id=1207055643442233939, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, orderNo=3, keyword=ISOMAP(isometric mapping)), Keyword(id=1207055643542897242, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, orderNo=4, keyword=LSTM(long short-term memory)), Keyword(id=1207055643685503589, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, orderNo=5, keyword=stock prediction), Keyword(id=1207055643815527024, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, orderNo=6, keyword=attention mechanism), Keyword(id=1207055643941356152, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, orderNo=1, keyword=降维), Keyword(id=1207055644062990978, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, orderNo=2, keyword=主成分分析), Keyword(id=1207055644218180241, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, orderNo=3, keyword=ISOMAP(等距映射)), Keyword(id=1207055644364980888, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, orderNo=4, keyword=LSTM(长短期记忆网络)), Keyword(id=1207055644570501793, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, orderNo=5, keyword=股票预测), Keyword(id=1207055644784411303, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, orderNo=6, keyword=注意力机制)], refs=[Reference(id=1207055652426432623, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2019, volume=34, issue=null, pageStart=100190, pageEnd=null, url=null, language=null, rfNumber=[1], rfOrder=0, authorNames=GANDHMAL D P, KUMAR K, journalName=Compu-ter Science Review, refType=null, unstructuredReference=GANDHMAL D P, KUMAR K. Systematic analysis and review of stock market prediction techniques[J]. Compu-ter Science Review, 2019, 34: 100190., articleTitle=Systematic analysis and review of stock market prediction techniques, refAbstract=null), Reference(id=1207055652564844665, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2020, volume=47, issue=S1, pageStart=467, pageEnd=473, url=null, language=null, rfNumber=[2], rfOrder=1, authorNames=包振山, 郭俊南, 谢源, journalName=计算机科学, refType=null, unstructuredReference=包振山, 郭俊南, 谢源, 等. 基于LSTM-GA的股票价格涨跌预测模型[J]. 计算机科学, 2020, 47(S1): 467-473., articleTitle=基于LSTM-GA的股票价格涨跌预测模型, refAbstract=null), Reference(id=1207055652720033924, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2018, volume=113, issue=null, pageStart=457, pageEnd=480, url=null, language=null, rfNumber=[3], rfOrder=2, authorNames=BAEK Y J, KIM H Y, journalName=Expert Systems with Applications, refType=null, unstructuredReference=BAEK Y J, KIM H Y. Modaugnet: a new forecasting framework for stock market index value with an overfitting prevention LSTM module and a prediction LSTM module[J]. Expert Systems with Applications, 2018, 113: 457-480., articleTitle=Modaugnet: a new forecasting framework for stock market index value with an overfitting prevention LSTM module and a prediction LSTM module, refAbstract=null), Reference(id=1207055652854251661, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2021, volume=35, issue=2, pageStart=282, pageEnd=288, url=null, language=null, rfNumber=[4], rfOrder=3, authorNames=王东, 王霄鹏, 杨川东, journalName=重庆理工大学学报(自然科学), refType=null, unstructuredReference=王东, 王霄鹏, 杨川东. 一种基于主成分LSTM模型在股票预测中的研究[J]. 重庆理工大学学报(自然科学), 2021, 35(2): 282-288., articleTitle=一种基于主成分LSTM模型在股票预测中的研究, refAbstract=null), Reference(id=1207055652954914963, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2022, volume=41, issue=1, pageStart=136, pageEnd=142, url=null, language=null, rfNumber=[5], rfOrder=4, authorNames=李辉, 化金金, 邹波蓉, journalName=河南理工大学学报(自然科学版), refType=null, unstructuredReference=李辉, 化金金, 邹波蓉. 基于RF-LSTM组合模型的股票价格预测[J]. 河南理工大学学报(自然科学版), 2022, 41(1): 136-142., articleTitle=基于RF-LSTM组合模型的股票价格预测, refAbstract=null), Reference(id=1207055653076549792, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2024, volume=24, issue=3, pageStart=210, pageEnd=215, url=null, language=null, rfNumber=[6], rfOrder=5, authorNames=肖田田, journalName=科技和产业, refType=null, unstructuredReference=肖田田. 基于K-means-LSTM模型的证券股价预测[J]. 科技和产业, 2024, 24(3): 210-215., articleTitle=基于K-means-LSTM模型的证券股价预测, refAbstract=null), Reference(id=1207055653185601704, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2024, volume=38, issue=1, pageStart=57, pageEnd=68, url=null, language=null, rfNumber=[7], rfOrder=6, authorNames=范辉, 朱勇丞, 李晋江, journalName=山东工商学院学报, refType=null, unstructuredReference=范辉, 朱勇丞, 李晋江. 基于注意力机制和特征融合的股票预测方法[J]. 山东工商学院学报, 2024, 38(1): 57-68, 76., articleTitle=基于注意力机制和特征融合的股票预测方法, refAbstract=null), Reference(id=1207055653315625136, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2023, volume=null, issue=16, pageStart=77, pageEnd=81, url=null, language=null, rfNumber=[8], rfOrder=7, authorNames=朱瑞琪, 陆佳敏, 陆佳艳, journalName=机电信息, refType=null, unstructuredReference=朱瑞琪, 陆佳敏, 陆佳艳, 等. 一种基于自注意力机制的CNN-BiLSTM非侵入式负荷分解方法研究[J]. 机电信息, 2023(16): 77-81., articleTitle=一种基于自注意力机制的CNN-BiLSTM非侵入式负荷分解方法研究, refAbstract=null), Reference(id=1207055653395316922, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2024, volume=32, issue=19, pageStart=173, pageEnd=177, url=null, language=null, rfNumber=[9], rfOrder=8, authorNames=曹帅, 李晓君, 贺成铭, journalName=电子设计工程, refType=null, unstructuredReference=曹帅, 李晓君, 贺成铭, 等. 基于改进LSTM的电力调度数据预测模型设计与仿真[J]. 电子设计工程, 2024, 32(19): 173-177., articleTitle=基于改进LSTM的电力调度数据预测模型设计与仿真, refAbstract=null), Reference(id=1207055653525340356, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2024, volume=57, issue=9, pageStart=1327, pageEnd=1334, url=null, language=null, rfNumber=[10], rfOrder=9, authorNames=周志轩, 陈仲民, 邓君丽, journalName=武汉大学学报(工学版), refType=null, unstructuredReference=周志轩, 陈仲民, 邓君丽. 基于压缩感知和深度学习的农产品价格预测[J]. 武汉大学学报(工学版), 2024, 57(9): 1327-1334., articleTitle=基于压缩感知和深度学习的农产品价格预测, refAbstract=null), Reference(id=1207055653634392268, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2023, volume=9, issue=1, pageStart=26, pageEnd=null, url=null, language=null, rfNumber=[11], rfOrder=10, authorNames=HTUN H H, BIEHL M, PETKOV N, journalName=Financial Innovation, refType=null, unstructuredReference=HTUN H H, BIEHL M, PETKOV N. Survey of feature selection and extraction techniques for stock market prediction[J]. Financial Innovation, 2023, 9(1): 26., articleTitle=Survey of feature selection and extraction techniques for stock market prediction, refAbstract=null), Reference(id=1207055653768610004, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2000, volume=290, issue=null, pageStart=2319, pageEnd=2323, url=null, language=null, rfNumber=[12], rfOrder=11, authorNames=TENENBAUM J B, SILVA V D, LANGFORD J C, journalName=Science, refType=null, unstructuredReference=TENENBAUM J B, SILVA V D, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290: 2319-2323., articleTitle=A global geometric framework for nonlinear dimensionality reduction, refAbstract=null), Reference(id=1207055653911216350, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, doi=null, pmid=null, pmcid=null, year=2015, volume=24, issue=3, pageStart=210, pageEnd=215, url=null, language=null, rfNumber=[13], rfOrder=12, authorNames=MALHOTRA P, VIG L, SHROFF G, journalName=Computational Intelligence and Machine Learning, refType=null, unstructuredReference=MALHOTRA P, VIG L, SHROFF G, et al. Long short term memory networks for anomaly detection in time series[J]. Computational Intelligence and Machine Learning, 2015, 24(3): 210-215., articleTitle=Long short term memory networks for anomaly detection in time series, refAbstract=null)], funds=[Fund(id=1207055652225106010, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, awardId=22GZD031, language=CN, fundingSource=乐山市科技局项目(22GZD031), fundOrder=null, country=null)], companyList=[AuthorCompany(id=1207055641223447050, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, xref=null, ext=[AuthorCompanyExt(id=1207055641231835657, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, companyId=1207055641223447050, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=The Engineering & Technical College of Chengdu University of Technology, Leshan 614007, Sichuan, China), AuthorCompanyExt(id=1207055641244418571, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, companyId=1207055641223447050, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=成都理工大学工程技术学院, 四川 乐山 614007)])], figs=[ArticleFig(id=1207055645136732863, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=yfI2jNh8l2lUP6DQXuyatg==, figureFileBig=5J/ORA4KCpGdAkA6EUD+EQ==, tableContent=null), ArticleFig(id=1207055645266756301, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图1, caption=LSTM网络结构图

x t为当前时间步的输入向量; h t - 1为上一时间步的隐含层输出; c t - 1为上一时间步的长期记忆; f t为遗忘门; i t为输入门; c ˜ t为当前输入的新信息; c t为当前时间步的细胞状态; o t为输出门; h t为当前时间步的隐藏状态; σ为Sigmoid激活函数,将值压缩到 0,1

, figureFileSmall=yfI2jNh8l2lUP6DQXuyatg==, figureFileBig=5J/ORA4KCpGdAkA6EUD+EQ==, tableContent=null), ArticleFig(id=1207055645522608862, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=bqyf8oHGtfWxoiPUssaCBQ==, figureFileBig=ec26AL3A9cIdjKtx2cDIiQ==, tableContent=null), ArticleFig(id=1207055645757489903, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图2, caption=主成分方差累积贡献率, figureFileSmall=bqyf8oHGtfWxoiPUssaCBQ==, figureFileBig=ec26AL3A9cIdjKtx2cDIiQ==, tableContent=null), ArticleFig(id=1207055645904290551, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=Tl+ogFoyFzt0gjGu1vpqfw==, figureFileBig=wYub9CTsxl+WdJa+gFF9GA==, tableContent=null), ArticleFig(id=1207055646105617155, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图3, caption=原始LSTM模型预测曲线, figureFileSmall=Tl+ogFoyFzt0gjGu1vpqfw==, figureFileBig=wYub9CTsxl+WdJa+gFF9GA==, tableContent=null), ArticleFig(id=1207055646239834896, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=EX8U1cZOcU20Ml6GnjDURg==, figureFileBig=J+EPnduwkUWunYtNRKy0CA==, tableContent=null), ArticleFig(id=1207055647472960281, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图4, caption=MAH-LSTM模型预测曲线, figureFileSmall=EX8U1cZOcU20Ml6GnjDURg==, figureFileBig=J+EPnduwkUWunYtNRKy0CA==, tableContent=null), ArticleFig(id=1207055647649121065, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=2HRx1oR3pAn8lCNLNZ7Lsg==, figureFileBig=BR4+km29bwB0E4OC9FG4Ag==, tableContent=null), ArticleFig(id=1207055647787533108, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图5, caption=PCA-LSTM模型预测曲线图, figureFileSmall=2HRx1oR3pAn8lCNLNZ7Lsg==, figureFileBig=BR4+km29bwB0E4OC9FG4Ag==, tableContent=null), ArticleFig(id=1207055647934333764, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=iYwWpy5h87WmtF7nnjApNw==, figureFileBig=nVHf7GGKAj3/uccSdqALDg==, tableContent=null), ArticleFig(id=1207055648114688853, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图6, caption=ISOMAP-LSTM模型预测曲线, figureFileSmall=iYwWpy5h87WmtF7nnjApNw==, figureFileBig=nVHf7GGKAj3/uccSdqALDg==, tableContent=null), ArticleFig(id=1207055648236323682, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=H0UyefjIyKSQ7LeTTzUMWg==, figureFileBig=ZagakeTxnzFQb2BW7Kis7g==, tableContent=null), ArticleFig(id=1207055648332792684, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=图7, caption=PCA-ISOMAP-LSTM模型预测曲线, figureFileSmall=H0UyefjIyKSQ7LeTTzUMWg==, figureFileBig=ZagakeTxnzFQb2BW7Kis7g==, tableContent=null), ArticleFig(id=1207055648437650297, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
序号 ts_code trade_date open open_hfq open_qfq high high_hfq
0 600000.SH 2023-05-04 7.48 111.184 9 6.903 71 7.75 115.198 33
1 600000.SH 2023-04-28 7.47 111.036 3 6.894 48 7.65 113.711 90
2 600000.SH 2023-04-27 7.48 111.184 9 6.903 71 7.51 111.630 89
3 600000.SH 2023-04-26 7.56 112.374 1 6.977 55 7.56 112.374 11
700 600000.SH 2020-05-06 10.44 132.729 9 8.241 49 10.49 133.366 10
), ArticleFig(id=1207055648555090820, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表1, caption=

股票基础数据

, figureFileSmall=null, figureFileBig=null, tableContent=
序号 ts_code trade_date open open_hfq open_qfq high high_hfq
0 600000.SH 2023-05-04 7.48 111.184 9 6.903 71 7.75 115.198 33
1 600000.SH 2023-04-28 7.47 111.036 3 6.894 48 7.65 113.711 90
2 600000.SH 2023-04-27 7.48 111.184 9 6.903 71 7.51 111.630 89
3 600000.SH 2023-04-26 7.56 112.374 1 6.977 55 7.56 112.374 11
700 600000.SH 2020-05-06 10.44 132.729 9 8.241 49 10.49 133.366 10
), ArticleFig(id=1207055648697697163, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
指标维度 指标名称 指标代号
行情因
素指标
开盘价 open
最高价 high
最低价 low
收盘价 close
涨跌额 change
涨跌幅 pct_chg
成交量/手 vol
成交额/千元 amount
换手率/% turnover_rate
换手率(自由流通股) turnover_rate_f
量比 volume_ratio
基本面
指标
市盈率(总市值/净利润,亏损的PE为空) pe
市盈率(TTM,亏损的PE为空) pe_ttm
市净率(总市值/净资产) pb
市销率 ps
市销率(TTM) ps_ttm
股息率/% dv_ratio
股息率(TTM)/% dv_ttm
总股本/万股 total_share
流通股本/万股 float_share
自由流通股本/万元 free_share
总市值/万元 total_mv
流通市值/万元 circ_mv
技术面
指标
振动指标 振动升降指标 asi
真实波动平均值 atr
波动指标 简易波动指标 emv
梅斯线 mass,ma_mass
平行线差指标 dfma_difma
趋向指标 连跌天数 downdays
连涨天数 updays
指数移动平均 ema_5,ema_10,ema_20,ema_30,ema_60,ema_90,ema_250
EMA指数平均数指标 expma_12,expma_50
三重指数平滑平均线 trix,trma
反趋向指标 MACD指标 macd,macd_dea,macd_dif
区间震荡线 dpo,madpo
BIAS乖离率 bias1,bias2,bias3
动量指标 mtm,mtmma
RSI指标 rsi_6,rsi_12,rsi_24
KDJ指标 kdj,kdj_d,kdj_k
情绪指标 BRAR情绪指标 brar_ar,brar_br
投资者对股市涨跌产生心理波动的情绪指标 psy,psyma
压力支
撑指标
肯特纳交易通道 ktn,ktn_mid,ktn_upper
薛斯通道II xsii_td1,xsii_td2,xsii_td3
成交量
指标
能量潮指标 obv
VR容量比率 vr
MFI指标 mfi
), ArticleFig(id=1207055648903218075, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表2, caption=

股票多维度因子

, figureFileSmall=null, figureFileBig=null, tableContent=
指标维度 指标名称 指标代号
行情因
素指标
开盘价 open
最高价 high
最低价 low
收盘价 close
涨跌额 change
涨跌幅 pct_chg
成交量/手 vol
成交额/千元 amount
换手率/% turnover_rate
换手率(自由流通股) turnover_rate_f
量比 volume_ratio
基本面
指标
市盈率(总市值/净利润,亏损的PE为空) pe
市盈率(TTM,亏损的PE为空) pe_ttm
市净率(总市值/净资产) pb
市销率 ps
市销率(TTM) ps_ttm
股息率/% dv_ratio
股息率(TTM)/% dv_ttm
总股本/万股 total_share
流通股本/万股 float_share
自由流通股本/万元 free_share
总市值/万元 total_mv
流通市值/万元 circ_mv
技术面
指标
振动指标 振动升降指标 asi
真实波动平均值 atr
波动指标 简易波动指标 emv
梅斯线 mass,ma_mass
平行线差指标 dfma_difma
趋向指标 连跌天数 downdays
连涨天数 updays
指数移动平均 ema_5,ema_10,ema_20,ema_30,ema_60,ema_90,ema_250
EMA指数平均数指标 expma_12,expma_50
三重指数平滑平均线 trix,trma
反趋向指标 MACD指标 macd,macd_dea,macd_dif
区间震荡线 dpo,madpo
BIAS乖离率 bias1,bias2,bias3
动量指标 mtm,mtmma
RSI指标 rsi_6,rsi_12,rsi_24
KDJ指标 kdj,kdj_d,kdj_k
情绪指标 BRAR情绪指标 brar_ar,brar_br
投资者对股市涨跌产生心理波动的情绪指标 psy,psyma
压力支
撑指标
肯特纳交易通道 ktn,ktn_mid,ktn_upper
薛斯通道II xsii_td1,xsii_td2,xsii_td3
成交量
指标
能量潮指标 obv
VR容量比率 vr
MFI指标 mfi
), ArticleFig(id=1207055649054213029, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=

初始特征值 提取载荷平方和
合计 方差百分
比/%
累积百分
率/%
合计 方差百分
比/%
累积百分
率/%
1 113.591 44.028 44.028 113.591 44.028 44.028
2 67.223 26.055 70.083 67.223 26.055 70.083
3 21.069 8.166 78.249 21.069 8.166 78.249
4 10.267 3.980 82.229 10.267 3.980 82.229
5 7.324 2.839 85.068 7.324 2.839 85.068
6 5.608 2.174 87.241 5.608 2.174 87.241
7 4.013 1.555 88.797 4.013 1.555 88.797
8 3.312 1.284 90.080 3.312 1.284 90.080
9 3.206 1.243 91.323 3.206 1.243 91.323
10 2.803 1.087 92.409 2.803 1.087 92.409
11 2.162 0.838 93.248 2.162 0.838 93.248
12 1.565 0.607 93.854 1.565 0.607 93.854
13 1.347 0.522 94.376 1.347 0.522 94.376
14 1.241 0.481 94.858 1.241 0.481 94.858
15 1.090 0.422 95.280 1.090 0.422 95.280
16 1.074 0.416 95.696 1.074 0.416 95.696
17 1.035 0.401 96.097 1.035 0.401 96.097
18 0.875 0.339 96.437
19 0.779 0.302 96.739
20 0.753 0.292 97.030
), ArticleFig(id=1207055649230373815, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表3, caption=

特征值与贡献率

, figureFileSmall=null, figureFileBig=null, tableContent=

初始特征值 提取载荷平方和
合计 方差百分
比/%
累积百分
率/%
合计 方差百分
比/%
累积百分
率/%
1 113.591 44.028 44.028 113.591 44.028 44.028
2 67.223 26.055 70.083 67.223 26.055 70.083
3 21.069 8.166 78.249 21.069 8.166 78.249
4 10.267 3.980 82.229 10.267 3.980 82.229
5 7.324 2.839 85.068 7.324 2.839 85.068
6 5.608 2.174 87.241 5.608 2.174 87.241
7 4.013 1.555 88.797 4.013 1.555 88.797
8 3.312 1.284 90.080 3.312 1.284 90.080
9 3.206 1.243 91.323 3.206 1.243 91.323
10 2.803 1.087 92.409 2.803 1.087 92.409
11 2.162 0.838 93.248 2.162 0.838 93.248
12 1.565 0.607 93.854 1.565 0.607 93.854
13 1.347 0.522 94.376 1.347 0.522 94.376
14 1.241 0.481 94.858 1.241 0.481 94.858
15 1.090 0.422 95.280 1.090 0.422 95.280
16 1.074 0.416 95.696 1.074 0.416 95.696
17 1.035 0.401 96.097 1.035 0.401 96.097
18 0.875 0.339 96.437
19 0.779 0.302 96.739
20 0.753 0.292 97.030
), ArticleFig(id=1207055649402340296, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
指标 主成分1 主成分2 主成分3 主成分17
open 0.093 0.013 -0.005 -0.013
open_hfq 0.093 0.015 0.000 0.004
open_qfq 0.093 0.015 0.000 0.004
high 0.093 0.015 -0.008 -0.014
high_hfq 0.092 0.018 -0.004 0.002
high_qfq 0.092 0.018 -0.004 0.002
low 0.093 0.014 -0.009 -0.013
low_hfq 0.092 0.016 -0.005 0.004
low_qfq 0.092 0.016 -0.005 0.004
close_hfq 0.092 0.018 -0.009 0.007
close_qfq 0.092 0.018 -0.009 0.007
pre_close 0.093 0.013 -0.006 -0.015
change -0.005 0.030 -0.081 0.051
pct_chg -0.004 0.031 -0.083 0.047
), ArticleFig(id=1207055649532363733, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表4, caption=

主成分载荷

, figureFileSmall=null, figureFileBig=null, tableContent=
指标 主成分1 主成分2 主成分3 主成分17
open 0.093 0.013 -0.005 -0.013
open_hfq 0.093 0.015 0.000 0.004
open_qfq 0.093 0.015 0.000 0.004
high 0.093 0.015 -0.008 -0.014
high_hfq 0.092 0.018 -0.004 0.002
high_qfq 0.092 0.018 -0.004 0.002
low 0.093 0.014 -0.009 -0.013
low_hfq 0.092 0.016 -0.005 0.004
low_qfq 0.092 0.016 -0.005 0.004
close_hfq 0.092 0.018 -0.009 0.007
close_qfq 0.092 0.018 -0.009 0.007
pre_close 0.093 0.013 -0.006 -0.015
change -0.005 0.030 -0.081 0.051
pct_chg -0.004 0.031 -0.083 0.047
), ArticleFig(id=1207055649687552989, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
模型 参数设置
LSTM optimizer=adam, dropout=0.1,epochs=200,batch_size=60
units=10, time_step=12,num_layers=2
PCA-LSTM optimizer=adam,dropout=0.05,epochs=150,batch_size=80, units=80, time_step=12, num_layers=2
ISOMAP-LSTM optimizer=adam, dropout=0.08,epochs=150,batch_size=80,units=80, time_step=12, num_layers=2
PCA-ISOMAP-LSTM optimizer=adam, dropout=0.05,epochs=400,batch_size=16
units=20, time_step=12, num_layers=2
), ArticleFig(id=1207055649893073900, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表5, caption=

4种模型的训练参数设置

, figureFileSmall=null, figureFileBig=null, tableContent=
模型 参数设置
LSTM optimizer=adam, dropout=0.1,epochs=200,batch_size=60
units=10, time_step=12,num_layers=2
PCA-LSTM optimizer=adam,dropout=0.05,epochs=150,batch_size=80, units=80, time_step=12, num_layers=2
ISOMAP-LSTM optimizer=adam, dropout=0.08,epochs=150,batch_size=80,units=80, time_step=12, num_layers=2
PCA-ISOMAP-LSTM optimizer=adam, dropout=0.05,epochs=400,batch_size=16
units=20, time_step=12, num_layers=2
), ArticleFig(id=1207055650048263161, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
评估指标 评估指标公式
平均绝对误差 M A E = 1 l j = 1 l y j - y ^ j
平均相对误差 M A P E = 1 l j = 1 l y j - y ^ j y j
均方根误差 R M S E = 1 l j = 1 l ( y j - y ^ j ) 2
平均涨跌准确率 A R R F = 1 m i = 1 m a i , a i = 1 , ( y ^ i + 1 - y ^ i ) ( y i + 1 - y i ) 0 0 ,
), ArticleFig(id=1207055650186674185, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表6, caption=

评估指标公式对照

, figureFileSmall=null, figureFileBig=null, tableContent=
评估指标 评估指标公式
平均绝对误差 M A E = 1 l j = 1 l y j - y ^ j
平均相对误差 M A P E = 1 l j = 1 l y j - y ^ j y j
均方根误差 R M S E = 1 l j = 1 l ( y j - y ^ j ) 2
平均涨跌准确率 A R R F = 1 m i = 1 m a i , a i = 1 , ( y ^ i + 1 - y ^ i ) ( y i + 1 - y i ) 0 0 ,
), ArticleFig(id=1207055650312503317, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
模型 网络结构 训练时间/s MAE MAPE RMSE ARRF
LSTM 258-20-1 209.00 0.131 0 0.018 2 0.170 6 0.637 2
MHA-LSTM 16-64-1 69.00 0.143 1 0.020 5 0.183 0 0.720 9
PCA-LSTM 17-20-1 87.38 0.081 3 0.011 0 0.098 6 0.748 8
ISOMAP-LSTM 17-20-1 90.00 0.128 4 0.018 4 0.161 5 0.730 2
PCA-ISOMAP-LSTM 17-20-1 119.00 0.151 6 0.021 6 0.191 3 0.683 7
), ArticleFig(id=1207055650446721061, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表7, caption=

5种LSTM模型的性能

, figureFileSmall=null, figureFileBig=null, tableContent=
模型 网络结构 训练时间/s MAE MAPE RMSE ARRF
LSTM 258-20-1 209.00 0.131 0 0.018 2 0.170 6 0.637 2
MHA-LSTM 16-64-1 69.00 0.143 1 0.020 5 0.183 0 0.720 9
PCA-LSTM 17-20-1 87.38 0.081 3 0.011 0 0.098 6 0.748 8
ISOMAP-LSTM 17-20-1 90.00 0.128 4 0.018 4 0.161 5 0.730 2
PCA-ISOMAP-LSTM 17-20-1 119.00 0.151 6 0.021 6 0.191 3 0.683 7
), ArticleFig(id=1207055650685796401, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=EN, label=null, caption=null, figureFileSmall=null, figureFileBig=null, tableContent=
模型1 模型2 DM统计量 P
原始LSTM PCA-LSTM 5.174 15 9×10-7
原始LSTM ISOMAP-LSTM 5.883 27 4×10-6
原始LSTM PCA-ISOMAP-LSTM -4.378 00 3×10-5
原始LSTM MAH-LSTM -6.861 00 4×10-10
PCA-LSTM ISOMAP-LSTM 1.561 70 0.121
PCA-LSTM PCA-ISOMAP-LSTM -7.313 00 3×10-11
PCA-LSTM MAH-LSTM -9.254 20 1×10-13
ISOMAP-LSTM MAH-LSTM -10.917 00 2×10-13
ISOMAP-LSTM PCA-ISOMAP-LSTM -8.800 00 1.3×10-13
), ArticleFig(id=1207055650828402752, tenantId=1146029695717560320, journalId=1146123222451335185, articleId=1206288140143231997, language=CN, label=表8, caption=

MAE的DM检验结果

, figureFileSmall=null, figureFileBig=null, tableContent=
模型1 模型2 DM统计量 P
原始LSTM PCA-LSTM 5.174 15 9×10-7
原始LSTM ISOMAP-LSTM 5.883 27 4×10-6
原始LSTM PCA-ISOMAP-LSTM -4.378 00 3×10-5
原始LSTM MAH-LSTM -6.861 00 4×10-10
PCA-LSTM ISOMAP-LSTM 1.561 70 0.121
PCA-LSTM PCA-ISOMAP-LSTM -7.313 00 3×10-11
PCA-LSTM MAH-LSTM -9.254 20 1×10-13
ISOMAP-LSTM MAH-LSTM -10.917 00 2×10-13
ISOMAP-LSTM PCA-ISOMAP-LSTM -8.800 00 1.3×10-13
)], attaches=null, journal=Journal(id=1146119232468656133, delFlag=0, nameCn=科技和产业, nameEn=Science Technology and Industry, nameHistory1=null, nameHistory2=null, issn=1671-1807, eissn=, cn=11-4671/T, coden=null, periodic=3, language=CN, oaType=是, ccby=null, superviseOffice=null, ownerOffice=null, pubOffice=null, editorOffice=null, officeType=null, aims=null, clcCode=null, officeProv=null, officeCity=null, officeAddr=null, officeZip=null, officeEmail=null, officePhone=null, editDirector=null, officeDirector=null, officeDirectorPhone=null, officeStaffNum=null, officeEmpNum=null, coverPicUrl=65omA9nasEwsJtKyya4q2A==, journalPrice=null, startedYear=null, abbrevIsoEn=Sci Technol Ind, journalRemark=null, publicationField=null, createdTime=null, updatedTime=1755589264235, createdBy=null, updatedBy=15831073675, firstLetterCn=S, firstLetterEn=S, subjectCode=Engineering, subjectName=工程, subjectCodeEn=Engineering, subjectNameEn=null, picCn=65omA9nasEwsJtKyya4q2A==, picEn=/wwFtLNQXxKpecNSjAf1AQ==, jcr=null, cjcr=null, exts=[JournalExt(id=1164589040427811221, language=CN, name=科技和产业, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264256, updatedTime=1755589264256, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=http://www.kjhcy.org/kjycy/site/menu/20110121105642001, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""}), JournalExt(id=1164589040473948566, language=EN, name=Science Technology and Industry, nameHistory1=null, nameHistory2=null, managedBy=, sponsoredBy=, publishedBy=, editorOffice=, officeProv=null, officeCity=null, officeAddr=, officeZip=, editDirector=null, officeDirector=null, officePhone=null, coverPicUrl=null, journalRemark=, submitArticleUrl=null, websiteUrl=http://www.kjhcy.org/kjycy/home, createdTime=1755589264267, updatedTime=1755589264267, createdBy=15831073675, updatedBy=15831073675, submissionGuidelinesUrl=, submissionAuthorUrl=http://www.kjhcy.org/kjycy/author/login, submissionEditorUrl=http://www.kjhcy.org/kjycy/editor/login, submissionReviewUrl=http://www.kjhcy.org/kjycy/user/login, submissionCeEditorUrl=, submissionAeEditorUrl=, option={"copyright":""})], databaseList=null, tenantJournalId=1146123222451335185, websiteList=[Website(id=1148243202395595182, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/CN, language=CN, createTime=1751692112778, createBy=18614031015, updateTime=1753522130587, updateBy=18614031015, name=科技和产业-中文站点, tplId=1146099689490845704, title=科技和产业, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919343281103033, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=articleTextType, value=kx, createTime=1753522247381, updateTime=1753522247381, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343260131510, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=banner, value=null, createTime=1753522247376, updateTime=1753522247376, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343251742901, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522247374, updateTime=1753522247374, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343272714424, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522247379, updateTime=1753522247379, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919343268520119, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1148243202395595182, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522247378, updateTime=1753522247378, creator=18614031015, updator=18614031015)]), Website(id=1155919131955314719, webName=null, webTitle=null, webDomain=null, webCopyrigh=null, webIpcNo=null, seoTitle=null, seoKeywords=null, seoDescription=null, tenantJournalId=null, journalId=1146123222451335185, journalNameCn=null, journalNameEn=null, grayFlag=null, tenantId=1146029695717560320, platformId=null, journalGroupId=null, journalGroupNameCn=null, journalGroupNameEn=null, type=1, domain=https://castjournals.cast.org.cn/joweb/kjhcy/EN, language=EN, createTime=1753522197002, createBy=18614031015, updateTime=1753522207756, updateBy=18614031015, name=科技和产业-英文站点, tplId=1146101810881728533, title=Science Technology and Industry, delFlag=0, indexPage=/home, props=[WebsiteProps(id=1155919498877194448, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=articleTextType, value=kx, createTime=1753522284478, updateTime=1753522284478, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498860417229, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=banner, value=null, createTime=1753522284474, updateTime=1753522284474, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498852028620, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=logo, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic?fileId=NeDGaoVSnAwTO5bjjrifjg==, createTime=1753522284472, updateTime=1753522284472, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498873000143, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=picServerUrl, value=https://castjournals.cast.org.cn/joweb/kjdb/CN/file/pic, createTime=1753522284477, updateTime=1753522284477, creator=18614031015, updator=18614031015), WebsiteProps(id=1155919498864611534, tenantId=1146029695717560320, journalId=null, journalGroupId=null, siteId=1155919131955314719, code=staticResourcePath, value=https://castjournals.cast.org.cn/joweb/cast_kjdb_cn_619/, createTime=1753522284476, updateTime=1753522284476, creator=18614031015, updator=18614031015)])], journalTitle=科技和产业, weixinUrl=null, journalUrl=null, iacademicId=null, status=0, seqNo=null, journalTitleEn=Science Technology and Industry, journalPhotoCn=65omA9nasEwsJtKyya4q2A==, journalPhotoEn=/wwFtLNQXxKpecNSjAf1AQ==, journalFirstLetter=S, journalRecommend=null, journalNew=null, journalCollection=null, jcrJf=null, cjcrJf=null, jcrJfStr=null, cjcrJfStr=null, submissionFirstDecision=null, sciSubjectClassification=null, casSubjectClassification=null, citeScore=null, totalCitationFrequency=null, icpCode=null, psCode=null, advertisingLicenseCode=null, copyrightInformation=null, country=null, option=, provinceCode=null, provinceName=null, collectFlag=false), detailUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/Y2025/V25/I11/8, detailUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/Y2025/V25/I11/8, pdfUrlCn=https://castjournals.cast.org.cn/joweb/kjhcy/CN/PDF/Y2025/V25/I11/8, pdfUrlEn=https://castjournals.cast.org.cn/joweb/kjhcy/EN/PDF/Y2025/V25/I11/8, aliStartDate=null, aliEndDate=null, collectionFlag=false, citedCount=null, citedUrl=null, reference=null)
收藏切换
基于股票预测模型LSTM的降维比较
收藏切换
PDF下载
马致远
科技和产业 | 科技创新 2025,25(11): 8-16
收起
收藏切换
科技和产业 | 科技创新 2025, 25(11): 8-16
基于股票预测模型LSTM的降维比较
全屏
马致远
作者信息
  • 成都理工大学工程技术学院, 四川 乐山 614007
  • 马致远(1971—),男,四川宜宾人,硕士,讲师,研究方向为人工神经网络与数值计算。

Dimensionality Reduction Comparison Based on Stock Prediction Model LSTM
Zhiyuan MA
Affiliations
  • The Engineering & Technical College of Chengdu University of Technology, Leshan 614007, Sichuan, China
出版时间: 2025-06-10
文章导航
收藏切换

量化模型是投资者挑战股票动态预测的核心之一,原始LSTM(长短期记忆网络)股票预测模型由于输入的数据存在噪声,干扰了预测效果。针对影响股价的因子有259项指标,先用降维方法对输入数据进行降维,保留了关键信息,再输入LSTM,组成改进的预测模型,即PCA-LSTM(主成分分析-长短期记忆网络)模型、ISOMAP-LSTM(等距映射-长短期记忆网络)模型与PCA-ISOMAP-LSTM模型。通过实证对比,相较于原始LSTM预测模型和注意力机制模型(MHA-LSTM),PCA-LSTM模型与ISOMAP-LSTM模型减少了训练时间,预测误差评估指标中平均绝对误差(MAE),平均相对误差(MAPE),均方根误差(RMSE)都有显著降低,平均涨跌准确率(ARRF)有显著提高,但PCA-ISOMAP-LSTM模型误差率有所增长,准确率有一定降低。Diebold-Mariano检验也表明,PCA-LS TM模型、ISOMAP-LSTM模型股票预测能力都强于原始LSTM模型和MHA-LSTM,而PCA-ISOMAP-LSTM模型和MHA-LSTM模型均比原始LSTM模型预测能力弱,PCA-LSTM与ISOMAP-LSTM两种模型预测精度差异不显著,都可作为股票量化投资的一种新的技术支持。

降维  /  主成分分析  /  ISOMAP(等距映射)  /  LSTM(长短期记忆网络)  /  股票预测  /  注意力机制

Quantitative models are one of the core challenges for investors in stock dynamic prediction. The original LSTM(long short-term memory) stock prediction model was affected by noise in the input data, which interfered with the prediction effect. In this paper, there are 259 indicators that affect stock prices. Firstly, the input data was reduced in dimensionality using dimensionality reduction methods to preserve key information, and then input into LSTM to form an improved prediction model, namely PCA-LSTM model, ISOMAP-LSTM model, and PCA-ISOMAP-LSTM model. Through empirical comparison, compared with the original LSTM prediction model and the attention mechanism model MHA-LSTM, the PCA-LSTM model and ISOMAP-LSTM model reduce training time. The average absolute error (MAE), average relative error (MAPE), and root mean square error (RMSE) in the prediction error evaluation indicators are significantly reduced, and the average rise and fall accuracy (ARRF) is significantly improved. However, the PCA-ISOMAP-LSTM model has an increase in error rate and a certain decrease in accuracy. The Diebold Mariano test also showed that the PCA-LSTM model and ISOMAP-LSTM model have stronger stock prediction abilities than the original LSTM model and MHA-LSTM model, while the PCA-ISOMAP-LSTM model and MHA-LSTM model have weaker prediction abilities than the original LSTM model. The difference in prediction accuracy between the PCA-LSTM and ISOMAP-LSTM models is not significant, and both can be used as a new technical support for quantitative stock investment.

dimensionality reduction  /  principal component analysis  /  ISOMAP(isometric mapping)  /  LSTM(long short-term memory)  /  stock prediction  /  attention mechanism
马致远. 基于股票预测模型LSTM的降维比较. 科技和产业, 2025 , 25 (11) : 8 -16 .
Zhiyuan MA. Dimensionality Reduction Comparison Based on Stock Prediction Model LSTM[J]. Science Technology and Industry, 2025 , 25 (11) : 8 -16 .
股票市场的复杂性源于其动态性和不确定性,受众多因素如宏观经济环境、公司业绩、政策变动等影响,使得动态预测股价极具挑战性[1]。随着人工智能和大数据技术的发展,投资者普遍希望找到准确率高的量化模型帮助投资,因此量化模型是投资者进行成功投资的核心之一。深度学习技术,尤其是长短期记忆网络(long short-term memory,LSTM)因其强大的时间序列建模能力,适合处理和预测时间序列中间隔和延迟相对较长的情况,这一技术特征与股票预测问题有着很高的契合度[2]。随着股票市场信息量的不断增加,股票行情越来越难预测,维度冗余可能导致预测模型效率低下和泛化能力下降,研究者趋向于用数据降维算法与LSTM模型的组合研究[3]。王东等[4]先利用主成分分析法(principal components analysis,PCA)对股票行情基础数据进行降维,再结合一些股票技术指标作为LSTM的输入变量,减少了LSTM模型的输入维度,实验结果表明降低训练时间的同时提高了预测精度;李辉等[5]通过随机森林(RF)选择最优特征集,降低数据维度和训练复杂度,再利用LSTM模型对股票进行预测,实验结果表明组合模型预测的误差有明显的降低;肖田田[6]构建了一种混合深度模型K-means-LSTM来提高股票预测性能;范辉等[7]使用了多头注意力机制提取了股票特征,再由全连接层预测股票,实验表明注意力机制有一定的效果;朱瑞琪等[8]在LSTM中引入自注意力机制(self-attention)解决了其在处理长序列时的全局建模和多维向量间复杂交互关系不足的问题;曹帅等[9]在电力数据调度模型中引入Attention机制,提升网络的特征提取能力。周志轩等[10]采用压缩感知(CS)与LSTM相结合的模型,预测农产品价格趋势,预测精度较高。研究表明,LSTM神经网络对股票进行预测时,数据降维、注意力机制与压缩感知(CS)都是一种有效的数据预处理手段,可以降低模型复杂度的同时提升模型效果,去除噪声,同时保留关键信息,这对于提升模型的预测精度和稳定性具有重要意义。本文深入分析主成分分析法(PCA)与等距映射(ISOMAP)两种降维方法提取数据特征,与注意力机制提取数据特征对比,并通过实证研究来验证这些方法在股票预测中的实际效果,体现降维技术在优化LSTM模型在股票预测中的作用。
在股票预测中,降维可以帮助缓解过拟合,提高模型的泛化能力,同时降低计算成本,使得LSTM模型在大规模数据集上更加高效[11]。尽管降维在股票预测领域的潜力已经得到了初步探索,但大部分探索都是单一降维方法与LSTM模型的结合,对多种降维方法与LSTM模型相结合,探索在各种方法中研究其效果差异,从而选择最合理的降维方法方面研究还较少。本文选择线性降维方法中的主成分分析法,非线性降维方法中的ISOMAP,通过降维提取股票数据中的特征信息,用这些特征信息结合LSTM模型预测股票价格。
通过Python环境下tushare财经数据接口包,获取了所选股票的261项行情数据:股票代码(ts_code)、交易日期(trade_date)、开盘价(open)、前复权开盘价(open_hfq)、后复权开盘价(open_qfq)、后复权最高价(high_hfq)、收盘价(close)、最高价(high)、最低价(low)、换手率(turnover_rate)、涨跌幅度pct_chg、涨跌额change、成交量vol以及成交金额amount等,见表1
LSTM模型需要大量数据训练,模型预测才会更加精确。本文选择浦发银行600000.SH从2020年5月6日到2023年5月4日,每个开盘日共700个行情数据作为LSTM模型的建模训练数据集,选择其中的259项指标因子,见表2
所有指标分为3类:行情因素指标、基本面指标和技术指标,包括开盘价、收盘价、最高价、最低价、换手率、涨跌幅度、涨跌额、成交量、成交金额、市盈率、流通股本、多周期振动升降、真实波动、多空指标(BBI)、乖离率(BIAS)、布林线指标(BOLL)、情绪指标(BRAR)、顺势指标(CCI)、价格动量指标(CR)、平行线差指标、动向指标、连跌天数、连涨天数、区间震荡线、多周期指数移动平均、简单移动平均、随机指标(KDJ)、肯特纳交易通道、异同移动平均线指标(MACD)、梅斯线、股票技术指标(RSI)、动量指标、能量潮指标、投资者对股市涨跌产生心理波动的情绪指标、变动率指标、唐安奇通道(海龟)交易指标、三重指数平滑平均线、容量比率(VR)、威廉指标(W&R)、薛斯通道等,其中有些指标行当前指标,前复权指标,后复权指标,如收盘价包括当日实际收盘价,还有前复权收盘价,后复权收盘价,还有的指标有多个周期,如简单移动平均有5日、10日、20日、30日、60日、90日、250日多周期指标值,用这些指标的T日数据来预测T+1日的收盘价。在经过训练的降维LSTM模型中,选取浦发银行600000.SH从2023年5月6日到2024年4月6日,共220日行情数据为测试数据。
主成分分析法(PCA)[11]通过正交变换将可能相关的变量转换为一组数值较少的线性不相关变量,即主成分,降维的步骤如下。
(1)将原始数据标准化,对股票数据 x i j进行标准化处理。
y i j = x i j - x - j s j ,   i = 1,2 , , n ;   j = 1,2 , , m
式中:$\bar{x}_{j}=\frac{1}{n} \sum_{i=1}^{n} x_{i j} ; s_{j}=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i j}-\bar{x}_{j}\right)^{2}}$;n为股票行情数据总天数; m每个行情数据的指标总数;yij为标准化后的值。
(2)计算相关系数矩阵 R
$\begin{array}{c} \boldsymbol{R}=\frac{1}{n-1} \sum_{k=1}^{n} y_{k i} y_{k j}, \\ i=1,2, \cdots, n ; j=1,2, \cdots, m, \end{array}$
通过求解特征方程 λ E - R = 0 ,E为单位矩阵,得到特征值 λ i ( i = 1,2 , , m ) ,特征值 λ i为各个主成分的方差, λ i / k = 1 m λ k为第 i个主成分的贡献率, k = 1 i λ k / k = 1 m λ k为前 i个主成分的累计贡献率,根据特征值都大于1且累计贡献率到一个较高的百分数以上(85%以上),可以保证主成分中包含原始数据的大部分信息。假设选取最大的前 k个特征值 λ 1 , λ 2 , , λ k ,并求出其对应的特征向量为 μ 1 , μ 2 , , μ k ,其中 μ j = ( μ 1 j , μ 2 j , , μ m j ) T
(3)计算主成分,并求得每个样本投影后作为新的训练数据。对每个样本 X i ,原来的特征 ( x 1 i , x 2 i , , x m i ) T ,投影之后的新特征为 ( y 1 i , y 2 i , , y k i ) ,计算公式如下:
y 1 i = μ T 1 ( x 1 i , x 2 i , , x m i ) T =     μ 11 x 1 i + μ 12 x 2 i + + μ 1   m x m i y 2 i = μ T 2 ( x 1 i , x 2 i , , x m i ) T =     μ 21 x 1 i + μ 22 x 2 i + + μ 2 m x m i y k i = μ T k ( x 1 i , x 2 i , x m i ) T =     μ k 1 x 1 i + μ k 2 x 2 i + + μ k m x m i , i = 1,2 , , n
在选择的指标变量中,除了有些指标存在较强的线性相关性以外,还有一些指标存在某些未知的非线性关系,这些非线性关系表现为数据中的非线性结构和局部关系,通过非线性降维将数据映射到低维空间,能够更好地保留这些非线性结构和局部关系。等距映射Isomap是一种考虑数据几何结构的降维工具,通过保持数据点间的测地距离,有助于揭示股票数据中的潜在空间结构[12]。尽管计算成本较高,但对于理解股票价格的非线性关系和市场动态具有独特价值,降维步骤如下。
(1)对原始数据构建邻域图.取高维空间 R n中的样本点 x i x j ,其两点之间的欧氏距离为 d x ( i , j ) x i x j是相邻点,则说明领域图有边,边长为 d x ( i , j )
(2)计算最短路径矩阵 D G , x i x j之间的邻域图有边时, d G ( i , j ) = d x ( i , j ) ; x i x j之间的邻域图没有边时, d G ( i , j ) = ; x i x j存在 N个邻近点时,取 d G ( i , j ) = m i n { d G ( i , j ) , d G ( i , k ) + d G ( k , j ) }
(3)构建低维映射,即找到原始高维数据集 X = { x 1 , x 2 , , x N }相对应的 d维数据集 Y = { y 1 , y 2 , , y d } ( d N ) ,把最短路径矩阵 D G作为MDS(multidimensional scaling,多维尺度)算法的输入,利用ISOMAP算法将训练数据降维返回的结果的集合即为 X在低维空间的映射。
为了同时发现股票行情数据的决策指标之间较强的线性相关性与非线性关系,采用二次降维法,结合两类降维方法,先分别用线性降维中的主成分分析法与非线性降维中的等距映射法,得到降维后的数据集,然后从其中各自取部分数据组成新的训练数据集,这样训练数据集就综合了原数据的两类特征信息。
LSTM网络通过对长期信息的学习,成功解决了普遍循环神经网络的缺陷,在时间序列预测等领域中能达到较好的应用效果[13]。LSTM单元结构如图1所示。
LSTM中有3个门控结构,分别是遗忘门、输入门和输出门,LSTM通过这3个门控结构的组合来控制细胞状态,进而实现长期记忆保留的功能,解决梯度爆炸或消失问题。
遗忘门:决定了当前时刻单元状态 c t从上一刻状态舍弃多少信息,其数学表达式为
f t = σ ( W f h t - 1 + U f x t + b f )
输入门:更新当前时刻状态 c t ,即决定哪些输入信息 x t可以加入 c t ,其数学表达式为
i t = σ ( W i h t - 1 + U i x t + b i )
c ˜ t = t a n h ( W c h t - 1 + U c x t + b c )
c t = c t - 1 f t + i t c ˜ t
输出门 o t :通过 c t函数激活前时刻单元状态,决定了最终的输出,
LSTM在 t时刻的输出 h t
o t = σ ( W o h t - 1 + U o x t + b o )
h t = o t t a n h ( c t - 1 )
式中: W U为权重矩阵; b为偏置向量。在LSTM模型中,模型通过遗忘门忘记哪些内容,通过输入门选择保留哪些内容,以便模型分析那些与任务最相关的数据。LSTM模型还可以学习数据的更加抽象表示,以便模型学习数据更多的特征[11]。这些特性使得LSTM模型应用于股票中时,可以更有效地分析股票走势。
注意力机制应用于机器翻译领域,通过权重分配对关键信息的聚焦,从而提高模型的预测能力。在股票输入数据中,多头注意力机制能够评估输入特征对股票收盘价的影响力,并为各特征赋予相应权重,从而突出对股票价格影响显著的信息,提高模型的准确性。该机制通过不同的线性变换分别映射到查询(Query)、键(Key)和值(Value)空间,形成3个参数矩阵QKV,将每个矩阵拆分为h个头,得到QiKiVi,其计算公式为
A i = s o f t m a x Q i K i T d k V i
A ( x ) = C o n c a t ( A 1 , A 2 , , A h ) W 0
式中: i = 1,2 , , h ; A i为第 i个头的注意力输出; d k为键向量的维度;softmax用于产生注意力权重;Ah个头的输出注意力相加; W 0为权重向量。
在原始LSTM模型中,取建模训练数据集700个样本,每个样本有259个决策指标,即构成700×259决策参数矩阵,作为LSTM模型的输入数据,以第2天的收盘价为目标数据,组成LSTM模型。
在选择的指标变量中,有些存在较强的线性相关性,对模型的预测泛化能力有干扰影响,用主成分分析法来提取几个独立的主成分,用较少的主成分来作为LSTM模型的输入来训练模型,既保留了大部分有用信息,又降低了模型的复杂度与训练难度。由式(2)先计算出原始数据的相关系数矩阵 R再求 R的特征值与方差贡献率,见表3,根据方差贡献率从大到小排序,根据主成分选择规则[4],前17个主成分的特征值均大于1,且累计方差贡献率达到了96%,故取前17个主成分。
主成分方差累积贡献率如图2所示,从图2上可以看出,在主成分数达到7以后,方差累积贡献率增加速度变缓。
经过计算得到前17个主成分的载荷矩阵,见表4
再利用式(3)得到17个主成分的得分值,作为LSTM模型的训练数据,组成PCA-LSTM模型。
利用等距映射Isomap 对数据进行非线性降维。为了对比试验,取与主成分分析一致的降维维度,即17维。取建模训练数据集700个样本,每个样本有259个决策指标,即构成 700 × 259决策参数矩阵,经过等距映射ISOMAP,得到降维后的数据,形成 700 × 17决策参数矩阵,作为LSTM模型的输入数据,以第2天的收盘价为目标数据,组成ISOMAP-LSTM模型。
经过主成分分析降维得到 700 × 17决策参数矩阵,作为新的样本数据再经过等距映射ISOMAP降维,得到新的 700 × 4决策参数矩阵,作为LSTM模型的输入数据,以第2天的收盘价为目标数据,组成PCA-ISOMAP-LSTM模型。
利用多头注意力机制(MAH),由式(11)把建模训练数据集 700 × 259矩阵产生 700 × 16决策参数矩阵,作为LSTM模型的输入数据,以第2天的收盘价为目标数据,组成MHA-LSTM模型。
原始LSTM模型的输入值为表1中每日259个指标数据,第2日的收盘价为输出值,模型参数设定为:输入层维数为259,输出层维数为1,由隐含层神经元个数的经验公式,经过多次测试,隐含层神经元个数取为20。
h = m + N + K
式中: m为输入层神经元个数; N为输出层神经元个数; K 1 ~ 10的常数。学习率为0.000 6,步长取为28。
将训练集的每个交易日的相关行情数据作为主成分分析数据,得到载荷矩阵,由载荷矩阵计算出每日的每个主成分得分,以这700个降维后的数据作为LSTM的输入,第2日的收盘价为输出值,通过配对数据来训练模型。LSTM模型参数设定为:输入层维度为17,输出层维度为1,隐含层层数为2,经过反复测试,确定隐含层神经元个数为10效果较好。
PCA+ISOMAP+LSTM模型中,输入层维度为17,输出层维度为1,隐含层层数为2,确定隐含层神经元个数为20效果较好,700组训练数据前400组数据为主成分分析降维数据,后300组数据为Isomap降维数据。
利用网格搜索法与试验,确定上述4种模型的训练参数设置,见表5
以220日行情数据为测试数据,通过比较模型预测与实际值差异,评估模型特征提取效果。所选误差评估指标包括平均绝对误差(MAE),平均相对误差(MAPE),均方根误差(RMSE),涨跌准确评估指标用平均涨跌准确率(ARRF),如果预测收盘价差与实际收盘价差符号相同,表明预测方向与实际方向相同,即预测方向准确,否则方向相反,预测方向错误。其中MAE、RMSE越小,ARRF越大,表示预测效果越好,评估指标的公式见表6
此外,采用Diebold-Mariano(DM)检验平均绝对偏差(MAE),该检验的原假设和备择假设如下。
H0:D=0,即两种模型的预测效果是等价的;
H1:D≠0,即两种模型的预测效果是存在差异的。
DM检验假定股票时间序列为 y t , t = 1,2 , , T ,两个模型的预测值分别为 y ^ 1 t y ^ 2 t ,则两个模型的预测误差分别为 ε 1 t = y t - y ^ 1 t ε 2 t = y t - y ^ 2 t ,对应的损失函数为 l 1 = g ( ε 1 t ) l 2 = g ( ε 2 t ) ,两个模型的损失函数之差:
d t = g ( ε 1 t ) - g ( ε 2 t )
DM统计量:
d m e a n = 1 T t = 1 T g ( ε 1 t ) - g ( ε 2 t )
d s t d = 1 T - 1 t = 1 T d t - d m e a n
D M = d m e a n d s t d
P小于显著性水平的情况下,若DM<0,认为模型1的预测效果好于模型2;若DM>0,则认为模型2的预测效果优于模型1。
将原始LSTM、基于主成分的PCA-LSTM模型、基于等距映射的ISOMAP-LSTM模型、综合主成分与等距映射的PCA-ISOMAP-LSTM模型分别训练、基于多头注意力机制的MHA-LSTM,为防止过拟合,LSTM模型的keep_prob取0.8,记录每个模型的模型训练时间,用测试集数据,计算模型预测的平均绝对误差、平均相对误差、均方根误差以及涨跌准确率,模型的性能见表7
表7可以看出,在保持隐含层神经元不变的情况下,将700×259决策参数矩阵降维为700×17决策参数矩阵,相对原始LSTM模型,改进的模型改变了网络结构,输入维数由259变为17,大幅降低了输入变量的维数,减少了预测误差与网络训练时间,提高了预测精度。PCA-LSTM、ISOMAP-LSTM与PCA-ISOMAP-LSTM模型比LSTM模型网络训练时间,由原来模型的209 s分别减少到88、90、119 s,表明降维后模型更加简洁,可以实现更快地训练。除了模型训练时间的大幅减少外,PCA-LSTM与ISOMAP-LSTM模型的预测误差显著降低,平均涨跌准确率ARRFPCA-LSTM模型提升了6%,ISOMAP-LSTM模型提升了9%,表明降维后改进的这两个模型预测涨跌方向效果明显,这是因为PCA-LSTM去除了一些指标数据的相关性再输入LSTM模型,相对原始LSTM模型减少了数据的噪声干扰,并使低维数据最大程度保持原始高维数据的方差信息;而ISOMAP-LSTM模型通过保持高维数据的测地距离与低维数据的欧式距离的不变性来找到低维特征表示,低维特征输入使LSTM模型更容易学习股票数据的特征,从而提高模型的预测精度。虽然模型PCA-ISOMAP-LSTM的ARRF提升了5%,但误差评估指标也显著增加了,表明该模型预测效果不佳,这是因为虽然PCA去除了数据的相关性,Isomap通常在处理非线性数据集时表现良好,所以预测时大的趋势准确性高,但是经过两次降维去掉了绝大部分噪声,减少了随机性,因此预测误差也随着增大。MHA-LSTM模型效果不如原始LSTM模型,说明多头注意力机制在提取股票数据特征效果不理想,可能是多头注意力机制提取的信息过少,输入LSTM模型的股票影响信息不完整,造成预测效果较差。
图3~图7为5种模型的预测曲线,预测曲线与真实值曲线基本拟合,能够预测股票较长时间的走势。对比图3~图7可以看出,在长期的底部阶段或顶部阶段,由于方向不明,可能存在一些人为因素,改进的模型预测效果不及原始模型;但当确定方向后,PCA-LSTM与ISOMAP-LSTM曲线拟合程度很高,两者的相似性很强。
在模型预测的基础上,DM检验比较以上几种预测模型的效果优劣。选取4个预测模型两两比较,共12中情形,对平均绝对误差MAE进行检验,由式(13)~式(16)计算,结果见表8
DM检验的原假设是两个模型的预测效果相同,如果P小于0.05的显著性水平,则拒绝原假设,说明不同的模型预测效果显著不同,再结合DM统计量取值的正负,可判断哪个模型的预测效果更优。在表8中,以原始LSTM模型为基准,P都小于0.05,DM统计量为正的有PCA-LSTM和ISOMAP-LSTM,DM统计量为负的是PCA-ISOMAP-LSTM和MAH-LSTM,表明PCA-LSTM和ISOMAP-LSTM模型预测性能比原始LSTM模型更优,即经过降维提取到了影响股价的关键信息,而PCA-ISOMAP-LSTM模型比原始LSTM模型更差,表明两种降维方法融合效果不理想,因为PCA提取线性关系信息,而ISOMAP提取空间位置信息,两种信息提取时造成信息损失,训练时造成网络参数无法收敛。PCA-LSTM与ISOMAP-LSTM比较,P大于0.05,两种模型预测性能无法比较优劣,表明两种降维方法都能提取数据的关键信息,预测效果相差不大;PCA-LSTM、ISOMAP-LSTM与MAH-LSTM比较,DM统计量都为负,表明MAH-LSTM模型预测性能比前两者都差,多头注意力机制提取特征信息不如主成分分析法与等距映射法。同理,PCA-ISOMAP-LSTM也比前两者性能较差。为了进一步通过DM检验比较模型的预测效果,可以增加之前多年的训练数据样本和检验样本,或者在实际数据加入噪声增加一定的随机性,未来将在这方面进行研究。
在大量指标数据的基础上,研究了降维后的LSTM模型预测股票价格问题。首先收集大量的行情数据,利用主成分分析法提取出决策数据的主成分,计算样本的得分值为新的样本数据集,提取数据内部的线性关系;等距映射法把高维空间数据映射到低维空间后,用低维空间的映射作为样本数据集,提取数据内部的非线性关系与结构。通过降维处理,消除了输入特征的线性关系和一些噪声干扰,也简化了网络模型的结构。实验中分别构建线性降维模型、非线性降维模型、线性与非线性综合降维模型、注意力机制提取特征模型,通过仿真与DM检验表明,线性降维的PCA-LSTM模型和非线性降维的ISOMAP-LSTM模型预测精度都有所显著提高,但线性与非线性综合降维模型PCA-ISOMAP-LSTM与MAH-LSTM预测性能显著降低,表明综合两种降维方法和注意力机制模型,预测效果不佳。由此可见,PCA-LSTM与ISOMAP-LSTM这两种模型为量化投资提供了一种新的技术支持和实践经验。
  • 乐山市科技局项目(22GZD031)
参考文献 引证文献
排序方式:
[1]
GANDHMAL D P, KUMAR K. Systematic analysis and review of stock market prediction techniques[J]. Compu-ter Science Review, 2019, 34: 100190.
[2]
包振山, 郭俊南, 谢源, 等. 基于LSTM-GA的股票价格涨跌预测模型[J]. 计算机科学, 2020, 47(S1): 467-473.
[3]
BAEK Y J, KIM H Y. Modaugnet: a new forecasting framework for stock market index value with an overfitting prevention LSTM module and a prediction LSTM module[J]. Expert Systems with Applications, 2018, 113: 457-480.
[4]
王东, 王霄鹏, 杨川东. 一种基于主成分LSTM模型在股票预测中的研究[J]. 重庆理工大学学报(自然科学), 2021, 35(2): 282-288.
[5]
李辉, 化金金, 邹波蓉. 基于RF-LSTM组合模型的股票价格预测[J]. 河南理工大学学报(自然科学版), 2022, 41(1): 136-142.
[6]
肖田田. 基于K-means-LSTM模型的证券股价预测[J]. 科技和产业, 2024, 24(3): 210-215.
[7]
范辉, 朱勇丞, 李晋江. 基于注意力机制和特征融合的股票预测方法[J]. 山东工商学院学报, 2024, 38(1): 57-68, 76.
[8]
朱瑞琪, 陆佳敏, 陆佳艳, 等. 一种基于自注意力机制的CNN-BiLSTM非侵入式负荷分解方法研究[J]. 机电信息, 2023(16): 77-81.
[9]
曹帅, 李晓君, 贺成铭, 等. 基于改进LSTM的电力调度数据预测模型设计与仿真[J]. 电子设计工程, 2024, 32(19): 173-177.
[10]
周志轩, 陈仲民, 邓君丽. 基于压缩感知和深度学习的农产品价格预测[J]. 武汉大学学报(工学版), 2024, 57(9): 1327-1334.
[11]
HTUN H H, BIEHL M, PETKOV N. Survey of feature selection and extraction techniques for stock market prediction[J]. Financial Innovation, 2023, 9(1): 26.
[12]
TENENBAUM J B, SILVA V D, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290: 2319-2323.
[13]
MALHOTRA P, VIG L, SHROFF G, et al. Long short term memory networks for anomaly detection in time series[J]. Computational Intelligence and Machine Learning, 2015, 24(3): 210-215.
2025年第25卷第11期
PDF下载
288
151
引用本文
BibTeX
文章信息
  • 接收时间:2024-12-18
  • 首发时间:2025-12-12
  • 出版时间:2025-06-10
补充材料
相关文章
文章信息
作者
出版历史
  • 收稿日期:2024-12-18
基金
乐山市科技局项目(22GZD031)
作者信息
    成都理工大学工程技术学院, 四川 乐山 614007
参考文献
分享链接
https://castjournals.cast.org.cn/joweb/kjhcy/CN/1206288140143231997
分享至
全文二维码

扫描看全文

引用本文
BibTeX
本文的引用情况
2种不同金属材料的力学参数

Family
属数
Number of
genus
种数
Number of
species
占总种数比例
Percentage of
total species (%)

Genus
种数
Number of
species
占总种数比例
Percentage of total
species (%)
鹅膏菌科Amanitaceae 2 11 5.26 鹅膏菌属 Amanita 10 4.78
小菇科 Mycenaceae 2 12 5.74 丝盖伞属 Inocybe 5 2.39
多孔菌科 Polyporaceae 8 14 6.70 蜡蘑属 Laccaria 5 2.39
红菇科 Russulaceae 3 23 11.00 小皮伞属 Marasmius 6 2.87
小菇属 Mycena 11 5.26
光柄菇属 Pluteus 5 2.39
红菇属 Russula 17 8.13
栓菌属 Trametes 5 2.39
关闭全屏