图学学报

李章明, 关伟凡, 常政威, 张凌浩, 胡庆浩

图学学报. 2026, 47(1): 39-47. doi: 10.11996/JG.j.2095-302X.2026010039

随着大模型规模的不断增长，模型推理的内存占用和计算开销成为重要挑战。模型量化是降低模型资源消耗的有效方法，但现有方法在权重量化过程中存在离群点处理不足、量化精度损失显著以及内存访问效率低下等问题。为此，提出一种内存对齐的大模型混合精度量化方法，通过将模型参数表示成不同位宽的量化参数实现混合精度量化方法，在降低模型存储的同时缓解量化带来的精度损失问题。具体来说，基于小组显著性分析划分权重离群点，将模型参数按单指令多数据流(SIMD)单元对齐分组，并依据显著性对不同小组采用8 bit或2 bit量化；针对2 bit量化可能导致的精度损失，引入分块量化补偿策略。此外，设计了一种高效的混合精度权重打包与存储方案，通过位图(Bitmap)记录数据块位宽类型，支持随机访问。实验结果表明，该方法在保证模型精度的同时，显著降低了内存占用并提升了计算效率。通过在Llama2-7 B，13 B和70 B上进行验证，相比最先进的方法，在WikiText2和C4数据集上的困惑度(PPL)分别下降8.13，2.84，1.37及5.80，并且量化后的70 B模型相对BF16权重存储约减87%。此外在7个QA数据集上平均准确率提升6.24%。其结果表明，基于内存对齐的大模型混合精度量化方法能够同时提升压缩率、访存效率与模型性能。

基于深度融合多模态特征的三维点云分类小样本类增量学习

朱晨浠, 卢奕南, 伍铁如, 龚文勇, 马锐

图学学报. 2026, 47(1): 78-89. doi: 10.11996/JG.j.2095-302X.2026010078

传统3D点云分类方法在小样本类增量学习(FSCIL)场景下容易出现泛化能力不足和灾难性遗忘等问题。预训练语言-图像模型(CLIP)因具备丰富的2D形状先验知识，被证明能够有效提升3D FSCIL性能，但现有基于CLIP的框架在多模态特征提取与融合过程中仍缺乏灵活性与自适应性，导致增量阶段的分类准确率受限。为解决这些不足，提出了一种深度融合多模态特征的3D FSCIL方法，通过引入基于门控单元与残差块的自适应适配器实现多尺度特征对齐与冗余信息抑制，并设计基于自注意力机制的多模态全局特征动态融合模块，根据不同样本特性自适应调整多路特征的权重分配，从而获得更加一致且互补的融合表示。具体地，将点云渲染为多视角深度图，分别利用原始CLIP视觉编码器与在深度图上预训练的CLIP编码器提取特征，并结合点云几何特征，经自适应适配器处理后送入注意力融合模块，与CLIP文本编码器提取的语义特征对齐进行分类。此外，结合对比学习损失、多视角与几何扰动数据增强策略以及记忆回放机制，有效缓解小样本条件下的过拟合与遗忘问题。在ShapeNet、ModelNet及CO3D数据集上的实验结果表明，与现有主流3D FSCIL方法相比，该方法在各增量阶段均取得更高的准确率，且相对准确度下降率与最大阶段跳变率显著降低。

考虑粗糙表面的复杂产品装配精度预测研究

王刚锋, 张寰, 杨英英, 刘一涛, 郭彦云, 岳萍, 孙岩辉

图学学报. 2026, 47(1): 162-172. doi: 10.11996/JG.j.2095-302X.2026010162

针对现有复杂产品装配精度预测中未充分考虑粗糙表面对装配精度的影响，导致精度预测不准确及实际装配适用性不足的问题，提出一种考虑粗糙表面的装配精度预测方法。首先，构建装配精度信息模型，表达零件配合特征、几何公差及粗糙度信息，并以此为基础，构建装配精度知识图谱；其次，基于小位移旋量(SDT)理论建立几何公差表示模型，并研究平面零件及柱面零件粗糙表面模拟方法及小位移旋量表达式确定方法；再次，根据装配序列确定装配体偏差传递路径，并构建装配接触有向图，利用雅可比-粗糙表面模型实现装配精度预测。最后，以某型号工程机械曲柄连杆机构为例验证方法可行性，结果表明，该方法可实现装配精度的准确预测并对实际装配具有指导价值。

基于不确定性引导的智能强化主动学习图像分类方法

酒明远, 吴国伟, 宋旭光, 李书攀, 徐明亮

图学学报. 2026, 47(1): 47-56. doi: 10.11996/JG.j.2095-302X.2026010047

随着深度学习技术的快速发展，其在图像分类等任务中取得了显著成果。然而，这些模型的成功往往依赖于大量高质量的标注数据，而在实际应用中，标注数据通常稀缺，人工标注过程又极为耗时、费力，限制了模型的推广与应用。近年来，主动学习因其能够在有限标注预算下提升模型性能而受到广泛关注，其核心思想是根据样本的不确定性、多样性或代表性等指标，挑选最有价值的数据进行标注。针对传统主动学习方法多依赖手动设计的启发式采样策略，难以适应不同任务场景，且选择策略难以动态优化等问题，提出一种基于智能强化主动学习(SRAL)的图像分类方法，通过将样本选择过程建模为马尔科夫决策过程，利用强化学习的自适应策略优化能力，引导模型从未标注样本中动态挑选最具价值的样本用于标注。其中，状态由未标注样本提取的特征构成，动作表示是否选择样本进行标注，奖励函数则定义为当前样本加入训练集后模型准确率的变化差值。采用演员-评论家(Actor-Critic)算法进行策略优化，并引入不确定性启发式排序作为辅助信息以提升学习效率。实验结果表明，在CIFAR-10，SVHN和FASHION-MNIST等数据集上，所提出的SRAL方法在相同标注预算下，相比于其他主动学习方法，能够显著提高分类准确率，且在各数据集上均展现出较好的稳定性和泛化能力，验证了SRAL方法在提高图像分类模型性能方面的有效性与优势。

机器人如何吸引儿童?外观、动作和声音多感官特征在早期互动中的作用

李奕, 曹成才, 宋章通, 李祚奇, 黎晓, 李和森

图学学报. 2026, 47(1): 223-233. doi: 10.11996/JG.j.2095-302X.2026010223

随着人工智能技术的快速发展，多模态机器人在学前儿童的教育、娱乐及日常生活中扮演着日益重要的角色。现有研究多关注机器人单一感官线索对儿童感知的作用，但关于多感官整合效应仍缺乏系统性研究。为探究机器人多模态特征如何共同影响儿童的情感偏好和视觉注意力，招募318名4~6岁儿童参与1项眼动追踪实验。实验采用2(外观特征：拟人型、拟动物型)×3(声音引导：男声、女声、无)×2(手势引导：有、无)的三因素混合实验设计，以机器人外观特征(拟人型与拟动物型)和行为特征(声音、手势引导)为自变量，以儿童情感偏好和眼动指标为因变量，系统考察了多感官特征对儿童用户的影响。结果表明，在外观特征方面，拟人型机器人和拟动物型机器人在主观偏好评分上没有显著差异，但拟人型机器人吸引了更长的总注视时长、更多的注视次数和更短的首次注视时间，拟人型机器人在注意力指标上显著优于拟动物型机器人，儿童在视觉接触的初始阶段更容易被拟人型机器人所吸引，且拟人化设计在持续吸引儿童注意力方面更具优势。在行为特征方面，具有手势引导的机器人在主观偏好评分上显著高于无手势机器人，且吸引了更长的总注视时长和更多的注视次数。女声机器人在主观偏好评分上略高于男声，且两者均显著高于无声机器人。男声机器人在总注视时长上略高于女声，且两者均显著高于无声机器人。而女声和男声机器人在注视次数的差异不显著，但两者均显著高于无声机器人。具有手势引导和声音(尤其是女声)的机器人在主观评分和视觉注意力分配上表现更好，说明行为特征在增强儿童的情感偏好和互动体验中具有重要作用。此外，外观和行为特征对儿童情感偏好和视觉注意力的影响相对独立，未观察到显著交互作用。该研究揭示了机器人外观和行为特征对学前儿童情感偏好和视觉注意力的影响机制，为设计满足用户情感偏好的儿童机器人提供了科学依据。

基于轻量级网络和加权RF的点云分类分割算法

赵夫群, 郝寒竹, 余佳乐

图学学报. 2026, 47(1): 143-151. doi: 10.11996/JG.j.2095-302X.2026010143

针对点云分类分割方法中存在的高计算开销、复杂网络模型等问题，提出一种基于轻量级网络和加权随机森林(RF)的点云分类分割算法。该算法采用层次化的方式实现高效分类分割，首先针对传统神经网络层数多、计算复杂等问题，构造轻量级神经网络，并利用其提取点云的全局形状、区域间关系、曲率、法向量和颜色等特征，实现点云的快速粗分类分割；然后针对数据不平衡的问题，设计自适应分类分割策略，并引入加权RF，结合不一致度量筛选与动态加权优化机制，以实现点云精分类分割。在ModelNet40数据集上进行分类实验，在Semantic3D数据集和室外场景点云数据上进行了分割实验，结果表明，相比Local Geo-Transformer，PointNeXt和FastPointNet++等算法，该算法的分类分割精度分别提高了约1.9%，1.6%和1.7%，分类分割时间分别降低了约40%，30%和20%。由此可见，基于轻量级网络和加权RF的点云分类分割算法在保持较高分类分割精度的同时，可以有效缩短模型的训练时间，提高分类分割效率，是一种有效的点云分类分割算法。

基于MBSE的复杂成形装备概念设计方法

王博雅, 王绍宗, 杨万然, 周兴炜, 侯亮, 熊成悦

图学学报. 2026, 47(1): 179-193. doi: 10.11996/JG.j.2095-302X.2026010179

复杂成形装备的传统研制方式通常采用基于文档的系统工程(DBSE)方法开展，存在需求分析不完善导致研发缓慢、文本二义性导致需求覆盖不全、装备进展落后于技术迭代等问题，造成设计出的复杂成形装备存在设计指标不满足使用要求、反复修改致使设计效率低下等问题。因此，在复杂成形装备概念设计阶段，参考美国国防部体系结构框架(DoDAF)，结合基于模型的系统工程(MBSE)，提出了基于MBSE的复杂成形装备概念设计方法。并以全景、能力、运行、系统及标准共5类视角作为复杂成形装备概念设计的切入点，通过多类视角切入分析开展复杂成形装备顶层需求获取、需求细化分析、功能分析及系统建模共4层级设计，并使用系统建模语言(SysML)建立起11种模型，实现复杂成形装备概念设计阶段的数字化和流程化表达。最后，以超塑成形装备作为典型实例进行设计方法的应用演示。通过实际应用解决了传统设计方式痛点问题，表明了方法对复杂成形装备的正向研制有良好的指导作用。

基于动态视觉传感器的航发叶片缺陷检测

张行顺, 陈海永

图学学报. 2026, 47(1): 120-130. doi: 10.11996/JG.j.2095-302X.2026010120

航空发动机叶片作为发动机核心零部件，其表面微小缺陷可能导致严重安全事故，传统视觉检测技术受限于运动模糊、动态范围低及背景冗余等问题。针对上述挑战，提出一种基于动态视觉传感器(DVS)的航发叶片缺陷检测方法。动态视觉传感器数据格式为异步事件流，故也被称作事件相机，具有动态范围大、高帧率和微小目标捕捉能力强等优势。首先搭建基于DVS的缺陷检测平台，探索总结了其成像特点及优势。在此基础上，构建首个基于DVS的航发叶片缺陷检测数据集(EDD-AB)，涵盖划痕、点痕、边缘损伤3类缺陷近6 000张图像，精细标注近1.2万个目标标签，数据集已开源(链接： https://github.com/NiBieZhouMei5520/EDD-AB.git)。进一步提出基于异步事件流帧聚合的多尺度缺陷检测算法(AEAF-ABDD)：通过固定时间窗的帧聚合技术实现事件流可视化；构建多分辨率自适应特征金字塔网络(MRAFPN)增强多尺度缺陷特征提取能力；引入轻量级SimAM注意力机制强化关键区域聚焦；融合星形卷积模块(StarNet)提升高维非线性特征映射效率，实现复杂曲面工件多尺度缺陷的精准检测。实验表明，AEAF-ABDD在EDD-AB数据集上的平均精度均值(mAP)达97.7%，检测速度达105帧/秒，显著优于主流算法，为高反光曲面工件的自动化质检提供了高效解决方案，推动了DVS在工业检测领域的应用。

用于夜视辅助驾驶的轻量化图像眩光去除方法

李晔, 贾俊洋, 黄冠, 李玉洁, 齐文婷, 刘岩

图学学报. 2026, 47(1): 57-67. doi: 10.11996/JG.j.2095-302X.2026010057

夜视环境下，强光源引发的眩光干扰显著降低图像质量，影响夜视辅助驾驶系统的感知性能，现有眩光去除算法面临鲁棒性不足、计算复杂度高以及光源信息丢失等问题。为此，提出了一种面向夜视辅助驾驶的轻量化图像眩光去除方法(NFR-Net+)旨在提升图像清晰度并满足移动端实时计算需求。首先设计特征过滤机制，结合残差连接策略，增强网络对复杂夜视场景的特征提取能力，有效抑制过拟合，从而在不同光照条件和眩光类型下实现稳定的眩光去除效果。其次，引入非线性无激活特征注意力模块，通过轻量化设计构建高效注意力机制，显著提升图像细节重建质量，同时将模型参数量降低约8.28%，运行内存减少约11.1%，大幅优化计算效率。此外，针对传统方法中光源信息过度去除导致图像自然度下降的问题，优化了分割网络中的光源提取模块，通过改进的光源分离策略，精确保留光源区域的亮度和纹理信息，确保输出图像的真实性和自然感。实验结果表明，NFR-Net+在结构相似性(SSIM)、峰值信噪比(PSNR)和学习感知图像块相似度(LPIPS)等图像质量评估指标上均优于现有主流方法，表现出更高的去眩光性能和细节保留能力。同时，该方法在多种夜视场景和不同硬件设备上均展现出良好的适应性，能够满足实时处理的高效性要求，为智能视觉系统在资源受限的移动端部署提供了可行性。进一步的消融实验验证了各模块的有效性，凸显了特征过滤和注意力机制在提升性能与降低资源消耗中的关键作用。且为夜间自动驾驶和智能监控等应用场景提供了高效、轻量化的解决方案。

基于大模型的生成式数字孪生体建模

梁生龙, 范秋霞

图学学报. 2026, 47(1): 173-178. doi: 10.11996/JG.j.2095-302X.2026010173

针对数字孪生(DT)技术与大模型在工业设计中融合应用的挑战，提出了一种基于生成式大模型的CAD-LDT数字孪生体建模框架。通过构建物理实体模块、智能生成模块和虚拟实体模块的三元架构，创新性地整合多模态数据融合机制与领域知识约束，实现从物理实体描述到参数化CAD模型的自主生成。采用LLaVA-7B和LLaMA-7B作为基础模型，通过LoRA轻量化适配器实现视觉-文本特征的跨模态对齐，并设计约束编码器将几何公差与物理规则转化为结构化JSON对象。为增强空间变换的数学一致性，引入李群算法优化刚体变换表征；采用几何权重分箱方法离散化复杂装配关系；提出时空解耦生成策略，协同规划空间布局与装配时序。在DeepCAD数据集上的实验结果表明，该框架在几何达到83.6%，约束满足率达91.3%，生成效率提升了26.5%，显著优于主流基线模型。消融实验进一步验证了多模态融合、约束编码机制和李群算法对建模质量的关键贡献。为智能制造领域提供了新的DT建模范式，在参数化设计、装配工艺优化等方面展现出工程应用价值。