按提交时间
按主题分类
按作者
按机构
  • 一种改进Transformer的电力负荷预测方法

    分类: 计算机科学 >> 计算机科学技术其他学科 分类: 能源科学 >> 能源(综合) 提交时间: 2021-08-11

    摘要: 负荷预测是电网系统中很多应用的关键部分,具有重要作用。然而,由于电网负荷的非线性、时变性和不确定性,使得准确预测负荷具有一定的挑战。充分挖掘负荷序列的潜在特征是提升预测准确率的关键。本文认为在特征提取时应该充分利用负荷序列的位置信息、趋势性、周期性和时间信息,同时还应构建更深层次的神经网络框架进行特征挖掘。因此,本文提出了基于特征嵌入和Transformer框架的负荷预测模型,该模型由特征嵌入层,Transformer层和预测层组成。在特征嵌入层,模型首先对历史负荷的位置信息、趋势性、周期性和时间信息进行特征嵌入,然后再与天气信息进行融合,得到特征向量。Transformer层则接受历史序列的特征向量并挖掘序列的非线性时序依赖关系。预测层通过全连接网络实现负荷预测。从实验结果来看,本文模型的预测性能优于对比模型,体现了该模型的可行性和有效性。

  • 基于Transformer的图像分类网络MultiFormer

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》

    摘要: 为解决目前ViT模型无法改变输入补丁大小且输入补丁都是单一尺度信息的缺点,提出了一种基于Transformer的图像分类网络称为MultiFormer。MultiFormer通过AWS(Attention With Scale)模块,将每阶段不同尺度输入小补丁嵌入为具有丰富语义信息的大补丁;通过GLA-P(Global-Local Attention With Patch)模块交替捕获局部和全局注意力,在嵌入时同时保留了细粒度和粗粒度特征。设计了MultiFormer-Tiny、-Small和-Base三种不同变体的MultiFormer模型网络,在ImageNet图像分类实验中Top-1精度分别达到81.1%、82.2%和83.2%,后两个模型对比同体量的卷积神经网络ResNet-50和ResNet-101提升3.1%和3.4%;对比同样基于Transformer分类模型ViT,MultiFormer-Base在参数和计算量远小于ViT-Base/16模型且不需要大量数据预训练前提下提升2.1%。

  • 基于Transformer的多分支单图像去雨方法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-04-07 合作期刊: 《计算机应用研究》

    摘要: 雨纹会严重降低拍摄图像的质量,影响后续计算机视觉任务。为了提高雨天图像的质量,提出了一种基于Transformer的单图像去雨算法。首先,该算法通过具有窗口机制的transformer获得大范围的感受野,进而获取雨纹特征的上下文信息,提高模型提取雨纹特征的能力;其次,该算法通过多分支模块提取和融合不同种类、不同层次的特征,提高模型对复杂雨纹信息的表征能力;最后通过残差连接融合浅层特征和深层特征,补全深层特征中缺失的细节信息,增强网络表达能力。在公开数据集Rain100L,Rain100H和私有数据集Rain3000上的实验结果表明,该方法相较于现有算法,能更有效的去除雨纹,同时更好的恢复图像中丢失的背景纹理信息。峰值信噪比和结构相似度(PSNR/SSIM)分别达到38.33/0.9855、28.42/0.9000、34.51/0.9643。

  • 基于Smooth-DETR的产品表面小尺寸缺陷检测算法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-04-07 合作期刊: 《计算机应用研究》

    摘要: 为应对实际工业产品视觉质量检测中缺陷罕见、尺寸小等挑战,提出了一种仅需要少量训练样本的小尺寸缺陷检测算法——Smooth-DETR。该算法采用基于DETR的编码-解码结构对缺陷类别和位置进行预测,该结构降低了参数量和计算复杂度。因DETR强大的全局特征学习能力,该算法可从少量训练样本中充分挖掘产品表面纹理特征,从而对打破了表面纹理连续性的缺陷检出率高。通过结合Smooth-L1损失和GIoU损失的优势,进一步提升了小尺寸缺陷的回归精度。实验结果表明,所提方法检测性能优于现有先进检测模型。此外,仅用少量训练样本,该算法对11类产品表面的缺陷检测平均精确率就能够达到98%以上。

  • An Improved YOLOv5-Based Method for UAV Object Detection

    分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-03-23

    摘要: Object detection based on unmanned aerial vehicle (UAV) images is very challenging. The multi-scale size and high density of objects in the UAV view bring great difficulties. To fully address this issue to unleash the potential of UAV applications, the YOLOv5-STD model is proposed. First, add one more head to locate extremely small object detection by shallow image features; second, use the attention mechanism to optimize the backbone by the transformer; third, use SPD-Conv to avoid the loss of fine-grained image feature information. At the last, sufficient experiments on the dataset VisDrone 2022 have proven that the model has good performance, compared with the basic model, the improved model has an average improvement of about 7% in mAP@.5 metrics, and the ablation experiments have verified that its improvement skills have a positive effect on the model. This paper can help developers and researchers get a better experience in the analysis and processing of unmanned aerial vehicle images.

  • 基于深度学习的视频行为识别技术综述

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-05-10 合作期刊: 《计算机应用研究》

    摘要: 行为识别(Action Recognition,AR)是计算机视觉领域的研究热点,在安防监控、自动驾驶、生产安全等领域具有广泛的应用前景。首先,对行为识别的内涵与外延进行了剖析,提出了面临的技术挑战问题;其次,从时间特征提取、高效率优化和长期特征捕获三个角度分析比较了行为识别的工作原理;再次,对近十年43种基准AR方法在UCF101、HMDB51、Something-Something和Kinetics400数据集上的性能表征进行比对,有助于针对不同应用场景选择适合的AR模型;最后,指明了行为识别领域的未来发展方向,研究成果可为视频特征提取和视觉内容理解提供理论参考和技术支撑。

  • 基于深度学习语义分割和迁移学习策略的麦田倒伏面积识别方法

    分类: 统计学 >> 社会统计学 提交时间: 2023-12-04 合作期刊: 《智慧农业(中英文)》

    摘要: [目的/意义]利用低空无人机技术并结合深度学习语义分割模型精准提取作物倒伏区域是一种高效的倒 伏灾害监测手段。然而,在实际应用中,受田间各种客观条件(不同无人机飞行高度低于120 m、多个研究区、 关键生育期不同天气状况等) 限制,无人机获取的图像数量仍偏少,难以满足高精度深度学习模型训练的要求。 本研究旨在探索一种在作物生育期和研究区有限的情况下精准提取倒伏面积的方法。[方法]以健康/倒伏小麦为 研究对象,在其灌浆期和成熟期开展麦田图像采集工作。设置2个飞行高度(40和80 m),采集并拼接获取2019、 2020、2021和2023年份3个研究区的数字正射影像图(Digital Ortho⁃photo Map,DOM);在Swin-Transformer深度 学习语义分割框架基础上,分别使用40 m训练集单独训练、40和80 m训练集混合训练、40 m训练集预训练80 m 训练集迁移学习等3种训练方法,获得对照模型、混合训练模型和迁移学习模型;采用对比实验比较上述3种模型 分割80 m高度预测集图像的精度并评估模型性能。[结果和讨论]迁移学习模型倒伏面积提取精度最高,交并比、 正确率、精确率、召回率和F1-Score共5个指标平均数分别为85.37%、94.98%、91.30%、92.52%和91.84%,高于 对照组模型1.08%~3.19%,平均加权帧率达到738.35 fps/m2,高于40 m图像183.12 fps/m2。[结论]利用低飞行高 度(40 m) 预训练语义分割模型,在较高飞行高度(80 m) 空图像做迁移学习的方法提取倒伏小麦面积是可行的, 这为解决空域飞行高度限制下,较少80 m及以上图像数据集无法满足语义分割模型训练的要求的问题,提供了一 种有效的方法。

  • 基于End-to-end深度强化学习的多车场车辆路径优化

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-05-18 合作期刊: 《计算机应用研究》

    摘要: 为提高多车场车辆路径问题(Multi-Depot Vehicle Routing Problem,MDVRP)的求解效率,提出了端到端的深度强化学习框架。首先,将MDVRP建模为马尔可夫决策过程(Markov Decision Process,MDP),包括对其状态、动作、收益的定义。同时,提出了改进图注意力网络(Graph Attention Network,GAT)作为编码器对MDVRP的图表示进行特征嵌入编码,设计了基于Transformer的解码器。并采用改进REINFORCE算法来训练该模型。该模型不受图的大小约束,即其一旦完成训练,就可用于求解任意车场和客户数量的算例问题。最后,通过随机生成的算例和公开的标准算例验证了所提出框架的可行性和有效性。即使在求解客户节点数为100的MDVRP上,经训练的模型平均仅需2毫秒即可得到与现有方法相比更具优势的解。

  • Magnetic flux leakage analysis and compensation of high-frequency planar insulated core transformer

    分类: 核科学技术 >> 粒子加速器 提交时间: 2023-06-18 合作期刊: 《Nuclear Science and Techniques》

    摘要: A novel high-frequency and high power density planar insulated core transformer (PICT) applied to high voltage direct current (DC) generator is introduced. PICTs operating principle and fundamental configuration are described, and preliminary experimental results in self-designed PICT apparatus are presented. Emphatically, magnetic leakage flux (MFL) giving rise to the output voltage drop is analyzed in detail both theoretically and by finite element method (FEM). Showing good consistency with experimental result, FEM simulation is considered to be practicable in physical design of PICT. To cancel out leakage inductance and improve the voltage uniformity, compensation capacitor is adopted and experimental verification is also presented. All shows satisfactory results.

  • 基于Informer 神经网络的农产品物流需求预测分析——以华中地区为例

    分类: 农、林、牧、渔 >> 农、林、牧、渔业科学其他学科 提交时间: 2023-05-15 合作期刊: 《智慧农业(中英文)》

    摘要: 保障农产品物流稳定性即是保障民生问题的关键。对农产品物流需求的预测是合理规划农产品物流稳定 性的重要保证。然而,农产品物流需求的预测实际较为复杂,预测过程中会受到各种因素影响。因此,为了保证 对农产品物流需求预测的准确性,需要考虑多方面影响因素。本研究以农产品物流需求作为研究对象,利用In⁃ former神经网络构建预测农产品物流需求的神经网络模型,以华中地区河南省、湖北省和湖南省为例,对三省的 农产品物流需求进行预测。同时用长短时记忆(Long Short-Term Memory,LSTM) 网络和Transformer神经网络对 华中三省农产品物流进行需求预测,将三种模型预测结果进行对比。对比结果表明本研究构建的基于Informer神 经网络模型预测测试误差平均百分比为3.39%,低于LSTM和Transformer神经网络模型的4.43%和4.35%。并且用 该Informer神经网络模型对三省预测出的预测值与实际值结果较为接近,河南省2021年的预测值为4185.33,实际 值为4048.1,误差为3.389%;湖北省2021年的预测值为2503.64,实际值2421.78,误差为3.380%;湖南省2021 年的预测值,2933.31,实际值为2836.86,误差为3.340%。表明该模型对华中三省的农产品物流需求预测的结果 较为准确。三省2023年的预测值高于2021年的预测值。因此,在2021年物流运输配套设施的基础上,必须保证 物流运输效率,加强物流运输能力,以满足华中地区日益增长的物流需求。

  • 基于无人机遥感和深度学习的葡萄卷叶病感染程度诊断方法

    分类: 统计学 >> 社会统计学 提交时间: 2023-12-04 合作期刊: 《智慧农业(中英文)》

    摘要: [目的/意义]葡萄卷叶病是一种严重影响葡萄产量和品质的病害。葡萄卷叶病感染程度类别之间存在严 重的数据不平衡,导致无人机遥感技术难以进行精确的诊断。针对此问题,本研究提出一种结合细粒度分类和生 成对抗网络(Generative Adversarial Network,GAN) 的方法,用于提高无人机遥感图像中葡萄卷叶病感染程度分 类的性能。[方法]以蛇龙珠品种卷叶病识别诊断为例,使用GANformer分别对每一类的葡萄园正射影像的分块图 像进行学习,生成多样化和逼真的图像以增强数据,并以Swin Transformer tiny作为基础模型,提出改进模型CASwin Transformer,引入通道注意力机制(Channel Attention,CA) 来增强特征表达能力,并使用ArcFace损失函数 和实例归一化(Instance Normalization,IN)来改进模型的性能。[结果和讨论] GANformer可以生成FID score为 93.20的蛇龙珠虚拟冠层图像,有效地改善数据不平衡问题。同时,相比基于卷积神经网络(Convolutional Neural Networks,CNN) 的深度学习模型,基于Transformer的深度学习模型在卷叶病感染程度诊断的问题上更具优势。 最佳模型Swin Transformer 在增强数据集上达到83.97% 的准确率, 比在原始数据集上提高3.86%, 且高于 GoogLeNet、MobileNetV2、NasNet Mobile、ResNet18、ResNet50、CVT 和T2TViT 等对照模型。而本研究所提的 CA-Swin Transformer在增强数据后的测试集上达到86.65%的分类精度,比在原始的测试集上使用Swin Transformer 精度提高6.54%。[结论]本研究基于CA-Swin Transformer使用滑动窗口法制作了葡萄园蛇龙珠卷叶病严重程度分 布图,为葡萄园卷叶病的防治提供了参考。同时,本研究的方法为无人机遥感监测作物病害提供了一种新的思路 和技术手段。