2023年8040威尼斯
信息技术研究生论坛(八)
场次一、
时间:2023年4月17日(星期一)8:00-12:00
地点:8040威尼斯507教室
报告题目一:基于低光图像的目标检测算法研究
报告人:银梦雨
报告简介:目标检测是高层计算机视觉领域中最基本、也是最具挑战性的问题之一,并且成为该领域中的一个研究大热门。然而,通用的目标检测器仅针对可见度高的RGB图像,对于低光图像的检测效果则很差。因此,采取多任务学习的做法,设计一个轻量级的低光增强模块,并将低光增强模块融合到检测器的结构中,从而提高对低光图像的检测性能。在LOD、ExDark等夜间目标检测数据集上对模型进行实验评估,其可达到较高的检测性能以及较低的推理时间,进一步可应用于夜间汽车自动驾驶。
报告题目二:基于低光照图像增强算法研究
报告人:韦新杰
报告简介:在非理想光照条件下,例如弱光、微光、背光等条件下拍摄经常会获得低光照图像,如何对这些图像进行有效校正增强是具有挑战性的。已有的算法在模型复杂度和算法性能之间没有达到很好的平衡,近年来,变换器(Transformer)卷积神经网络(CNN)在许多任务中都表现出较好的性能。我们探讨充分利用两者的优点并应用于低光照图像增强中。我们将CNN和Transformer联合使用实现端到端的低光照图像增强。
报告题目三:基于超分辨率图像的目标检测方法研究
报告人:袁梓健
报告简介:目标检测一直是计算机视觉中的一个核心的热门问题,目标检测也是其他计算机视觉任务的基础,比如:实例分割,目标跟踪和姿态估计等。但是,现有的基于深度学习的目标检测模型都是在高分辨率图像上训练,在低分辨率图像上的检测效果不尽如人意。因为低分辨率图片的质量较差,图像的精度较低,物体的特征不明显,因此普通的检测器很难进行目标检测。由此原因,基于超分辨率图像的目标检测方法研究可以使得低分辨率图片的检测误差降低,得到更加令人满意的结果,具有较高的实用性和发展前景。
报告题目四:利用教师答案与特征温度优化关系知识蒸馏
报告人:李健泽
报告简介:通常,结构更复杂且参数更庞大的神经网络拥有更好的性能,但是所带来的存储成本与计算复杂度也更高,当应用场景资源受限时,不能使用任意大的网络进行部署,需要把深度神经网络模型进行压缩处理。为了解决这一问题,利用知识蒸馏对深度神经网络进行压缩,把“知识”从繁琐但性能卓越的教师模型转移到轻量级的学生模型中,让学生网络保持其小参数结构的同时提升精度。
报告题目五:基于预训练模型的视频描述模型压缩算法
报告人:陈凯
报告简介:视频信息往往存在着大量冗余,如何从视频中提取有用的信息并且将其用自然语言描述出来,对低算力的终端是一个严峻的挑战。因此通过与训练模型得到基准视频描述模型,使用剪枝和知识蒸馏相结合的方法将基准模型进行压缩,使其部署在移动终端,在不损失很多性能的前提下尽可能压缩模型。
报告题目六:基于知识蒸馏的图像描述模型压缩和加速
报告人:崔振雷
报告简介:图像描述是在给定图像的情况下,用自然语言生成场景的语义描述任务。现有的大多数模型依赖于广泛使用的编码器-解码器框架,分为两个步骤,首先从输入图像中提取视觉特征,然后经过语言模型生成场景的描述。为了追求模型性能的提升,使得现有模型网络参数数量和内存使用空间居高不下,而且模型泛化能力下降,对处理器资源的要求更高,这就很难将图像描述所取得的优秀成果实际部署到移动嵌入式等资源受限设备。因此,在不影响图像描述模型性能的情况下,采用基于知识蒸馏算法来对图像描述模型进行压缩与加速,在不影响任务完成度的情况下,得到参数量更少、结构更精简的模型。被压缩后的模型计算资源需求和内存需求更小,相比原始模型能够满足更加广泛的应用需求。
报告题目七:基于深度学习的多曝光校正方法研究
报告人:韩冯刚
报告简介:现实生活中,相机硬件限制(光圈大小)、不恰当的相机参数设置(ISO、EV值、快门速度)以及环境光照等因素会导致拍摄的结果存在不同程度的曝光误差,可以大致分为过曝(Over-exposure)和欠曝(Under-exposure)两类。曝光误差会导致图像内容丢失、颜色偏差和对比度低等问题,对图像的后期修复造成了困难,降低图像的视觉质量。近年来,以卷积神经网络CNN为代表的深度学习技术被广泛应用于计算机视觉领域,在众多视觉问题上取得了重要成果。本报告以深度学习技术在多曝光校正问题中的应用为主题,结合最新研究成果,探讨如何构建适合多曝光误差校正问题的深度学习模型。
场次二、
时间:2023年4月17日(星期一)8:30-12:00
地点:8040威尼斯601教室
报告题目一:信息网络的近似迹等价
报告人:李润
报告简介:随着现代社会信息技术的飞速发展,现实生活中的各种交互信息场景呈现出越来越复杂的趋势。信息网络作为建模这些场景的工具也变得更加日益庞大且复杂。随着信息的快速增长,网络中出现的相似或重复的信息也日益增多。现实中处理这些相似或重复的信息将会导致计算资源的浪费。因此在保持信息网络结构信息不变的前提下,如何识别、处理和利用这些重复或相似的信息是信息网络研究中一个重要问题。信息网络上的近似迹等价的概念,旨在识别信息网络中一致或相似的信息,进而为识别、处理、利用这些重复信息提高相应的理论基础。
报告题目二:基于多模态语义图与图神经网络的视觉问答研究
报告人:蒋磊
报告简介:通过加入外部知识来辅助问题回答已逐步成为视觉问答研究的热点,但现有方法通常缺乏融合多种异构知识的机制,难以支持多模态语义图在知识型视觉问答中的基础作用。为此,提出了一种基于多模态语义图的知识型视觉问答方法,其特点是以语义图的形式统一了多源异构数据的表示,并设计了以此为输入的知识推理模型(MSG-KRM),实现了图文相关信息与不同类型外部知识的融合与推理。在构图阶段,提取问题文本、图像目标检测信息以及外部知识文本中的关键单词作为符号结点,然后利用知识图谱构建问题、视觉和外部知识等三类语义图,在此基础上添加非符号语义结点连接三个独立的语义图,并标记图中结点与边的类型。在推理阶段,一方面通过非符号结点注入多模态预训练模型中的知识;另一方面,为充分利用语义图中边和结点的类型信息,构造了类型感知的图注意力模块对多模态语义图进行深度推理与预测。
报告题目三:融合混合残差注意力机制的低剂量CT图像去噪方法
报告人:冯婉妍
报告简介:随着CT(计算机断层扫描)技术在现代医学中疾病诊断、治疗和手术方面中应用越来越广泛,CT扫描过程中的存在的潜在安全风险引起了人们的广泛关注。因此,降低CT扫描中的辐射剂量是预防风险的必要措施。然而,辐射剂量的减少通常会引入更多噪声和伪影,影响临床医生对病情的诊断。近年来,深度学习技术在医疗图像处理领域的发展,使得基于深度学习的图像去噪方法称为研究焦点之一。本报告介绍融合混合残差注意力机制的低剂量CT图像去噪方法,增强生成对抗网络对细节信息的捕捉能力。首先,设计了一种新的混合残差注意力机制,在通道维度和空间维度上,对于结构边缘、噪声浓度高的区域,为其分配较大权重,针对梯度变化小、噪声浓度低的区域,为其分配较小的权重来降低对其的关注程度,进一步提高模型的去噪能力。其次,将该模块融入UNet编码器-解码器结构中,并作为生成器,在加深网络深度的同时保留更多原CT图像结构特征。最后,融合多种损失函数,避免了梯度消失和爆炸的情况,使去噪图像在视觉上更贴近原图像。经定量分析和定性分析得出,该网络能够去除CT图像中的大部分噪声和伪影,呈现出良好的去噪效果。
报告题目四:基于特征分析的可解释CNN模型研究
报告人:徐洋
报告简介:深度学习是人工智能研究的核心之一,因为其在处理文本、图像、视频等多模态数据上优越的性能,所以在医疗、金融等领域有着重要的使用价值。然而,深度学习模型的黑盒特性是其被普及使用的重要障碍之一。特征分析方法是常见的研究神经网络模型可解释性的方法。在一般神经元模型基础上运用图模型或者决策树模型是比较新颖的特征分析模型内部的解释方法,通过这个图或者树来分析层与层和节点与节点之间的关系以达到解释整个模型的目的。但是,现有的特征分析研究大都集中在神经网络中的层或者神经元部分,忽略了模型其他部件的作用。本课题拟在卷积神经网络模型上,取模型的卷积核进行可解释性研究。
报告题目五:面向医学诊断的可解释细粒度图像分类模型
报告人:梁羿
报告简介: 本报告研究了面向医学诊断的可解释细粒度图像分类模型。首先介绍可解释性在医学诊断中的重要性,以及细粒度图像分类的应用背景。接着详细介绍目前常用的面向医学诊断的图像分类模型,并讨论了其优点和局限性。在此基础上,本报告重点探讨了面向医学诊断的可解释细粒度图像分类模型的研究现状和发展趋势,包括基于注意力机制、可视化解释、梯度CAM等方法的应用。通过对这些方法在医学诊断中的实际应用进行评估和总结,本报告将总结了目前研究的不足之处,并展望了未来的研究方向和应用前景。这对于深入研究和应用面向医学诊断的可解释细粒度图像分类模型具有重要的参考和指导意义。
报告题目六:基于Transformer的多模态阿尔兹海默症分类研究
报告人:莫书渊
报告简介:本研究关注全球人口老龄化导致阿尔茨海默症(AD)增加的问题,以及早期识别和治疗轻度认知障碍(MCI)在预防AD方面的重要性。研究将重点探讨多模态脑影像技术,如结构磁共振成像(sMRI)、弥散张量成像(DTI)、功能磁共振成像(fMRI)和正电子发射计算机断层显像(PET)在AD诊断中的应用。研究还将讨论直接查看脑影像在临床诊断中的局限性,例如耗时、主观性以及人类视觉对某些特征的敏感度不足。
为应对这些挑战,本报告将深入研究基于深度学习的图像处理和分析技术,特别是Transformer在脑影像特征提取中的应用。我们将讨论基于Transformer的多模态阿尔兹海默症分类研究的探索空间和应用前景,以及如何通过节省人力、保持精度和协助医生和患者来改善诊断效果。
报告题目七:基于社交媒体多模态情感识别的可解释性研究
报告人:潘秋宇
报告简介:当前社交媒体的信息往往不是单一的,而是包含有文本、图像、视频等多模态信息,而且各模态的信息并不是完全一致的,或者不完备的,这给目前的深度学习框架带来巨大的挑战。多模态融合虽然能解决单模态的局限性,但是真实开放环境下,多模态数据通常会受到噪声、自身缺陷及异常点等干扰,使得多模态互补性及一致性难以得到满足。深度学习模型一直以来被认为是一个黑盒,因此,如何准确评价多模态深度学习模型的实用性,并做出合理的可解释性,成为当前热门的课题。本课题将研究多模态模型的黑盒构造表示,研究不同模态数据底层特征的表示机理,分析不同模态数据所蕴含的本质信息,在理论上建立基于底层特征的多模态数据的统一表示模型。
报告题目八:可解释图像分类网络公平性研究
报告人:郑毅
报告简介:尽管深度模型具有优异的性能,但是较高的复杂度和非线性导致其透明度低、可解释性差。深度学习最早在图像分类任务上展现了巨大的潜力,随着图像分类精度的不断提升,研究者在图像任务上发现深度学习存在许多问题,如对抗鲁棒性、泛化性、公平性等问题。所以开展图像分类中可解释性研究为打开深度学习的黑箱和解决深度学习当前存在的问题提供了可能。深度学习在某些应用中可能会强化人类的偏见和歧视,导致决策过程中的不公平现象产生,从而对个人和社会产生潜在的负面影响,因此需要提高深度学习的应用可靠性、推动其在公平领域的发展。
报告题目九:Hubert优化下基于tacotron2的One-to-many语音转换与合成
报告人:罗圻
报告简介:近年来,基于tacotron2的语音合成技术占据了语音合成的主流。Tacotron2不仅拥有良好的语音合成性能,还对于one-to-many的语音转换具有良好的适应性。其中包括voice cloning等可以实现one shot 转换的方法。
然而,已有的one-to-many方法对于说话人特征的提取效果不佳,未能达到缩减对目标说话人的训练开销的目的。因此,报告提出一种基于tacotron2的,由Hubert优化改进的语音转换方法,以更小的训练开销实现one-to-many语音转换合成。
报告题目十:基于骨架与图卷积的动作识别
报告人:梁家侥
报告简介:人类动作识别在视频理解中发挥着重要作用,近年来已成为一个活跃的研究领域。一般来说,人类行为可以从多种模式中识别,如外观、深度、光流和身体骨骼。在这些模式中,动态人体骨骼通常传递与其他骨骼互补的重要信息。然而,与外观和光流相比,动态骨架的建模受到的关注相对较少。动态骨骼模态可以自然地由2D或3D坐标形式的人类关节位置的时间序列来表示。然后可以通过分析人类动作的运动模式来识别人类动作。早期使用骨骼进行动作识别的方法只需使用单个时间步长的关节坐标来形成特征向量,并对其进行时间分析。这些方法的能力是有限的,因为它们没有明确地利用关节之间的空间关系,而关节之间的关系对于理解人类行为至关重要。论文作者系统地研究了这种模式,目的是开发一种有原则和有效的方法来建模动态骨架,并利用它们进行动作识别。
场次三、
时间:2023年4月17日(星期一)14:30-17:30
地点:8040威尼斯601教室
报告题目一:数据挖掘算法在近似迹等价下的可保持性
报告人:李润
报告简介:通过信息网络的近似迹等价,可以得到一个相较于原始网络,规模更小的网络,但为了验证信息网络和其近似迹等价所蕴含的信息具有一致性,基于数据挖掘算法和方法,使用Pathsim算法和图神经网络方法等,验证它们在信息网络及其近似迹等价网络上结果的可保持性,进而验证近似迹等价网络和原始网络的信息一致或近似。
报告题目二:基于全交叉注意力的知识型视觉问答研究
报告人:蒋磊
报告简介:基于预训练的迁移学习被大量实验证明是种高效的方法,而且也被证明了模型中蕴含了大量非向量表示的知识。现有的方法大多是在一种预训练模型之上构建网络并进行推理,但是没有确切的结论表示联合不同预训练模型对视觉问答准确的性能的影响。本文利用多模态预训练模型对图像、问题本节提取特征,用语言预训练模型来提取外部知识特征。为了将两种不同的经过两种不同类型预训练模型编码的特征进行融合,以利用它们的推理能力以及内部知识,本文提出了全交叉注意力推理模型(FCA-KRM),它将图像特征、问题文本特征以及外部知识文本特征进行全交叉注意力的引导计算,让模型获得深入挖掘三类输入特征间的相关关系,并将不同输入特征引导的同一输入特征的输出特征进行加权融合,得到了特定情况下相关性更高的特征。在此基础上,本文将知识图谱嵌入向量引入自注意力和双交叉注意力的查询向量中,使模型在有更充足的知识进行推理。
报告题目三:融合Transformer的低剂量CT图像去噪方法
报告人:冯婉妍
报告简介:随着CT(计算机断层扫描)技术在现代医学中疾病诊断、治疗和手术方面中应用越来越广泛,CT扫描过程中的存在的潜在安全风险引起了人们的广泛关注。因此,降低CT扫描中的辐射剂量是预防风险的必要措施。然而,辐射剂量的减少通常会引入更多噪声和伪影,影响临床医生对病情的诊断。近年来,深度学习技术在医疗图像处理领域的发展,使得基于深度学习的图像去噪方法称为研究焦点之一。本报告介绍融合Transformer的低剂量CT图像去噪方法。首先,针对第三章中融合混合残差注意力机制的低剂量CT图像去噪方法难以建模像素间的长距离依赖关系的缺陷,设计了一种改进的Transformer模块,通过引入自注意力机制捕获全局上下文信息,通过非重叠的滑动窗口机制大幅降低了传统Transformer应用于二维数据中的计算复杂度,通过局部前馈神经网络对局部上下文依赖关系建模。其次,将该模块融入UNet编码器-解码器结构中,以生成对抗的方式进行训练。最后,混合加权多种损失函数,来最小化常规剂量CT图像与生成CT图像的像素级分布距离及人类视觉感知距离。经一系列对比实验和消融实验证明,所提出方法的去噪效果优于其他对比方法。
报告题目四:结合案例解释和特征分析的CNN模型可解释性算法研究
报告人:徐洋
报告简介:特征分析方法和案例解释方法是常见的两种研究神经网络模型可解释性的方法,且两种方法都是针对模型的一部分开展模型可解释性研究,这也是两种方法的缺陷所在。特征分析方法一般分析解释卷积神经网络模型内部某些层或者某些神经元所代表的含义。案例解释方法对模型结果做出了可靠性的分析,确保模型不会再犯“黑白天坦克”这类的错误。不过,案例解释方法只是针对模型结果做出了解释,它对模型内部选取通道案例的过程没有提及。所以,本课题认为将解释模型内部的特征分析方法和解释模型结果的案例解释方法结合起来是一种非常有潜力的研究卷积神经网络模型可解释性的手段,本课题拟将采取内外结合的手段对卷积神经网络模型展开可解释性研究。
报告题目五:基于迁移学习的乳腺癌诊断方法的研究
报告人:梁羿
报告简介:乳腺癌作为一种常见的女性恶性肿瘤,其早期诊断对于患者的治疗和预后至关重要。然而,乳腺癌诊断过程中面临着诊断准确性和效率的挑战。近年来,深度学习技术的快速发展为乳腺癌诊断带来了新的机会。迁移学习作为一种利用已有知识来提升新任务学习性能的技术,已经在乳腺癌诊断中引起了广泛关注。基于迁移学习的乳腺癌诊断方法通过利用从其他领域或类似任务中获得的经验知识,来改善乳腺癌图像分类的性能。这种方法可以有效地解决乳腺癌数据量较少、类别不平衡等问题,并提高乳腺癌诊断的准确性和效率。本报告将介绍基于迁移学习的乳腺癌诊断方法的研究现状和发展趋势。首先,将介绍乳腺癌的背景和诊断中的挑战。接着,将详细介绍迁移学习的基本概念和原理,并阐述其在乳腺癌诊断中的应用。随后,将介绍当前基于迁移学习的乳腺癌诊断方法的研究现状和主要应用方式,包括基于预训练网络的迁移学习、多源领域自监督学习、领域自适应等方法。最后,将总结目前研究的成果和不足,并展望未来的研究方向和应用前景,以期为乳腺癌诊断方法的发展和应用提供参考和指导。
报告题目六:MDETR:用于端到端多模态理解的目标检测
报告人:莫书渊
报告简介:MDETR是一种基于Transformer的目标检测方法,它在计算机视觉领域中为物体检测和识别提供了一种全新的解决方案。MDETR的核心思想是将物体检测问题视为自然语言处理问题,并利用端到端的Transformer模型实现高效的目标检测。MDETR通过将目标检测问题转化为自然语言处理问题,将图像和文本融合在一个统一的框架中,这使得模型可以同时处理图像和文本信息,进而实现更准确的目标检测,其采用端到端的训练方法,一起进行图像编码、目标检测和分类的任务,这种训练方式不仅减少了计算复杂度,还有助于提高模型的泛化能力MDETR利用Transformer的自注意力机制捕捉图像中各个物体之间的关系,以及物体与文本之间的关系。MDETR可以处理多模态数据,例如图像、文本和声音等。这使得模型可以在多种任务场景下表现出较好的性能,如图像标注、视觉问答和场景理解等。MDETR为计算机视觉领域带来了新的思路,其灵活性和强大的表示能力使其在多种任务场景中具有广泛的应用前景。
报告题目七:深度多模态分类模型中模态不均衡的定量分析方法
报告人:潘秋宇
报告简介:多模态融合虽然能解决单模态的局限性,但是在真实开放环境下,深度多模态分类模型往往存在模态表示强弱不一致和模态对齐关联不一致等的问题。多模态融合有望提高模型性能,但我们实际上发现即使多模态模型优于其单模态模型,它们也没有得到充分利用。在多模态模型中,差异较大的异质模态数据朝着统一优化目标被同时训练,如何合理的调整不同模态训练进程使之能够取长补短,从而达到整体最优,是一个值得去探究的问题。在本文中,我们提出了一种新的方法,即通过定量分析的方法衡量深度多模态分类模型中模态不均衡程度,在训练过程中动态监控不同模态对学习目标的贡献差异,然后利用它来自适应地调节梯度,为欠优化的模态提供更多的努力,从而给出最优深度多模态分类调制方法。
报告题目八:超球面上的对比表征学习研究
报告人:郑毅
报告简介:使用一个单位范数约束来学习表征,能有效地将输出空间限制为单位超球面。在单位超球面上特征会产生几个理想的特性:固定范数向量可以提高训练稳定性;此外,如果一个类的特征足够好地聚在一起,它们与特征空间的其余部分是线性可分的。一个好的表征应该对不必要的细节保持不变,并尽可能保留更多的信息,即满足对齐性和均匀性。与优化对比损失相比,直接对这两个属性(对齐和均匀性)进行优化可以获得相当或更好的性能。
报告题目九:基于ASR-TTS架构的语音转换轻量化探索
报告人:罗圻
报告简介:长期以来,人工合成语音广泛应用于日常生活中需要机器朗读文字的场景中。基于语音拼接的语音合成技术能够满足最基本的文字转语音需求。但此类方法在自然度和情感方面与真人朗读有着巨大差距。此外,使用语音拼接技术的语音合成对于音源录制,分词和后期处理设备均提出了较高要求,不能满足个人及小型单位企业的定制需求。
近年来,语音转换技术兴起,基于已有语音的音色转换使高质量的合成语音成为可能。然而,许多语音转换算法受制于对平行训练语料的高要求,即使是一些非平行语音转换算法,前期投入的训练开销也非常庞大。因此,本课题提出一种基于ASR-TTS的语音转换方法,以更小的训练开销达到可接受的语音转换质量。
场次四、
时间:2023年4月17日(星期一)13:00-15:00
地点:8040威尼斯一楼报告厅
报告题目一:硬件损伤下IRS辅助的SWIPT系统安全波束成形设计
报告人:董洋帆
报告简介:由于大多数研究考虑的收发机硬件系统均为理想情况,而实际应用中收发机往往会不可避免地出现硬件损伤的问题,因此考虑了一个具有硬件损伤的IRS辅助的SWIPT系统。该系统的接收机采用分布式接收模型,基站与IDR处存在硬件损伤,硬件损伤建模为方差正比于信号功率的加性高斯分布的失真噪声,而EHR则被视为潜在窃听者。在发射功率不超过基站最大发射功率、接收能量不小于最小接收能量门限及IRS反射系数辅助向量中每个元素的单位模约束的条件下,构建了系统安全速率最大化问题的数学模型。对于该优化问题的非凸性与耦合性,首先利用交替优化将原优化问题分解成两个子问题,第一个子问题求解基站发射波束成形向量与AN向量,第二个子问题求解IRS反射系数辅助向量;然后利用交替优化和SDR解决子问题的非凸性,迭代直至求出问题的最终解。与不考虑硬件损伤、不考虑IRS或不引入AN的传统方案的对比仿真实验结果表明,本文提出的所提算法具有更好的安全性能和抗硬件损伤性能。
场次五、
时间:2023年04月17日(星期一)15:00-18:00
地点:计算机学院706
报告题目一:移动边缘计算中服务功能链的自适应优化部署策略
报告人:熊泽凯
报告简介:为解决移动边缘计算中面向用户的服务功能链(Service Function Chain, SFC)部署成本开销过大、时延过长问题,提出了针对服务功能链的支出成本与时延联合自适应优化的部署策略。首先,在虚拟网络功能(Virtualized Network Function, VNF)节点选取阶段,考虑路径损耗这一无线信道衰落问题,根据有线用户与无线用户的位置情况,选择当前最佳节点以降低服务功能链的响应时延。其次,在服务节点配置阶段,根据用户请求处理的数据内容的新鲜度记录,自适应动态增加和删减相应的缓存,利用资源感知算法在保证数据传递可靠性的同时,减少服务节点的配置个数,降低配置开销。最后,在服务功能链部署阶段,利用基于KSP(K-shortest Paths)的功耗感知算法确定最佳节点映射排序与通信链路,在减少通信链路重映射的同时,还能够保证部署的服务功能链的低成本与低时延。实验仿真结果表明,相比于已有方案,该方法能够有效降低部署成本与时延,并能对不同用户的服务功能链部署做到自适应优化,提高了服务功能链的部署成功率。
报告题目二:BDS-3+GPS三频精密单点定位及性能分析
报告人:王靖君
报告简介:针对单系统定位存在的卫星可见数目较少、卫星分布几何结构较差等缺陷导致的定位精度差与收敛时间长的问题,提出了BDS-3+GPS联合三频PPP方案。首先基于RTKLIB软件对BDS-3和GPS观测数据从卫星可见性、星下点轨迹、信噪比、多路径效应等方面进行了数据质量分析;其次在PPP观测模型的基础上研究了BDS-3+GPS三频数学模型,分析了BDS-3、GPS各自的信号频率之间偏差以及BDS-3与GPS的系统间偏差;最后在完成BDS-3+GPS三频无电离层两两组合、无电离层组合和非差非组合构造合理的参数模型后,从静态和仿动态两个角度对BDS-3+GPS三种PPP模型进行了性能分析。PPP解算结果表明:在加入了GPS联合定位后,对于静态PPP和动态PPP解算的定位精度和收敛速度都有明显的提升:静态方面,N、E、U三个方向平均定位精度分别为2cm、1.2cm、3.4cm,分别提高了28.6%、31.4%、27.9%;平均静态收敛时间分别为22.1min、16.3min、27.2min,分别提升了57.7%、58.8%和57.6%;动态方面,三个方向平均定位精度分别为5.3cm、4cm、7.1m,各自分别提高了27.8%、18.8%、26.9%;三个方向的平均收敛时间分别为32.7min、25.7min、37.2min,分别提升了54.2%、60.2%和53.7%。
报告题目三:去蜂窝大规模MIMO系统功率控制研究
报告人:智恒中
报告简介:首先,建立了去蜂窝大规模MIMO系统上行链路的能量消耗模型,得出了系统总频谱效率与总能量消耗的关系,并提出了能量效率指标,采用经典的单目标优化遗传算法对用户发送功率进行控制,提升了系统总能量效率。其次,在现有的以提升系统中用户频谱效率的问题中,现有的功率控制研究主要分为两种,第一种注重公平性,即以提高系统中最差用户的性能为目标,建立最大最小问题进行求解;另一种则注重系统的总频谱效率,尽可能的最大化系统中所有用户的平均频谱效率,无视性能最差受干扰最强用户的体验。可以看出,这两类研究无法全面提升系统的性能。因此,本章综合这两类研究,同时考虑系统总频谱效率和性能最差用户体验,以提升系统中用户的平均频谱效率和最大化性能最差用户的频谱效率为优化目标,将问题建模成一个多目标优化问题,并采用经典的非支配遗传排序算法进行求解,所得一组功率控制系数,既也提升了系统的整体性能,也保证了系统公平性。此外,通过引入多目标优化的思想,我们不仅可以改善系统中性能最差用户的体验,还可通过修改目标函数,提升任意优先级用户的体验,具备极强的灵活性。
报告题目4:基于拓扑优化和链路感知的无线体域网路由协议
报告人:廖栋森
报告简介:为解决无线体域网(wireless body area network, WBAN)在人体运动过程中网络拓扑结构频繁变化导致链路质量和WBAN性能下降等问题,首先根据人体结构对WBAN网络拓扑进行优化,通过添加中继节点建立WBAN主干网,提供节点和hub之间相对稳定的链接,然后提出了适用于WBAN拓扑优化后的路由策略(Routing protocol based on topology optimization and link awareness, R-TOLA)。R-TOLA综合了链路质量感知和代价函数,通过调整主干网中继和节点中继获得最优化路径。仿真实验表明,基于拓扑结构优化和链路感知的R-TOLA协议和其他路由协议相比,在人体拓扑网络结构频繁变化的环境下具有网络生存时间更长,吞吐量更大等优势。
报告题目五:基于区块链的无人机网络频谱感知方法
报告人:余琪琦
报告简介:本章基于区块链,采用智能合约和数字签名技术,提出了一种基于信誉机制的无人机安全协作频谱感知算法。在第三章基于k-means算法分簇的基础上,指定一个簇头无人机负责收集并处理其他感知无人机的感知数据,再将结果发送至服务平台。在每个簇中综合考虑检测概率、簇头无人机预算和次级无人机距离。然后建立了选择函数,簇头节点通过计算来选择注册次级无人机。各个簇头无人机在每次感知任务结束后,根据最后判决结果对簇中感知无人机进行奖惩,发放相应的报酬并更新信誉值,同时充当矿工角色,将包含本簇频谱感知任务的信息和已更新信誉值的区块发布至区块链上。仿真结果分析表明,该算法提高了无人机协作频谱感知的准确性和安全性,有效地抵御了SSDF攻击,保护了感知无人机的个人隐私。
报告题目六:WBAN环境中可信SMD节点分配方案
报告人:祝长鸿
报告简介:提出了一种WBAN环境中可信智能移动设备(Smart Mobile Device, SMD)节点的资源分配方案。在由云计算层、SMD层以及患者设备层组成的三层网络中,资源受限的患者设备可以将任务请求发送到距离一跳以内的SMD节点处理任务,如该SMD节点的任务队列过载,则会将该任务请求转发到邻居节点,从中选择符合任务执行条件的SMD节点执行任务。采用贝叶斯方法评估患者设备与SMD节点、SMD节点与SMD节点之间的直接信任值,考虑到当节点之间交互次数过少时仅计算直接信任值并不可靠,在信任模型中加入了邻居节点的推荐信任值以及推荐值的可靠性、推荐节点与目标节点的熟悉程度,使得信任评价更加合理。将任务执行过程中的信任值与时延加权为一个单目标优化问题,设计了一种改进遗传算法得到了在每个时隙中的最优决策。通过实验结果验证了所提出方案能够准确识别出网络中的超级节点、恶意节点以及普通节点,同时能有效减少平均任务执行时延。
报告题目七:基于服务器协作机制的任务卸载与资源分配
报告人:唐煜星
报告简介:面对大量用户接入以及多个小基站部署下的超密集边缘计算网络场景,由于用户数与服务器数量增加,用户之间产生的资源竞争会影响整个网络性能,单个任务卸载到单个服务器的单一卸载机制往往不能有效发挥系统性能。为此提出了一种基于服务器协作机制的任务卸载方案。为了最大化利用服务器资源,可将用户任务进行拆分,一部分任务卸载到主服务器中,当主服务器具备的计算资源不足时,将剩余任务卸载到相应的协作服务器上。采用拉格朗日函数结合KKT条件解决了最优计算资源分配问题,构造辅助约束函数利用线性规划的方法解决了最优任务分配比例问题,并提出了一种基于任务优先级的混合启发式卸载算法解决最优卸载决策问题。仿真结果表明,与其他卸载方案及本地执行策略相比,所提方案有效提升了系统性能。
场次六、
时间:2023年04月21日(星期五)16:30-18:30
地点:8040威尼斯509教室
报告题目一:智能反射面辅助通信感知一体化
报告人:李文武
报告简介:由于频谱的稀缺性和5G网络以外的潜在应用,综合传感与通信(ISAC)最近引起了广泛的关注。众所周知,通信和雷达信号在其波形上有一些共同的特征。尽管它们的目的不同,但使用一个信号来实现另一个信号的是可行的。ISAC不仅可以实现通信系统和雷达系统的频谱资源共享,还可以实现全共享平台的统一波形传输,实现通信和雷达传感功能的同时实现,显著提高了频谱/能量/硬件效率。可以预见,在下一代无线网络中,ISAC将成为需要高质量无所不在无线通信的各种应用的支持技术,此外,由于雷达传感功能依赖于对接收信号回波的分析,因此联合优化了接收波束形成,以提高雷达传感性能。虽然这些方法极大地增强了通信和雷达传感功能,但在恶劣的传播条件下,性能下降仍是不可避免的。在如此复杂的电磁环境中,最近出现的可重构智能表面(RIS)技术提供了一个潜在的革命性解决方案,RIS的部署建立了发射机和接收机之间的非视距(NLoS)连接,扩大了覆盖范围,并引入了额外的dof以提高系统性能。因此,RIS在各种无线网络中的应用得到了广泛的研究。基于这些,我们研究了一个智能反射面场景里实现ISAC,并且考虑了一个在保证一定通信性能的情况下,最大化雷达感知性能的问题
报告题目二:面向第六代移动通信技术的联邦学习相关研究进展
报告人:杨洋
报告简介:联邦学习是一种新兴的注重数据安全与用户隐私保护的分布式机器学习架构。与传统的集中式机器学习不同,联邦学习可以在不共享原始训练数据的情况下训练高性能的神经网络模型,有效降低了海量数据的传输负载与存储需求,同时避免了用户敏感数据的泄露。第六代移动通信对通信时延与隐私保护均提出了很高的要求,同时智慧城市、物联网对模型训练的需求也与日俱增,因此联邦学习预计在第六代移动通信中发挥重要作用。我们将阐述联邦学习在通信与隐私保护方面的相关研究现状,介绍联邦学习的前沿技术,并探讨仍然存在的开放性问题,以期提出新的见解与优化技术,为联邦学习的广泛应用做出贡献。
报告题目三:在波束失准下太赫兹无线传输的分集接收
报告人:甘廷光
简介:衰落是来源于电磁波多径传输的不同路径行程差产生的干涉,和不同路径上传输媒质微弱不均匀度的增强、漂移和扩散引起行程差的随机变化。在未来的6G通信所涉及的太赫兹( THz )无线传输链路中,我们希望缓解太赫兹( THz )无线传输信道中衰落的影响。而分集技术是用来补偿衰落信道损耗的,它通常利用无线传播环境中同一信号的独立样本之间不相关的特点,使用一定的信号合并技术改善接收信号,来抵抗衰落引起的不良影响。分集接收是指利用电磁波在空间、频率、极化、时间上有足够大差异时衰落的不相干性,用分别接收、解调、然后合成,或一并接收、分别解调后合成的方法,获取稳定信号的接收方式。我们分析了考虑在波束失准下太赫兹无线传输信道的多天线分集接收的性能。使用的复合信道模型捕获了多径衰落、动态阴影、分子吸收损耗和传播损耗的影响。我们期望能此工作能完善太赫兹通信方面的性能分析。
报告题目四:基于RIS技术的5G/6G移动通信信号增强方案研究
报告人:李俊铭
报告简介:在5G与未来6G的移动通信中,高频信号的传输和接收问题一直是研究的热点。频谱资源的紧缺和高频系统的能耗消耗等问题,对移动通信的发展带来了挑战。智能反射面(RIS)技术作为一种新型的无线通信技术,为解决信号传输问题提供了新的解决方案。本报告将全面介绍RIS技术的原理、关键技术和在移动通信中的应用,重点研究基于RIS技术的移动通信信号增强方案。我们将探究MIMO技术与RIS技术的结合,研究级联信道和非线性干扰等问题。同时,我们将介绍信道估计和优化算法,并探讨压缩感知技术在RIS技术中的应用。通过建立信号传输模型和利用数学概率论和矩阵分析等方法,深入探究RIS技术在信号增强方案中的性能表现,评估其应用效果和实用性。最后,我们将对RIS技术在5G/6G移动通信中的应用前景进行展望,探讨其未来的发展趋势和挑战。
报告题目五:基于稀疏编码优化CenterNet鲁棒性研究
报告人:杨昶楠
报告简介:作为计算机视觉中的一项重要任务,目标检测主要用于对图像中指定类型的目标进行检测。传统的目标检测通过不断移动窗口选择目标区域,提取特征,最后进行分类。但是这种机制很难能将图像的特征准备表达,从而使检测精度一直不高。
目前的基于深度学习的目标检测通过卷积神经网络进行自我学习,尽可能的模仿人的大脑来释放计算能力,能使其准确又快速地识别各种大小的目标。主要分为两种算法:两阶段算法,以R-CNN等为代表,先从图像提取候选区域,再回归分类和边框信息。一阶段算法,以SSD、YOLO等为代表,这类算法不需要事先筛选候选区域,而是将最后得到的特征图划分为不同的区域,在每个区域直接输出得到一定数量的预测框大小以及该区域的分类信息,这类算法的精度一般略低于两阶段算法但由于缺少了预测框的筛选和优化过程使得其检测速度更快,实时性更高。