
SERVICE PHONE
363050.com发布时间:2025-10-14 04:01:40 点击量:
哈希交易所官网入口,哈希交易所注册,哈希交易所登录,哈希交易所下载,哈希交易所APP/哈希交易所官网入口为用户提供官方注册、登录、APP下载与币种交易服务,安全合规,快速充值提现,全面满足数字资产投资需求。
(1)选择开源数据集,提取数据集中所有代码特征,包含文本特征和结构特征;进一步
(3)构建基于深度哈希的代码迁移网络模型,所述的代码迁移网络模型包含向量表示
其中,向量表示代码特征分布模块用于将代码特征向量归一化,计算代码对之间的代
码相似矩阵,通过代码相似矩阵中的向量表示代码对的特征分布;并进一步通过联合代码
深度哈希模块用于将代码特征向量转化为二进制哈希编码向量,并在归一化后计算得
(4)利用聚类分组后代码对的代码特征向量对代码迁移网络模型进行训练,使深度哈
希模块学习到的哈希编码相似矩阵与联合代码相似矩阵对齐,从而保留代码对之间在哈希
然后通过训练好的模型对开源的代码数据集的代码进行哈希表示,构建代码哈希数据
(5)对于待迁移的代码,提取代码特征向量,输入训练好的模型,通过深度哈希模块得
2.根据权利要求1所述的基于深度哈希的代码迁移方法,其特征在于,步骤(1)中,提取
(1‑1)将代码采用ANTLR解析为具体语法树CST,将意义相同,但是名称不同的词汇进行
3.根据权利要求1所述的基于深度哈希的代码迁移方法,其特征在于,步骤(2)中,聚类
4.根据权利要求1所述的基于深度哈希的代码迁移方法,其特征在于,步骤(3)中,向量
5.根据权利要求1所述的基于深度哈希的代码迁移方法,其特征在于,步骤(3)中,通过
6.根据权利要求1所述的基于深度哈希的代码迁移方法,其特征在于,步骤(3)中,深度
哈希模块中,采用改进的词袋模型NBOW,采用三个具体tanh(·)激活函数的全连通FC层来
代替原始词袋模型BOW中的输出层,让输出控制在(‑1,1)区间内,从而将原始的代码特征向
7.根据权利要求1所述的基于深度哈希的代码迁移方法,其特征在于,步骤(4)中,采用
了双编码器架构,利用独立的编码器,分别将代码对编码到表示向量和对应的二进制哈希
编码中;引入新的三元组度量损失,保证学习到的二进制哈希编码保留代码对之间在哈希
8.根据权利要求7所述的基于深度哈希的代码迁移方法,其特征在于,三元组度量损失
作系统和windows操作系统不兼容,因此依赖windows的软件迁移到国产操作系统需要代码
CN115756433A的中国专利公开了一种代码平台的迁移方法,通过可视化的迁移界面,实现
了中待迁移代码平台的配置信息和目标代码平台的配置信息的创建,以及用于将待迁移代
码平台的配置信息转换至目标代码平台的配置信息的转换规则的创建,并在获得待迁移代
码平台的第一领域专用语言文件后,根据转换规则,将第一领域专用语言文件自动转换为
目标代码平台的第二领域专用语言文件。但是,这种迁移非常依赖于代码的风格,简单的修
CN112181489A的中国专利文献公开了代码迁移方法,包括获取源文件以及目标转换框架信
息;根据所述待匹配字符串,确定所述源文件对应的待转换框架信息;获取所述框架类型对
应的配置文件;根据所述待转换框架信息以及所述目标转换框架信息,从所述多个映射关
系中,确定目标映射关系;采用与所述字符类型对应的匹配方式,对所述待匹配字符串进行
匹配,得到与所述源框架字符串相匹配的待转换字符串;根据所述目标映射关系,将所述待
转换字符串转换为所述目标框架字符串,得到所述源文件在所述目标转换框架下的目标文
件。但是,代码的结构和自然语言的结构不同,利用文本信息忽略了代码本身的语义结构,
(1)选择开源数据集,提取数据集中所有代码特征,包含文本特征和结构特征;进
(3)构建基于深度哈希的代码迁移网络模型,所述的代码迁移网络模型包含向量
的代码相似矩阵,通过代码相似矩阵中的向量表示代码对的特征分布;并进一步通过联合
(4)利用聚类分组后代码对的代码特征向量对代码迁移网络模型进行训练,使深
度哈希模块学习到的哈希编码相似矩阵与联合代码相似矩阵对齐,从而保留代码对之间在
(5)对于待迁移的代码,提取代码特征向量,输入训练好的模型,通过深度哈希模
块得到对应的二进制哈希编码,并从代码哈希数据库检索到相匹配的迁移后的代码。
(1‑1)将代码采用ANTLR解析为具体语法树CST,将意义相同,但是名称不同的词汇
步骤(2)中,聚类分组的数目为10,通过基于代码路径的区分建立不同的聚类。
步骤(3)中,向量表示代码对特征分布模块中,采用l2‑norm将代码特征提取向量
[0023] 通过相加整合代码相似矩阵 构造联合代码相似矩阵S,公式为:
深度哈希模块中,采用改进的词袋模型NBOW,采用三个具体tanh(·)激活函数的
全连通FC层来代替原始词袋模型BOW中的输出层,让输出控制在(‑1,1)区间内,从而将原始
步骤(4)中,采用了双编码器架构,利用独立的编码器,分别将代码对编码到表示
向量和对应的二进制哈希编码中;引入新的三元组度量损失,保证学习到的二进制哈希编
小哈希编码对和联合代码对之间的距离,即使深度哈希模块学习到的哈希编码相似矩阵与
进词袋模型增加深度哈希网络,将代码特征转化为二进制编码,提高了代码迁移的效率和
代码采用ANTLR解析为CST。简化的规则包括如下:(1)将意义相同,但是名称不同
的词汇进行统一,比如while转化为for;(2)将public、private等额外修饰词删除。
步骤12、从解析的简化具体语法树(SCST)提取子节点到根节点的全部路径。
解析的CST忽略中间节点,选取子节点到叶子节点之间的路径,提取全部路径。
将提取的路径进行编码,按照左孩子右兄弟的方法,对路径进行编码,并且满足编
步骤2、利用k‑means算法,将代码结构特性进行聚类,聚类数目为10,通过基于代
向量表示代码对特征分布模块中,采用l2‑norm将代码特征提取向量归一化,计算
空间,使用矩阵 描述高阶邻居相似度高,两个向量也应该接近其他向量,构造联合代
深度哈希模块中,采用改进的词袋模型NBOW,采用三个具体tanh(·)激活函数的
全连通FC层来代替原始词袋模型BOW中的输出层,让输出控制在(‑1,1)区间,从而将原始的
引入新的三元组度量损失,保证学习到的哈希码能够保留代码对之间在哈希空间和原来的
所有实验都是基于Pytorch实现的,实验环境为Linux操作系统,总共部署4块
进行了时间效率实验。评估编程是用C++编写的,程序允许使用CPU的单线程。NBOW的学习率
为1e‑5,通过AdamW算法进行训练。隐藏层大小为768,每个模块的批次是10,所有基线的输
出二进制哈希码的大小是128。超参数β、λ1、λ2分别为0.6、0.1、0.1。在查询类别预测模块
步骤5、使用查询集在训练好的模型上进行检索,评估该模型的检索效率和精度;
使用查询集在训练好的模型上进行检索,评估该模型的检索效率和精度;对代码进行分类,
to c#训练集上验证网络的性能,测试结果对比如表1所示。其中,竖列为开源项目的迁移精
可以发现,本方法虽然精确度上略有差别,但在保证较高精度的同时,花费时间很
以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做