图表示学习(raphepresentationearning)

在文本数据中,单词在一个句子中连接在一起,并且它们在该句子中具有固定的位置。

在图像数据中,像素排列在有序的网格空间上,可以用网格矩阵表示。

但是,图中的节点和边是无序的,并且具有特征。这导致在保留图结构的同时,将图实体映射到潜空间并且保留邻近关系具有挑战性。

图表示学习主要分为五大类:图核模型 (graph kernels)、矩阵分解模型 (matrix factorization models)、浅层模型 (shallow models)、深度神经网络模型 (deep neural network models) 和非欧几里得模型 (non-Euclidean models)。

图核模型是利用核函数,度量图与其实体之间的相似性, 图核的主要思想是将原始图分解为子结构,并基于子结构特征构造向量嵌入。

图核模型主要有两种类型:kernels for graphs 和 kernels on graphs。

局限性:图核模型处理大规模图时的计算复杂性较高,因为计算图核是一个 NP 难问题。

矩阵分解模型的目标是将邻近矩阵分解为小规模矩阵的乘积,然后拟合其邻近性以学习节点嵌入。

矩阵分解模型主要有两种类型:拉普拉斯特征分解 (Laplacian eigenmaps) 和 节点邻近矩阵分解 (Node proximity matrix factorization)。

局限性:矩阵分解模型由于计算复杂性而无法捕获高阶接近性。

浅层模型是一种嵌入模型,旨在通过最大化目标节点的邻域概率学习节点嵌入,从而将图实体映射到低维向量空间。该模型通常使用采样技术来捕获图结构和邻近关系,然后基于浅层神经网络算法学习节点嵌入。

浅层模型根据学习嵌入的策略,可分为两类:结构保存模型和邻近性重建模型。

局限性:

图神经网络 (GNN) 以归纳式学习节点嵌入。

Recurrent GNNs:旨在通过每个隐藏层中具有相同权重的递归层来学习节点嵌入,并递归运行直到收敛。不足:RGNN 模型的每个隐藏层使用相同的权重可能会导致模型无法区分局部结构和全局结构。

Graph autoencoder: 通过重构输入图结构来学习复杂的图结构, 图自动编码器由两个主要层组成:编码器层将邻接矩阵作为输入并压缩以生成节点嵌入,解码器层重建输入数据。

GCNs: 是在每个隐藏层中使用具有不同权重的卷积算子,捕获和区分局部结构和全局结构。

GAT: 通过注意力机制在消息聚合的过程中为每个邻居节点分配不同的权重。

优点:

局限性:大多数 GNN 在堆叠更多 GNN 层时,会遇到过度平滑的问题和来自相邻节点的噪声的问题。

Graph transformer models主要有三种类型:用于树状图的transformer (transformer for tree-like graphs),带GNN的 transformer (transformer with GNNs),和全局自注意力的transformer (transformer with global self-attention)。

Graph transformer 的优点:

由于现实世界中的图可能具有复杂的结构和不同的形式,因此欧几里得空间可能不足以表示图结构,并最终导致结构损失。

非欧几里得模型主要有三种:球面型 (spherical)、双曲型 (hyperbolic) 和高斯型(Gaussian)

Hoang V T, Jeon H J, You E S, et al. Graph representation learning and its applications: a survey[J]. Sensors, 2023, 23(8): 4168.

THE END
0.特征工程(III)特征构造特征工程(III)--特征构造 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。 特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤jvzquC41dnuh0lxfp0tfv8vsa6763A7991gsvrhng1jfvjnnu1748>:::98
1.特征选择与特征构造:结合使用的实践本文详细介绍了特征选择与特征构造在数据挖掘和机器学习中的重要性,涵盖了核心概念、算法原理、操作步骤及实际应用案例,包括信息增益、Lasso回归、生成树和PCA等方法。同时探讨了未来的发展趋势和挑战。 1.背景介绍 在数据挖掘和机器学习领域,特征选择和特征构造是非常重要的。特征选择是指从原始数据中选择出与目标变量相jvzquC41dnuh0lxfp0tfv8zpkxksu|p{42761jwvkerf1mjvckrt1:87:2>649
2.闲鱼搜索相关性——体验与效率平衡的背后特征构造 搜索相关性的特征这里分为三个维度:基础特征、文本匹配特征以及语义匹配特征。基础特征主要包括 query 和 item 的统计特征,以及结构化相关的匹配特征,如类目是否匹配、关键属性(品类、品牌、型号等)是否匹配。文本匹配特征主要是字面上的匹配特征,如 term 匹配数、匹配率、带同义词策略的匹配、带 term weighjvzquC41yy}/kwkqs0io1jwvkerf1VrcSk{:vP6U{6LJZT;cK
3.Python机器学习应用之工业蒸汽数据分析篇详解python#%%对训练集和测试集进行特征构造 train_data2, test_data2 = auto_features_make(train_data,test_data,func_dict,col_list=test_data.columns) 四、对特征构造后的训练集和测试集进行主成分分析 1 2 3 4 5 6 7 8 9 10 11 12 #%%PCA from sklearn.decomposition import PCA #主成分分析法 #PCA方法jvzquC41yy}/lk:30pku1jwvkerf1;86;7
4.机器学习特征工程3自动特征构造(FeatureTools)Featuretools是一个执行自动特征工程的框架。它擅长于为深度学习把互相关联的数据集转换为特征矩阵。我们可以将特征构造的操作分为两类:「转换」和「聚合」。我们通过下面的例子来了解FeatureTools使用方法。 代码示例地址: https://github.com/scottlinlin/auto_feature_demo.git jvzquC41yy}/lrfpuj{/exr1r1=29A7fdg8f3n
5.建议收藏机器学习数据预处理(四)——特征构造(内附代码)本文介绍了特征构造的方法,包括类别特征的编码、独立热编码、频率编码和目标编码;数值特征的二值化和交互特征;时间特征的基础周期特征、特殊周期特征和时间差。通过实例展示了如何对数据进行有效处理。 📌特征含义类型 非匿名特征:此部分的特征一般都带有特定的意义,我们可以根据不同的意义来挑选特征,构造特征。 jvzquC41dnuh0lxfp0tfv8|gkzooa=92576::8ftvkimg8igvcomu86487::8@9
6.特征工程实战特征工程-特征构造 1 特征构建引言 如下数据如何放入机器学习算法中 可以看出数据中有分类数据,还有缺失值,非数值型的数据,目前的大部分机器学习算法是不能处理有缺失值的数据,机器学习使用的都是数学和统计学的方法,所以需要对这份数据进行特征构建,使它能够放入到机器学习中去。jvzquC41dnuh0lxfp0tfv8r2a7823A<851gsvrhng1jfvjnnu1734?62:39
7.基于对称注意力机制的视觉问答系统显示缩略图 本文结构 1 引言 2 相关工作 2.1 视觉问答 2.2 注意力机制 3 视觉问答方法模块介绍 3.1 基于LSTM和RCNN的特征构造 3.2 对称注意力模型 3.3 新模型整体架构 3.4 总结 4 实验 4.1 数据集和实验细节 4.2 实验细节 4.3 实验分析 5 结论与展望 参考文献 jvzquC41e/y.c7tti0io1qyon1814:4719?377mvon
8.湘东新元古代沉积岩的地球化学和碎屑锆石年代学特征及其构造意义27 努尔喀纳提·马达依普;湘东新元古代沉积岩的地球化学和碎屑锆石年代学特征及其构造意义[D];新疆大学;年 28 徐文平;内蒙古达青牧场一带二叠系碎屑锆石年龄及其地质意义[D];中国地质大学(北京);年 29 柏治安;湘东新元古代沉积岩的地球化学和碎屑锆石年代学特征及其构造意义[D];桂林理工大学;年 30 任晓锋;东天jvzquC41yy}/ewpk0eun0ls1Ctzjeuj1ELLEVxycn/_TZK72347329:0jvs
9.东秦岭北部富碱侵入岩带岩石地球化学特征及构造意义的岩石学和地球化学,关于岩石类型、岩石组合及时空分布方面的成果,已有另文阐述[9],本次工作选择塔山、鱼池、双山、乌烧沟、磨沟、张士英、太山庙、龙王幢、草庙、三合等富碱侵入体,在区域上研究各类岩石的主元素组成、痕量元素和Nd,Sr和Pb同位素,探讨这些岩石的化学成分空间分布变化规律、形成构造环境与源区特征jvzq<84yyy4hnxgcnikprjwm0qxh0ls1vjktk|46929/j}r
10.读《金赛性学报告》学到的一些性学知识日记一、女性生理构造特征 女性阴道的感受力很低,这我已经在豆瓣上看到过科普的帖子了,几十年前的解剖学研究也早已揭示了这一点。这本书也提到,“大多数女人的阴道内壁缺乏触觉感受器官…只是极靠近阴道开口处才会有所反应”,性交合中的插入引起的更多是心理上的满足感,还有此动作附加的对小阴唇、阴蒂和阴道前庭的挤压jvzquC415i4eq~gcp0ipo8sqvg592@>363981HktqoCbw}mqt
11.机器学习中的特征工程机器学习特征工程4、寻找高级特征(特征构造) 四、特征工程降维 一、特征工程概述 特征工程是数据分析中最耗时间和精力的一部分工作。数据和特征决定了机器学习的上限,而模型和算法则是逼近这个上限。因此,特征工程就变得尤为重要了。特征工程的主要工作就是对特征的处理,包括数据的采集,数据预处理,特征选择,甚至降维技术等跟特征有关jvzquC41dnuh0lxfp0tfv8fukcrfghgktf5bt}neng5eg}fknu596A;5636