用TextGCN来做医学短语分类。
- 构建出一个大图之后,可以将子图的embedding直接送入GCN进行分类
- 优点是非常轻量化,节点和关系嵌入都是预先计算好的,2层的GNN几乎没有参数量,效果似乎也还不错
Graph的构建 #
节点嵌入(word2vec) #
word2vec Word2Vec模型中,主要有Skip-Gram和CBOW两种模型,从直观上理解,Skip-Gram是给定input word来预测上下文。而CBOW是给定上下文,来预测input word。这两种方法都是基于神经网络的无监督词嵌入算法。
关系建立(PMI) #
PMI(Pointwise Mutual Information,逐点互信息),即共现频率/各自出现的频率