KDD-Autograph2020-比赛总结

作者：

在

研一下学期和组内同学一同参加了KDD Autograph2020的比赛，最后也拿到了第二名的成绩，下面对本次比赛做个总结。

PASA_NJU代码总结

github代码

使用GraphNas对数据集搜索网络模型。(引自 Gao Y, Yang H, Zhang P, et al. Graphnas: Graph neural architecture search with reinforcement learning[J]. arXiv preprint arXiv:1904.09981, 2019.)
使用决策树根据数据集元信息，如节点数、边数、平均度等进行模型选择。
特征工程，我们发现将lpa和对特征的预测概率分布加入到features中对于citation类型图数据集会有性能提升，将边关系矩阵作为特征对于一些图数据集也会有提升。
加入EarlyStop早停机制以及自适应的集成策略。

JunweiSun代码总结

github代码

根据标签类别比率平衡loss（平衡的权重是比率开根号的倒数），类别数小于10或最大类别数小于最小类别数*10不使用。
使用microsoft的automl工具nni搜索模型超参，训练过程搜参，搜索空间较小。
使用0.1比例的验证集，评估指标为F1-score，验证集分值使用指数移动加权平均值来计算。
复现了多个论文的模型，如ResGCN, GraphSAGE, GIN, ARMA等，模型选择根据图信息如特征维度，平均度，是否为有向图选择。
特征工程，实现了one_hot / svd / degree / node2vec / adj等特征，实际上在原来特征上添加了svd特征。

评论

发表回复取消回复

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理。

更多文章