KDD-Autograph2020-比赛总结

25次阅读

共计 669 个字符,预计需要花费 2 分钟才能阅读完成。

研一下学期和组内同学一同参加了 KDD Autograph2020 的比赛,最后也拿到了第二名的成绩,下面对本次比赛做个总结。

PASA_NJU 代码总结

github 代码

  1. 使用 GraphNas 对数据集搜索网络模型。(引自 Gao Y, Yang H, Zhang P, et al. Graphnas: Graph neural architecture search with reinforcement learning[J]. arXiv preprint arXiv:1904.09981, 2019.)
  2. 使用决策树根据数据集元信息,如节点数、边数、平均度等进行模型选择。
  3. 特征工程,我们发现将 lpa 和对特征的预测概率分布加入到 features 中对于 citation 类型图数据集会有性能提升,将边关系矩阵作为特征对于一些图数据集也会有提升。
  4. 加入 EarlyStop 早停机制以及自适应的集成策略。

JunweiSun 代码总结

github 代码

  1. 根据标签类别比率平衡 loss(平衡的权重是比率开根号的倒数),类别数小于 10 或最大类别数小于最小类别数 *10 不使用。
  2. 使用 microsoft 的 automl 工具 nni 搜索模型超参,训练过程搜参,搜索空间较小。
  3. 使用 0.1 比例的验证集,评估指标为 F1-score,验证集分值使用指数移动加权平均值来计算。
  4. 复现了多个论文的模型,如 ResGCN, GraphSAGE, GIN, ARMA 等,模型选择根据图信息如特征维度,平均度,是否为有向图选择。
  5. 特征工程,实现了 one_hot / svd / degree / node2vec / adj 等特征,实际上在原来特征上添加了 svd 特征。
正文完
 0