共计 1871 个字符,预计需要花费 5 分钟才能阅读完成。
随着医疗行业的飞速发展,科研数据在数字化时代中表演重要的角色。阿里云天池本着非法、平安和隐衷爱护的准则,和出名机构单干凋谢了一批有临床科研价值的数据集,笼罩多个技术畛域。明天小萌喵就带大家一起看看临床方向的数据集~
笔者将分高低两篇文章来为大家介绍天池平台凋谢的医疗衰弱畛域数据集,本篇偏重医学临床方向的数据集,下篇将会介绍医学科研方向的数据集,涵盖了文本、影像等数据。
医疗对话临床发现阴阳性判断数据集
钻研方向:对话了解、医学信息抽取、在线问诊
随着新冠疫情的倒退,互联网在线医疗已成为一种新型的问诊办法。临床发现 (Clinical Finding) 是临床医学下,病人状态形容的概念汇合,每一个临床发现的概念都具备明确的涵义(比方腹泻,呕吐,低温,物理降温,降温药物医治)。医学临床报告是病人状态的汇总性的形容,为了尽可能全面和精准的对病人的状态进行主观形容,须要利用谨严的临床发现的概念对病人状态进行表白,其中最根本的状态就是阴性和阳性,也就是病人是否存在或者产生某一种明确的临床发现(Clinical Finding)。
灵魂拷问:“坐起来就不怎么痛,躺着就痛,站着不动也不怎么痛,走路慢点也还好,快点就痛”这句话中,大家能分清四个“痛”别离标注阴性还是阳性吗?🤯
目前互联网医疗患者会对本人的症状进行口语化的形容,个别称之为主诉,同时医生也会为其进行针对性的问诊,来进行一些主诉的细化和补充。本数据集针对互联网医疗对话场景,对互联网在线问诊记录中的临床发现的局部进行阴阳性的分类判断,本数据集来源于 CHIP2021 的医疗对话临床发现阴阳性判断工作(http://cips-chip.org.cn/),共蕴含 10,000 段医患对话语料,是目前中文畛域最大的医学对话标注数据集。
数据集详情请戳:https://tianchi.aliyun.com/da…
临床试验后果预测数据集 EBM-Net
钻研方向:PICO、临床试验、新药研发、预训练语言模型
临床试验是循证医学的一个重要组成部分,次要目标是验证某种干涉伎俩(手术、化疗、放疗或药物)是否无效。临床试验首先须要招集很多志愿者或患者,而后做对照试验,最初统计得出后果,整个试验过程比拟漫长。设计有缺点或者难以胜利的临床试验节约了宝贵时间,可能会使亟待施行的临床试验因招募不到足够的患者或工夫的紧缺而被迫终止。所以,研究者如果在临床试验方案设计阶段就预测出临床试验的后果,并优先进行胜利概率较高的临床试验是十分有意义的。
笔者给大家举个栗子:瑞德西韦曾被科学家们认为是反抗新冠病毒最有心愿的药物,这是因为 MERS、SARS 和新冠病毒同属冠状病毒科且在埃博拉(另一种冠状病毒)感化患者的紧急医治中也积攒了无效的临床后果,这为新冠疫情筛选新药提供了方向。
科学家的这种思考是依据既往的钻研教训和医学知识得出的,这使得在临床试验发展前评估临床试验所钻研问题的可行性成为可能。EBM-Net(Evidence-Based-Medicine Network)数据集就是在此背景下提出的,可广泛应用于临床试验设计、药品研发等利用方向。
数据集详情请戳:https://tianchi.aliyun.com/da…
偷偷通知大家,应用该数据集的论文 (https://aclanthology.org/2020…) 不仅发表在了 NLP 顶会 EMNLP2020,还被国内医学信息学协会(IMIA)年报评比为 2020 年医学自然语言解决的最佳论文了哦~
脊柱疾病核磁影像数据集
钻研方向:图像分类、指标检测、主动诊断、CDSS、医学影像主动诊断
医学影像剖析是 AI 技术在医疗行业最早钻研的课题之一。脊柱进化性疾病(如腰椎间盘突出等症状)呈现出年轻化的趋势,困扰着老年人群体和办公族(许可萌喵,办公时坐姿肯定要端正哦~),正确的预防和干涉可能无效避免疾病的好转。核磁(MRI)作为非侵入式查看伎俩,被用于一般人群的惯例查看,是预防脊柱进化性疾病的牢靠查看伎俩。
该数据集来源于天池“数字人体”AI 挑战赛 - 脊柱疾病智能诊断大赛 (https://tianchi.aliyun.com/co…),是业界首个凋谢的脊柱 MRI 数据集,指标是促成研究者们关注人工智能算法在脊柱进化性疾病的钻研。
数据集详情请戳:https://tianchi.aliyun.com/da…
本文着重介绍了天池平台医疗临床方向的数据集,看完是不是觉得很有播种呢,欢送大家举荐给身边做医学钻研的小伙伴们~ 下一篇将会为大家持续详解医疗科研方向的数据集,请大家不要错过噢~