作为科学信息解决方案专业机构,美国化学文摘社 ( CAS) 正与全球研究机构合作,应对 COVID-19 带来的复杂而又快速变化的挑战。作为美国化学会 (ACS) 的分支机构, CAS 致力于践行美国化学会的使命,持续开发、开放提供一系列资源(包括数据、工具、专业咨询等)共同抗击 COVID-19

CAS 就其独特的权威大数据进行挖掘整理,揭示数据间的关联,现发布开放获取 CAS COVID-19 抗病毒候选化合物构效关系数据集 ( CAS COVID-19 Antiviral Candidate SAR Dataset)

点击下载:

此数据集来源为报道 COVID-19 蛋白、病毒和疾病靶点的文献、专利和其他公共资源,之前 CAS 在这些资源中提炼出 9 千多个物质构成了“ CAS COVID-19 抗病毒候选化合物数据集”,此次提供的 29 万条构效关系( SAR )数据正是基于这些物质。研究人员无需支付费用即可利用这些数据进行研究、数据挖掘、机器学习和数据分析。

本数据集采用 .CSV 格式,包含超过 29 万条构效关系数据,包括 IC50 EC50 和其他数值。能够便捷地将 CSV 文件导入到电子表格工具,如 Microsoft Excel 。数据按列排列: cas_rn 、蛋白质、治疗用途、活性类型、活性值、活性单位、来源等。对于数据科学工具,例如可考虑使用 Python 编程语言的免费软件 SciKit-Learn pandas library dataframes 等,将数据集部署到机器学习中。

欢迎广大师生使用!

长安校区:西安市长安区郭杜教育科技产业区学府大道1号   邮编:710127

太白校区:西安市太白北路229号   邮编:710069

桃园校区:西安市高新四路155号   邮编:710075

网站管理:党委宣传部   技术支持:网络和数据中心

切换到电脑版