【超简单!】如何在ZINC库中批量下载虚拟筛选小分子数据集 (Windows环境下)
教你傻瓜式在Windows环境下下载ZINC分子数据集
·
前言
使用Windows环境,在进行分子对接或者人工智能分子筛选时需要从ZINC数据库中下载小分子数据集可参考以下步骤。
一、选择合适的分子范围
- 进入ZINC15网站 点击这里
- 点击Tranches

- 可按条件根据个人需求选择合适的分子范围

二、数据集下载
-
选好合适分子范围后点击下载

-
下载界面我们可以选择时间、下载文件类型和下载方法,这里由于我只需要获取smiles分子式因此选择smi文件,下载方法选WGET


-
下载完成后你会获得一个.wget文件,其中包含了多个wget指令对应下载多个分块子集中的分子(可用记事本打开查看)

三、Windows安装Wget
- Windows环境需要手动安装Wget指令,点击这里下载Wget,下载ZIP或EXE都可以(ZIP解压后包含EXE文件),然后将下载下来的wget.exe执行文件放入C:\Windows\System32

- 完成上步之后可以管理员打开cmd输入wget -help查看是否安装成功,如果显示了一串指令帮助说明安装成功
四、准备就绪,傻瓜式下载分子集!
- 将前面下载的.wget文件后缀改成.bat


- 将修改后的.bat文件放入你想要下载数据集的目录下(比如这里我建立了一个datasets文件夹用来存放数据),然后直接双击运行.bat文件!(注意 !不要!以管理员身份运行)

- 然后系统会自动执行里面的wget指令进行下载,耐心等待下载完成即可!


总结
本文写于2022.6.17,ZINC网站使用方法和分子范围可能会随时间进行更新变化,请以网站说明为准
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)