# 简介
RDKit 是一种主要由 C++ 编写的开源化学信息学工具包,其网址为 RDKit RDKit - Github. 尽管由 C++ 编写,RDKit 提供了多种语言接口,使其可以被不同语言和平台集成。由于大多数情况下使用 Python 进行机器学习任务,下面我们讨论的 RDKit 都是指 RDKit 的 Python 接口。
# 安装
推荐使用 conda 进行安装:
conda install -c conda-forge rdkit |
# 基本模块
RDKit 包括如下基本模块:
rdkit.Chem
: 提供分子结构创建于操作rdkit.Draw
: 支持分子可视化和绘制rdkit.Descriptors
: 计算分子的化学描述符rdkit.AllChem
: 提供三维分子操作和高级功能
# 基本使用
RDKit 的基本使用方式很简单,很多情况下也用不到更加复杂的功能,因此这里直接通过一个例子说明,如何创建一个分子,然后建立分子的二维或三维结构,最后将分子画出来。
from rdkit import Chem | |
# create a molecule object | |
m = Chem.MolFromSmiles('Cc1ccccc1') | |
# or you can use other methods to create a molecule Object | |
# m = Chem.MolFromMolFile('data/input.mol') | |
# stringWithMolData=open('data/input.mol','r').read() | |
# m = Chem.MolFromMolBlock(stringWithMolData) | |
print(type(m)) | |
# <class 'rdkit.Chem.rdchem.Mol'> | |
# if invalid, then m is None |
# Ref
- RDKit
- Getting Started with the RDKit in Python - RDKit
- Python API Reference - RDKit
- RDKit - Github
- 学习 RDKit 套件系列教程(一):入门指南 - ZenCADD 的文章 - 知乎