# 简介

RDKit 是一种主要由 C++ 编写的开源化学信息学工具包,其网址为 RDKit RDKit - Github. 尽管由 C++ 编写,RDKit 提供了多种语言接口,使其可以被不同语言和平台集成。由于大多数情况下使用 Python 进行机器学习任务,下面我们讨论的 RDKit 都是指 RDKit 的 Python 接口。

# 安装

推荐使用 conda 进行安装:

conda install -c conda-forge rdkit

# 基本模块

RDKit 包括如下基本模块:

  • rdkit.Chem : 提供分子结构创建于操作
  • rdkit.Draw : 支持分子可视化和绘制
  • rdkit.Descriptors : 计算分子的化学描述符
  • rdkit.AllChem : 提供三维分子操作和高级功能

# 基本使用

RDKit 的基本使用方式很简单,很多情况下也用不到更加复杂的功能,因此这里直接通过一个例子说明,如何创建一个分子,然后建立分子的二维或三维结构,最后将分子画出来。

from rdkit import Chem
# create a molecule object
m = Chem.MolFromSmiles('Cc1ccccc1')
# or you can use other methods to create a molecule Object
# m = Chem.MolFromMolFile('data/input.mol')
# stringWithMolData=open('data/input.mol','r').read()
# m = Chem.MolFromMolBlock(stringWithMolData)
print(type(m))
# <class 'rdkit.Chem.rdchem.Mol'>
# if invalid, then m is None

# Ref

  • RDKit
    • Getting Started with the RDKit in Python - RDKit
    • Python API Reference - RDKit
  • RDKit - Github
  • 学习 RDKit 套件系列教程(一):入门指南 - ZenCADD 的文章 - 知乎