Guided-PLI

A Transferability-guided Protein-Ligand Interaction Prediction Method
A novel transferability-guided protein-ligand interaction prediction method that effectively fuses multiple modalities while leveraging transferability metrics to guide knowledge transfer during fine-tuning. This method addresses two key challenges in PLI prediction: 1) integrating heterogeneous protein and ligand data modalities, and 2) optimizing the transfer of beneficial pretraining knowledge while avoiding negative transfer.

Directory Structure

├── AttentiveFP/           # GAT model for extracting drug features
├── data/                  # PLI task datasets
├── models/                # The Guided-PLI prediction model
├── args.yaml              # Directories and drug molecule parameters
├── config.py              # Configuration file for parameter settings
├── data_handler.py        # PLI data processing tool
├── main.py                # Main program
├── otfrm.py               # The transfer loss defination based on OTFRM
├── README.md              # Readme file
├── requirements.txt       # Environment dependencies
├── train_test.py          # Engine for training and testing the model
├── utils.py               # Collection of utilites

1. Environment building

conda create -n GuidedPLI python==3.9.17
conda activate GuidedPLI
cd Guided-PLI
pip install -r requirements.txt

2. Data Preparation

Place the processed datasets for PDBbind, Kinase, and DUD-E in the data/ directory. Below is a sample entry for each of the curated datasets:

PDBbind

PDB-ID	seq	rdkit_smiles	label	set
11gs	PYTVV...GKQ	CC[C@@H](CSC[C@H]...C(=O)c1ccc(OCC(=O)O)c(Cl)c1Cl	5.82	train

Kinase

PDB-ID	seq	rdkit_smiles	label	set
Q14012	MLGA...HQL	N#Cc1ccc(NC(=O)Nc2ccnc3cc(C(F)(F)F)ccc23)nc1	0.0	train

DUD-E

PDB-ID	seq	rdkit_smiles	label	set
andr	FLNV...HTQ	O=c1cc(-c2ccccc2)[nH]c2cc(-c3ccc(I)cc3)nn12	0	train

3. Pretrained Embedding Generation

To guide the finetuning with transferability from pretraining of MASSA, the embeddings of pretraining datasets from MASSA need to be generated first. More details please refer to MASSA repository.

4. Fine-tuning on PLI Tasks

Run main.py to perform fine-tuning from pre-trained PLMs to downstream PLI prediction. The following example demonstrates the command to fine-tune on the PDBBind task with guidance from transferability:

python main.py --task=PDBBind --SEED=42 --guide

For more input parameter settings, please refer to config.py.

Acknowledgement

The SOFTWARE will be used for teaching or not-for-profit research purposes only. Permission is required for any commercial use of the Software.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Guided-PLI

Directory Structure

1. Environment building

2. Data Preparation

3. Pretrained Embedding Generation

4. Fine-tuning on PLI Tasks

Acknowledgement

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
AttentiveFP		AttentiveFP
models		models
README.md		README.md
args.yaml		args.yaml
config.py		config.py
data_handler.py		data_handler.py
main.py		main.py
otfrm.py		otfrm.py
requirements.txt		requirements.txt
train_test.py		train_test.py
utils.py		utils.py

brian-zZZ/Guided-PLI

Folders and files

Latest commit

History

Repository files navigation

Guided-PLI

Directory Structure

1. Environment building

2. Data Preparation

3. Pretrained Embedding Generation

4. Fine-tuning on PLI Tasks

Acknowledgement

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages