ChemBounce: a computational framework for scaffold hopping in drug discovery
- 임지현
- 4일 전
- 3분 분량
Woo Dae Jang, Changdai Gu, Yumi Noh, Kwang-Seok, Jae Yong Ryu
Scaffold hopping is a critical strategy in medicinal chemistry for generating novel and patentable drug candidates. Here, we present ChemBounce, a computational framework designed to facilitate scaffold hopping by generating structurally diverse scaffolds with high synthetic accessibility. Given a user-supplied molecule in SMILES format, ChemBounce identifies the core scaffolds and replaces them using a curated in-house library of over 3 million fragments derived from the ChEMBL database. The generated compounds are evaluated based on Tanimoto and electron shape similarities to ensure retention of pharmacophores and potential biological activity. By enabling systematic exploration of unexplored chemical space, ChemBounce represents a valuable tool for hit expansion and lead optimization in modern drug discovery
Scaffold hopping은 새로운 특허 가능 약물 후보를 발굴하기 위한 의약화학의 핵심 전략이다. 본 연구에서는 ChemBounce라는 계산적 프레임워크를 제시하며, 이 도구는 높은 합성 가능성을 가지는 구조적으로 다양한 scaffold를 생성함으로써 scaffold hopping 과정을 효율적으로 수행하도록 설계되었다. 사용자가 SMILES 형식의 분자 구조를 입력하면, ChemBounce는 그 분자의 핵심 scaffold를 식별하고 ChEMBL 데이터베이스로부터 추출한 300만 개 이상의 fragment로 구성된 사내 라이브러리를 활용해 이를 새로운 scaffold로 치환한다. 생성된 화합물은 Tanimoto 유사도와 전자 형태(electron shape) 유사도를 기준으로 평가되어 기존의 약리구조(pharmacophore)와 잠재적 생물학적 활성이 유지되도록 보장한다. ChemBounce는 탐색되지 않은 화학 공간을 체계적으로 확장할 수 있게 하며, 따라서 현대 신약 개발 과정에서 hit 확장(hit expansion) 및 lead 최적화(lead optimization)를 지원하는 유용한 도구로 활용될 수 있다.
1. Introduction
- Scaffold hopping은 서로 다른 화학적 골격을 가지면서도 유사한 생물학적 활성을 유지하는 분자를 설계하기 위한 핵심 전략으로, 신약 개발 과정에서 지적 재산권 회피, 독성 개선, 대사 안정성 확보, 약물물성 개선 등의 문제를 해결하기 위해 사용됨.
- 기존에는 pharmacophore 기반, 3D shape 기반, fragment 기반, 딥러닝 기반 접근법들이 제안되었으나, 대부분의 도구는 합성 가능성(synthetic accessibility)이 고려되지 오픈소스 프로그램이 드문 상황임.
- 이러한 한계를 극복하기 위하여 합성 가능성과 분자 유사도 기반의 오픈소스 scaffold hopping 프레임워크인 ChemBounce가 개발되었음.
2. Description
2.1 Workflow
- ChemBounce에 자신이 분석하고자 하는 분자의 SMILES(Simplified Molecular Input Line Entry System) 형식 문자열을 입력하면, 프로그램이 그 구조를 인식하여 핵심 scaffold를 자동으로 추출함.
- 입력 구조는 ScaffoldGraph (HierS 알고리즘)을 이용하여 ring system, linker, side chain으로 분해됨.
- ChEMBL 데이터베이스를 전체적으로 분해하여 약 3,231,556개의 scaffold 라이브러리를 구축함.
- 입력 화합물의 scaffold와 라이브러리 내 scaffold 간의 Tanimoto 유사도(ECFP4 기반) 를 계산하여 유사한 구조를 탐색함.
- 이후 선택된 scaffold로 핵심 구조를 교체함으로써 새로운 화합물을 생성함.
- 생성된 후보 화합물은 전자 형태 유사도(ElectroShape)를 계산하여 pharmacophore 유지 여부를 평가함.
- 단, 벤젠 단일 고리는 화합물의 구분력이 낮아 분석에서 제외됨.
2.2 Usage
- ChemBounce는 GitHub을 통해 완전 공개되어 있어 python을 통해 사용 가능함 (데이터 및 코드 공개: GitHub – https://github.com/jyryu3161/chembounce)
- ChemBounce는 입력된 SMILES 문자열의 화학적 타당성을 자동으로 검증하여 잘못된 원자 기호, 결합 차수, 괄호 구조 오류 등이 있을 경우 에러 메시지와 함께 수정 지침을 제시함.
2.3 Key Features
- ChemBounce의 핵심 특징은 다음 세 가지로 요약됨.
합성 가능성 보장
- ChEMBL 기반 합성 검증 fragment 라이브러리를 사용하여 실제 합성이 가능한 구조만 생성함.
3D 전자 형태 기반 유사도 계산
- 분자의 형태, 전하 분포, 입체화학 정보를 통합적으로 고려하여 pharmacophore를 유지하면서 구조적 다양성을 확보함.
오픈소스 및 접근성
- GitHub을 통해 완전 공개되어 있으며, Google Colab 환경에서 설치 없이 바로 실행 가능함.
* 성능 검증 (Performance Evaluation)
- 다양한 분자군을 대상으로 ChemBounce 성능을 검증하였고, 검증 시 Schrödinger(Ligand-Based Core Hopping, Isosteric Matching) 및 BioSolveIT(FTrees, SpaceMACS, SpaceLight) 등과 같은 상용프로그램을 사용하였음.
- ChemBounce는 이들보다 더 낮은 SAscore(합성 용이성↑) 및 더 높은 QED(약물 유사성↑) 을 보였으며, 내부 파라미터(Tanimoto 임계값, fragment 수, Lipinski 규칙 적용 등)를 달리해도 일관된 성능을 유지하는 결과가 확인되었음.
3. Conclusion
- ChemBounce는 기존 활성 화합물로부터 새로운 구조를 자동 생성할 수 있는 오픈소스 scaffold hopping 플랫폼으로 기존 약리구조를 유지하면서 합성 가능성이 높은 새로운 화합물을 설계할 수 있도록 함. 신약 개발 과정의 hit 확장(hit expansion) 및 lead 최적화(lead optimization) 단계에서 활용 가치가 높을 것으로 예상됨

댓글