Research연구

Deep Learning to Understand Regulatory Pattern in Noncoding Genome비암호화 유전체의 조절 패턴 이해를 위한 딥러닝

Our lab develops and applies DNA language models — deep learning foundation models that treat DNA sequences as a language to learn the regulatory grammar of the genome — to study noncoding regulatory mutations associated with autism and other neurodevelopmental disorders. We've developed the CWAS framework (Kim et al. 2024) to analyze whole genome sequencing data from autism families. Currently, we're integrating single-cell multiomics datasets from developing human brains to further refine our approach. By leveraging DNA language models, we aim to systematically interpret noncoding mutations and their regulatory effects on neurodevelopment.본 연구실은 DNA 언어모델 — DNA 서열을 언어로 취급하여 유전체의 조절 문법을 학습하는 딥러닝 파운데이션 모델 — 을 개발·활용하여 자폐 및 신경발달장애와 관련된 비암호화 조절 돌연변이를 연구합니다. 자폐 가족의 전장 유전체 서열 분석 데이터를 분석하기 위해 CWAS 프레임워크(Kim et al. 2024)를 개발하였습니다. 현재 발달 중인 인간 뇌의 단일세포 멀티오믹스 데이터셋을 통합하여 접근법을 고도화하고 있습니다.
Deep learning for noncoding genome

AI-Driven Virtual Cell to Risk Gene Discovery and Regulatory InteractionAI 기반 가상 세포를 통한 위험 유전자 발굴 및 조절 상호작용 연구

Our research focuses on building a large-scale single-cell RNA sequencing atlas to comprehensively map cellular states and gene regulatory networks across various biological systems. By integrating LLM-based foundation models, we develop an AI-driven virtual cell (AIVC) that enables the discovery of novel risk genes and their functional interactions. Through this approach, we systematically identify core gene regulatory networks and predict disease-associated mechanisms, with applications in neurodevelopmental disorders and autism.본 연구는 다양한 생물학적 시스템에서 세포 상태와 유전자 조절 네트워크를 포괄적으로 매핑하기 위한 대규모 단일세포 RNA 시퀀싱 아틀라스 구축에 중점을 둡니다. LLM 기반 파운데이션 모델을 통합하여 새로운 위험 유전자와 기능적 상호작용을 발굴하는 AI 기반 가상 세포(AIVC)를 개발하고 있습니다.
Virtual cell

Genetic Architecture of Autism in Korea한국인 자폐의 유전적 구조

Our lab investigates the genetic architecture of autism with a particular focus on East Asian populations, leveraging long-read whole genome sequencing to uncover previously inaccessible genomic variations. Since establishing our research group at Korea University in 2019, we have concentrated on exploring the genetic architecture of autism in Korean families. Our investigations encompass a wide range of genetic factors, including common, rare, and de novo variants, which we are analyzing within one of the largest East Asian cohorts for autism. Notably, our research has recently revealed sex-specific patterns in genetic risk factors among Korean autism families (Kim et al. 2024, Genome Medicine; Kim et al. 2025, Genome Medicine).본 연구실은 동아시아 인구집단에 초점을 맞추어 자폐의 유전적 구조를 연구하며, 롱리드 전장 유전체 시퀀싱을 활용하여 기존에 접근하기 어려웠던 유전체 변이를 발굴합니다. 2019년 고려대학교에 연구그룹을 설립한 이후, 한국 자폐 가족의 유전적 구조 탐구에 집중하고 있습니다. 최근 연구에서는 한국 자폐 가족의 유전적 위험 인자에서 성별 특이적 패턴을 밝혀내었습니다 (Kim et al. 2024, Genome Medicine; Kim et al. 2025, Genome Medicine).
Autism architecture

Integrative Multi-omics Approaches to Understand Complex Disorder복합 질환 이해를 위한 통합 멀티오믹스 접근법

Our research explores the extreme genetic heterogeneity underlying complex human disorders through integrative multi-omics approaches. We have integrated large-scale whole-genome sequencing and transcriptomics datasets of human post-mortem cortex across fetal to adult stages (Werling et al. 2020), and developed an integrative single-cell atlas to explore the cellular and temporal specificity of neurological disorder genes during human brain development (Kim et al. 2024). In addition, we have developed proteogenomic analytical frameworks for multi-omics analysis of Korean cancer patients (Song et al. 2024).본 연구는 통합 멀티오믹스 접근법을 활용하여 복합 인간 질환의 극도의 유전적 이질성을 탐구합니다. 태아기부터 성인기까지의 인간 사후 피질 대규모 전장 유전체 시퀀싱 및 전사체 데이터셋을 통합하였으며(Werling et al. 2020), 인간 뇌 발달 과정에서 신경학적 질환 유전자의 세포 및 시간적 특이성을 탐구하기 위한 통합 단일세포 아틀라스를 개발하였습니다(Kim et al. 2024).
Multi-omics