파이프라인 모듈
모델명
Retip
카테고리
Omics Data Analysis > Metabolome Retention Time prediction
레퍼런스
https://www.retip.app/
https://github.com/oloBion/Retip
https://pubs.acs.org/doi/10.1021/acs.analchem.9b05765
Keyword
Retention time, Metabolite identification, LC Orbitrap MS, autoML
Retention Time Prediction은 LC-MS기반 대사체 분석에서 각 화합물이 크로마토그래피 컬럼을 통과해 검출되기까지의 시간(Retention time, RT)을 예측하는 기법입니다. RT 정보는 질량 스펙트럼 정보와 함께 사용될 때, 동형 이성질체 구분, 후보 화합물 필터링, false positive 감소 등 대사체 동정 과정의 신뢰도를 높이는 핵심 보조 지표로 활용됩니다.
본 파이프라인은 LC Orbitrap MS 장비로 획득한 실험 RT와 화합물 구조 정보(SMILES 등)를 기반으로 학습된 모델을 사용하여, 미동정 피크의 RT를 예측하고 라이브러리 매칭을 보완하는 것을 목표로 합니다.
Retip에서 소개된 접근법을 참고하여, 여러 기계학습 모델 중 자동으로 최적 조합을 탐색하는 autoML 기반 알고리즘(H2O autoML 등)을 활용해 RT 예측 모델을 구축합니다. 사용자는 동일한 크로마토그래피 조건에서 측정된 새로운 대사체 데이터에 대해 예측 RT를 부여할 수 있습니다. 이를 통해 untargeted metabolomics에서 화합물 동정 단계의 효율과 정확도를 동시에 향상시킬 수 있습니다.
본 파이프라인은 LC Orbitrap MS 장비로 획득한 실험 RT와 화합물 구조 정보(SMILES 등)를 기반으로 학습된 모델을 사용하여, 미동정 피크의 RT를 예측하고 라이브러리 매칭을 보완하는 것을 목표로 합니다.
Retip에서 소개된 접근법을 참고하여, 여러 기계학습 모델 중 자동으로 최적 조합을 탐색하는 autoML 기반 알고리즘(H2O autoML 등)을 활용해 RT 예측 모델을 구축합니다. 사용자는 동일한 크로마토그래피 조건에서 측정된 새로운 대사체 데이터에 대해 예측 RT를 부여할 수 있습니다. 이를 통해 untargeted metabolomics에서 화합물 동정 단계의 효율과 정확도를 동시에 향상시킬 수 있습니다.
파라미터
| 옵션 | 유형 | 명칭 | 값 | 설명 | 필수값 |
|---|---|---|---|---|---|
| Input | Folder | input_dir | ./input | 실험 Retention time을 포함한 대사체 파일이 위치하는 디렉토리 | O |
| Output | Folder | output_dir | ./output | RT 예측 결과 및 로그 파일을 저장할 디렉토리 경로 |
결과
RT 예측이 완료되면, 각 입력 파일별로 xlsx 형식의 결과 파일이 생성됩니다. 결과 파일에는 화합물 이름, 구조 정보 및 실측 RT와 함께 autoML 모델이 예측한 RT와 그 차이가 정리됩니다. 예시는 다음과 같은 형태입니다.
| A | B | C | D | E | F | G |
|---|---|---|---|---|---|---|
| Name | InChIKey | SMILES | RT | RT_autoML | deltaRT_autoML | |
| 1 | roxy-sn-gly | WCLJAR-XCC... | CCCCCC... | 18.412 | 8.6 | 1.032 |
| 2 | n-glycero-3 | XSKW-H3CC... | CCCCCC... | 11.005 | 9.98 | 1.023 |
| 3 | roxy-sn-gly | TRQK-XMCC... | CCCCCC... | 11.642 | 9.56 | 2.082 |
| 4 | glycero-3-p | PMTC-RLCC... | CCCCCC... | 12.086 | 10.01 | 2.078 |
분석 파이프라인
모델명
Retip
카테고리
Omics Data Analysis > Metabolome Retention Time prediction
레퍼런스
https://www.retip.app/
https://github.com/oloBion/Retip
https://pubs.acs.org/doi/10.1021/acs.analchem.9b05765
Keyword
Retention time, Metabolite identification, LC Orbitrap MS, autoML
Before RT prediction file -> .xlsx
Before RT prediction file
Retip
.xlsx
Retention Time Prediction은 LC-MS기반 대사체 분석에서 각 화합물이 크로마토그래피 컬럼을 통과해 검출되기까지의 시간(Retention time, RT)을 예측하는 기법입니다. RT 정보는 질량 스펙트럼 정보와 함께 사용될 때, 동형 이성질체 구분, 후보 화합물 필터링, false positive 감소 등 대사체 동정 과정의 신뢰도를 높이는 핵심 보조 지표로 활용됩니다.
본 파이프라인은 LC Orbitrap MS 장비로 획득한 실험 RT와 화합물 구조 정보(SMILES 등)를 기반으로 학습된 모델을 사용하여, 미동정 피크의 RT를 예측하고 라이브러리 매칭을 보완하는 것을 목표로 합니다.
Retip에서 소개된 접근법을 참고하여, 여러 기계학습 모델 중 자동으로 최적 조합을 탐색하는 autoML 기반 알고리즘(H2O autoML 등)을 활용해 RT 예측 모델을 구축합니다. 사용자는 동일한 크로마토그래피 조건에서 측정된 새로운 대사체 데이터에 대해 예측 RT를 부여할 수 있습니다. 이를 통해 untargeted metabolomics에서 화합물 동정 단계의 효율과 정확도를 동시에 향상시킬 수 있습니다.
본 파이프라인은 LC Orbitrap MS 장비로 획득한 실험 RT와 화합물 구조 정보(SMILES 등)를 기반으로 학습된 모델을 사용하여, 미동정 피크의 RT를 예측하고 라이브러리 매칭을 보완하는 것을 목표로 합니다.
Retip에서 소개된 접근법을 참고하여, 여러 기계학습 모델 중 자동으로 최적 조합을 탐색하는 autoML 기반 알고리즘(H2O autoML 등)을 활용해 RT 예측 모델을 구축합니다. 사용자는 동일한 크로마토그래피 조건에서 측정된 새로운 대사체 데이터에 대해 예측 RT를 부여할 수 있습니다. 이를 통해 untargeted metabolomics에서 화합물 동정 단계의 효율과 정확도를 동시에 향상시킬 수 있습니다.
파라미터
| 옵션 | 유형 | 명칭 | 값 | 설명 | 필수값 |
|---|---|---|---|---|---|
| Input | Folder | input_dir | ./input | 실험 Retention time을 포함한 대사체 파일이 위치하는 디렉토리 | O |
| Output | Folder | output_dir | ./output | RT 예측 결과 및 로그 파일을 저장할 디렉토리 경로 |
결과
RT 예측이 완료되면, 각 입력 파일별로 xlsx 형식의 결과 파일이 생성됩니다. 결과 파일에는 화합물 이름, 구조 정보 및 실측 RT와 함께 autoML 모델이 예측한 RT와 그 차이가 정리됩니다. 예시는 다음과 같은 형태입니다.
| A | B | C | D | E | F | G |
|---|---|---|---|---|---|---|
| Name | InChIKey | SMILES | RT | RT_autoML | deltaRT_autoML | |
| 1 | roxy-sn-gly | WCLJAR-XCC... | CCCCCC... | 18.412 | 8.6 | 1.032 |
| 2 | n-glycero-3 | XSKW-H3CC... | CCCCCC... | 11.005 | 9.98 | 1.023 |
| 3 | roxy-sn-gly | TRQK-XMCC... | CCCCCC... | 11.642 | 9.56 | 2.082 |
| 4 | glycero-3-p | PMTC-RLCC... | CCCCCC... | 12.086 | 10.01 | 2.078 |
컨테이너
버전 1.1.0
Keyword
Retention time, Metabolite identification, LC Orbitrap MS, autoML
Retip
Retention Time Prediction for Metabolomics
LC-MS 기반 대사체 분석에서 핵심 난제인 Retention Time(RT) 예측을 안정적으로 수행하기 위해 구성된 실행 환경으로, RT prediction 모델 구축에 필요한 기계학습(autoML 포함) 알고리즘, 화합물 구조 처리 라이브러리, 및 관련 데이터베이스 접근 경로 등을 포함합니다.
RT 예측은 각 화합물의 크로마토그래피 컬럼을 통과해 검출되기까지의 시간을 모델링하는 과정으로, untargeted metabolomics에서 동정(identification) 정확도를 높이는 중요한 보조 지표입니다.
특히 LC-Orbitrap MS 기반 데이터에서는 질량 정보만으로 구분이 어려운 물질 이성질체나 구조 유사 화합물을 RT 정보를 통해 효과적으로 선별할 수 있습니다.
본 컨테이너 환경은 Retip에서 제안된 방법론을 참고하여, 표준물질의 RT와 화합물 구조 정보(SMILES, InChIKey 등)를 기반으로 학습된 autoML(H2O AutoML 등)을 활용해 새로운 대사체 데이터에 대해 RT를 예측하고 identification의 품질을 향상시킵니다.
RT prediction 결과를 활용하여 untargeted metabolomics 분석 파이프라인 전체의 신뢰성과 효율성을 높일 수 있습니다.
RT 예측은 각 화합물의 크로마토그래피 컬럼을 통과해 검출되기까지의 시간을 모델링하는 과정으로, untargeted metabolomics에서 동정(identification) 정확도를 높이는 중요한 보조 지표입니다.
특히 LC-Orbitrap MS 기반 데이터에서는 질량 정보만으로 구분이 어려운 물질 이성질체나 구조 유사 화합물을 RT 정보를 통해 효과적으로 선별할 수 있습니다.
본 컨테이너 환경은 Retip에서 제안된 방법론을 참고하여, 표준물질의 RT와 화합물 구조 정보(SMILES, InChIKey 등)를 기반으로 학습된 autoML(H2O AutoML 등)을 활용해 새로운 대사체 데이터에 대해 RT를 예측하고 identification의 품질을 향상시킵니다.
RT prediction 결과를 활용하여 untargeted metabolomics 분석 파이프라인 전체의 신뢰성과 효율성을 높일 수 있습니다.