Методы обработки метагеномных данных
mgSNP
Метод предложен Ранжитом Кумаром для оценки приживаемости бактерий у реципиента. \cite{Kumar_2017}
StrainFinder
StrainFinder пытается различить штаммы внутри одного вида бактерий \cite{Smillie_2018}.
Подготовка данных
Сырые риды получены с Illumina. Типичный процесс предобработки данных для последующего анализа:
- Контроль качества при помощи FastQC
- Тримминг при помощи Trimmomatic
- Фильтрация от человеческой ДНК
Провели суммарную de novo сборку из образца донора и соотвествующего пациента в первой временной точке при помощи megahit v1.1.2
с дефолтными параметрами. Были отобраны контиги длиной больше 2500 bp. Картирование на образцы выполнялось bwa mem v0.7.12-r1039
с дефолтными параметрами. Таксоносическая принадлежность контигов оценена centrifuge v1.0.3-beta
Датасет DFM_002-TFM_001
DFM_002_F1_S9:TFM_001_F1-1_S1-nik: 28650; DFM_002: 4878 контигов; TFM_001_F1-1_S1-nik-mh: 24531; TFM_001_F1-1_S1-nik-mh: 7073;