Методы обработки метагеномных данных

mgSNP 

Метод предложен Ранжитом Кумаром для оценки приживаемости бактерий у реципиента. \cite{Kumar_2017}

StrainFinder

StrainFinder пытается различить штаммы внутри одного вида бактерий \cite{Smillie_2018}

Подготовка данных

Сырые риды получены с Illumina. Типичный процесс предобработки данных для последующего анализа:
  1. Контроль качества при помощи FastQC
  2. Тримминг при помощи Trimmomatic 
  3. Фильтрация от человеческой ДНК
Провели суммарную de novo сборку из образца донора и соотвествующего пациента в первой временной точке при помощи megahit v1.1.2 с дефолтными параметрами. Были отобраны контиги длиной больше 2500 bp. Картирование на образцы выполнялось bwa mem v0.7.12-r1039 с дефолтными параметрами. Таксоносическая принадлежность контигов оценена centrifuge v1.0.3-beta  

Датасет DFM_002-TFM_001

DFM_002_F1_S9:TFM_001_F1-1_S1-nik: 28650; DFM_002: 4878 контигов; TFM_001_F1-1_S1-nik-mh: 24531;  TFM_001_F1-1_S1-nik-mh: 7073;