Сегодня у нас в гостях ДНК-секвенатор!
Разбираемся, как эта шайтан-машина читает ваш код. Ожидание: пихаете внутрь ДНКу, он медленно пропускает её через сканер, вы получаете код.
Реальность: заправляем несколько миллионов более-менее прямых обломков, читаем каждый, пробуем угадать, какой в каком месте был, складываем пазл, повторяем 30-60 раз, получаем примерное представление о том, как ДНК выглядела до того, как мы начали её ломать. Но это неточно!
В нашей ДНК 3 гигабазы кода (это где 1 байт из 4 бит, то есть у вас почти в каждой клетке полтора гига данных только в ДНК). Читают современные секвенаторы участки от 50 до 300 пар, дальше сложно. Поэтому шаг 1 — её режут на кусочки в месиво!
Точнее, сначала чистят, потому что вы же не хотите сосканить заодно ДНК своих бактерий. Уже затем месиво.
Можно жахнуть ультразвуком в раствор для образования кавитационных пузырей. Случайность реза получается прекрасная, но может поломать и сам код. Можно продавливать через тонкую иглу. Можно резать химией, в последнее время появились довольно дешёвые реактивы — но там проблема, что ферменты сильнее липнут к определённым участкам, то есть крупные куски кода могут вообще не нарезаться, а потом выпасть и потеряться.
Дальше отбор. Всё что меньше окна чтения — нахер с борта, всё, что лезет по размеру — забираем.
К каждому концу кусочка надо пришить адаптер. Там якорь к поверхности читающего чипа, праймеры для старта копирования, и идентификаторы, чтобы не перепутать разных пациентов. Кстати, мультиплексирование по пациентам — когда в одну кучу смешали всех в больнице — очень удешевляет анализ.
Получается библиотека кода.
Потом кластеризация — делаем копии фрагментов на специальном чипе (проточной ячейке). Это современный способ, сильно дешевле, чем первые методы для проекта «Геном человека».
Чип ловит кусочки и удерживает. Дальше туда попадает полимераза, которая копирует кусочек до двойной спирали, потом результат расплетается на две разные комплиментарные спирали — и снова каждая половинка копируется. Этот процесс повторяется много раз. В результате из одного-единственного фрагмента ДНК на поверхности чипа вырастает кластер, состоящий из миллионов его почти точных копий. Это нужно, чтобы он лучше и заметнее светился.
В проточную ячейку подается коктейль из ДНК-полимеразы (фермент, строящий целую ДНК из половинки) и четырех типов нуклеотидов (A, C, G, T). Но нуклеотиды хитрые! Каждый помечен своим цветом свечения и имеет обратимый терминатор: стоп-код, который не дает полимеразе присоединить следующий нуклеотид, пока этот терминатор бдит.
Полимераза присоединяет один нуклеотид и останавливается на терминаторе.
Фотографируем ячейку.
Растворяем терминатор и гасим свечение.
Снова сыпем полимеразу и нуклеотиды в обёртке.
Получаем до 300 снимков, где каждый кластер светится своей буквой, и можно по слоям прочитать, что было в каждом кусочке из нарезанных.
Повторяем 30 раз. А лучше 60.
Получаем куски по 150-300 букв. Пытаемся собрать целую ДНК из этого, потому что они там частично перекрываются, и можно соединять одни с другим, плюс мы знаем в целом карту генома, и примерно представляем, что откуда. Это сборка пазла.
Ну а дальше ваш исходник уже можно читать.
_______
Источник | #Fourier_series
@F_S_C_P
Комментариев нет:
Отправить комментарий