воскресенье, 27 июля 2025 г.

Сегодня у нас в гостях ДНК-секвенатор!

 Сегодня у нас в гостях ДНК-секвенатор!


Разбираемся, как эта шайтан-машина читает ваш код. Ожидание: пихаете внутрь ДНКу, он медленно пропускает её через сканер, вы получаете код.

Реальность: заправляем несколько миллионов более-менее прямых обломков, читаем каждый, пробуем угадать, какой в каком месте был, складываем пазл, повторяем 30-60 раз, получаем примерное представление о том, как ДНК выглядела до того, как мы начали её ломать. Но это неточно!

В нашей ДНК 3 гигабазы кода (это где 1 байт из 4 бит, то есть у вас почти в каждой клетке полтора гига данных только в ДНК). Читают современные секвенаторы участки от 50 до 300 пар, дальше сложно. Поэтому шаг 1 — её режут на кусочки в месиво!

Точнее, сначала чистят, потому что вы же не хотите сосканить заодно ДНК своих бактерий. Уже затем месиво.

Можно жахнуть ультразвуком в раствор для образования кавитационных пузырей. Случайность реза получается прекрасная, но может поломать и сам код. Можно продавливать через тонкую иглу. Можно резать химией, в последнее время появились довольно дешёвые реактивы — но там проблема, что ферменты сильнее липнут к определённым участкам, то есть крупные куски кода могут вообще не нарезаться, а потом выпасть и потеряться.

Дальше отбор. Всё что меньше окна чтения — нахер с борта, всё, что лезет по размеру — забираем.

К каждому концу кусочка надо пришить адаптер. Там якорь к поверхности читающего чипа, праймеры для старта копирования, и идентификаторы, чтобы не перепутать разных пациентов. Кстати, мультиплексирование по пациентам — когда в одну кучу смешали всех в больнице — очень удешевляет анализ.

Получается библиотека кода.

Потом кластеризация — делаем копии фрагментов на специальном чипе (проточной ячейке). Это современный способ, сильно дешевле, чем первые методы для проекта «Геном человека».

Чип ловит кусочки и удерживает. Дальше туда попадает полимераза, которая копирует кусочек до двойной спирали, потом результат расплетается на две разные комплиментарные спирали — и снова каждая половинка копируется. Этот процесс повторяется много раз. В результате из одного-единственного фрагмента ДНК на поверхности чипа вырастает кластер, состоящий из миллионов его почти точных копий. Это нужно, чтобы он лучше и заметнее светился.

В проточную ячейку подается коктейль из ДНК-полимеразы (фермент, строящий целую ДНК из половинки) и четырех типов нуклеотидов (A, C, G, T). Но нуклеотиды хитрые! Каждый помечен своим цветом свечения и имеет обратимый терминатор: стоп-код, который не дает полимеразе присоединить следующий нуклеотид, пока этот терминатор бдит.

Полимераза присоединяет один нуклеотид и останавливается на терминаторе.

Фотографируем ячейку.

Растворяем терминатор и гасим свечение.

Снова сыпем полимеразу и нуклеотиды в обёртке.

Получаем до 300 снимков, где каждый кластер светится своей буквой, и можно по слоям прочитать, что было в каждом кусочке из нарезанных.

Повторяем 30 раз. А лучше 60.

Получаем куски по 150-300 букв. Пытаемся собрать целую ДНК из этого, потому что они там частично перекрываются, и можно соединять одни с другим, плюс мы знаем в целом карту генома, и примерно представляем, что откуда. Это сборка пазла.

Ну а дальше ваш исходник уже можно читать.

_______
Источник | #Fourier_series
@F_S_C_P

Комментариев нет:

ad