YouTube стал силой, с которой приходится считаться с момента его создания в 2005 году. Вот почему удивительно, когда вы обнаруживаете, что у исследователей есть теоретическая возможность, что они могут хранить 10 петабайт (10 миллионов гигабайт) данных в одном грамм ДНК. Это означает, что все YouTube можно настроить за одну чайную ложку!

Исследование было проведено группой исследователей из Техниона – Израильского технологического института, расположенного в Хайфе, и Герцлийского междисциплинарного центра (IDC), который также находится в Израиле. Он направлен на изучение возможности использования ДНК для хранения данных. Хранение данных становится все более важным с использованием облака. Серверные фермы были обычным решением, но они связаны с экологическими проблемами, поскольку в значительной степени зависят от электричества.
ДНК уже используется для хранения очень сложного кода для человеческой жизни. Это делает его идеальным выбором для хранения данных. Однако добиться этого – непростая задача. Когда дело доходит до кодирования информации в ДНК, вам понадобится цепь, состоящая из ссылок, известных как нуклеотиды. Эти нуклеотиды известны как четыре строительных блока жизни и обозначены буквами A, C, G и T. Двоичные последовательности, состоящие из 0 и 1, переводятся в эти четыре буквы.

Молекулы ДНК производятся с одинаковыми последовательностями в процессе, известном как синтез. Следующий процесс известен как секвенирование, и во время этого процесса исследователи создают вывод, который представляет исходную нуклеотидную последовательность. Команда теоретически решила проблемы, что является шагом вперед. В пресс-релизе команда описала свой прогресс как;
(1) увеличить количество букв, используемых для кодирования информации (помимо исходных 4 букв); (2) значительно сократить количество раундов синтеза, необходимых для хранения информации ДНК; (3) улучшить используемый механизм исправления ошибок.

«Современные процессы синтеза и секвенирования по своей природе избыточны, поскольку каждая молекула производится в больших количествах1 и читается в нескольких копиях во время секвенирования», – говорит профессор Зохар Яхини из Technion в пресс-релизе. «Разработанный нами метод использует эту избыточность для увеличения эффективного числа букв над исходными четырьмя буквами, что позволяет нам кодировать и записывать каждую единицу информации за меньшее количество циклов синтеза».
Исследовательская группа смогла сократить количество раундов синтеза, необходимых на единицу информации, на 20%. При рассмотрении сложности этого вида работ, любое улучшение будет высоко оценено. Работа, проделанная этими учеными, на самом деле может привести к 75% сокращению в будущем.
Профессор Рои Амит, управляющий лабораторией синтетической биологии в Technion, сказал: «В этой работе мы внедрили систему хранения на основе ДНК, которая кодирует информацию с эффективностью синтеза, которая значительно лучше, чем стандартный подход. Исследование включало в себя фактическую реализацию новой техники кодирования для хранения большого объема информации о молекулах ДНК и ее реконструкции для проверки процесса ».
