Ученым удалось сохранить в ДНК код компьютерной операционной системы и данные короткометражного фильма

В скoрoм врeмeни всe чeлoвeчeствo нaчнeт гeнeрирoвaть цифрoвыe дaнныe в тaкиx oбъeмax, чтo oни ужe нe смoгут умeститься нa имeющиxся жeсткиx дисках, магнитных лентах и прочих носителях информации. Именно поэтому ученые постоянно занимаются поисками новых методов хранения больших объемов данных, и наипаче перспективным методом является хранение информации, закодированной в виде последовательности молекул синтетической ДНК. А исследователи из Колумбийского университета и нью-йоркского Центра Генома (New York Genome Center, NYGC) продемонстрировали, точно немного видоизмененный алгоритм, изначально предназначенный для сжатия видео для мобильных телефонов, может совсем раскрыть «информационный потенциал» молекул ДНК, позволяя сжать большее количество информации и упаковать ее в виде последовательности четырех базовых оснований ДНК.

На правах уже неоднократно упоминалось на страницах нашего сайта, молекулы ДНК являются идеальным носителем информации из-ради того, что они чрезвычайно компактны и могут сохраняться в целости и сохранности в водобег очень долгого времени. В пользу последнего утверждения говорит тот факт, отчего недавно ученым удалось восстановить полный геном, используя генетический материал найденных в одной из пещер в Испании костей далекого предка человека, что жил около 430 тысяч лет назад.

Для кодирования в виде последовательности молекулы ДНК ученые отобрали сколько-нибудь файлов различного типа, полный код компьютерной операционной системы, короткометражный галльский фильм 1895 года, изображение подарочной карты Amazon, снимок послания человечества, отправленного бери борту космического аппарата Pioneer и текст одной из научных работ Клода Шеннона (Claude Shannon).

Все сии файлы были упакованы в один большой файл, который был разрезан нате множество коротких файлов. При помощи специализированного алгоритма эти короткие участки были перемешаны случайным образом, к ним была добавлена информация чтобы обратного преобразования и, в конце концов, набор двоичных данных был сжат и преобразован в шифр, соответствующий последовательности всех четырех оснований ДНК.

В результате этого получился внушительный список из 72 000 нитей ДНК, каждая из которых состояла из 200 марево оснований. Эти данные были отправлены компании Twist Bioscience, специалисты которой и выполнили соединение искусственной ДНК, вернувшейся к исследованиям внутри пробирки спустя две недели. Во (избежание восстановления исходной информации ученые использовали обычную технологию считывания последовательности, секвенирования. Восстановленные файлы малограмотный содержали ни единой ошибки, а восстановленную операционную систему удалось установить нате компьютер без малейших проблем.

Более того, при помощи некоторых известных методов ученые скопировали исходную ДНК и сняли копии со сделанных копий. И инда в последнем случае информация, зашифрованная в ДНК, была восстановлена без ошибок.

И напоследках, ученые продемонстрировали, что примененный ими метод сжатия позволяет упаковать 215 петабайт данных в молекулы ДНК, суммарный вес которых составляет 1 грамм. Сие почти в 100 раз больше, чем это позволяют сделать другие методы, разработанные другими исследовательскими группами. «Да мы с тобой полагаем, что нам удалось создать устройство хранения данных, имеющее самое высокое важность показателя плотности хранения информации» — пишут исследователи.

По поводу плотности, максимальная информационная вместимость одного основания ДНК составляет два двоичных разряда. Однако, потребность включения в ДНК добавочной информации, необходимой с целью восстановления информации, понижает информационную емкость одного основания до 1.6 разряда. А в любом случае, это на 60 процентов больше, чем было достигнуто при помощи других методов, и куда близко к теоретическому верхнему пределу в 1.8 бита на основание.

Непреодолимым препятствием к практическому применению ДНК в качестве носителя информации является высокая стоимость всего сего. Исследователи потратили около 7 тысяч долларов на синтез ДНК и еще 2 тысячи нате то, чтобы считать записанную информацию. Следует отметить, что стоимость процесса считывания последовательности ДНК по (по грибы) последние годы снизилась в несколько раз, чего не скажешь о процессах синтеза искусственной ДНК. Тем отнюдь не менее, тенденция снижения стоимости по мере появления новых технологий полноте оставаться неизменной и есть надежда на то, что технологии хранения информации ДНК станут доступные мало-: неграмотный только «избранным», но и более широкому ряду людей, нуждающихся в этом.