Емкость обычного жёсткого диска значительно ниже, чем у ДНК. Генетический код представляет собой миллиарды гигабайт, упакованные примерно в одном грамме носителей-макромолекул. Миллиграмма ДНК хватило бы, чтобы записать все книги Библиотеки конгресса США и оставить свободное место для новых поступлений. Однако пока носители информации на основе ДНК остаются фантастикой. Попытки использовать ДНК живых клеток для записи данных предпринимались, но, во-первых, срок жизни клетки невелик, а во-вторых, ДНК в ней постоянно мутирует.
Очевидным выходом из ситуации могло бы стать использование одной ДНК, без клетки, что и сделали учёные из Гарвардской медицинской школы (США). Для начала они взяли книгу, включавшую в себя 53 тысяч слов и 11 изображений в JPEG-формате, и преобразовали их в HTML-код. В этом виде информация занимала 5,3 Мбит.
Эти данные соотносились с четырёхбуквенным кодом ДНК: аденин и гуанин соответствовали единице, цитозин и тимидин — нулю. Вся информация была разбита на фрагменты ДНК по 96 пар оснований. Кроме основной информации, каждый фрагмент имел 19-нуклеотидный адрес, указывавший на место этого информационного куска среди других. Кроме того, каждый кусок был обрамлён 22-нуклеотидными последовательностями, необходимыми для размножения фрагмента с помощью полимеразной цепной реакции. (Размножение ДНК с помощью ПЦР необходимо для того, чтобы материала хватило для последующего секвенирования). На последнем этапе из этих фрагментов делали ДНК-чип — физический носитель, которым удобно манипулировать.
Для чтения записанной информации использовался обычный метод ДНК-секвенирования и компьютерная программа, которая анализировала полученные последовательности и сшивала их в единое целое по «адресам». Применённый метод секвенирования рассчитан на огромные геномы, поэтому исследователи смогли около 3 тысяч раз проверить в своём небольшом кусочке информации каждый бит. Несмотря на гигантскую статистику считываний, в общей сложности им удалось найти всего 10 ошибок. Если поделить это на объём прочитанной информации, то окажется, что ДНК-чип «ошибается» реже обычного жёсткого диска.
Ошибки чаще всего случались там, где было несколько повторов одной буквы подряд: например, в последовательности вида GGGGGG. Учитывая, что в данном случае и G, и А соответствуют цифровой единице, можно легко уменьшить вероятность такой ошибки, заменив некоторые G на А, то есть вместо GGGGGG сделать GАGАGА. Кроме того, ошибки можно исправлять по второй копии нити ДНК (ведь она представляет собой двунитевую спираль).
Результаты экспериментов ученых с цифровой ДНК опубликованы в журнале Science.
Эксперимент исследователей совершил прорыв в области ДНК-информационных технологий. Теперь записывать, хранить и воспроизводить информацию на ДНК можно без участия непостоянной живой клетки. Квадратный миллиметр чипа, созданного на основе этой молекулы, может содержать 5,5 петабайта информации — в миллион раз больше, чем современные винчестеры.
Однако пока стоимость производства таких ДНК-чипов и считывания информации с них крайне высока. Кроме того, запись и считывание занимают дни. Поэтому на данном этапе такие макромолекулярные жёсткие диски можно использовать лишь для долговременного консервирования большого количества информации, которая одновременно существует ещё и на более удобных в обращении носителях, отмечает «Компьютерра–Онлайн».