Фінансові новини
- |
- 26.03.25
- |
- 20:23
- |
-
RSS
- |
- мапа сайту
Авторизация
Вчені у 3200 разів підвищили швидкість читання даних, збережених на ДНК — 10 хвилин замість кількох днів
16:30 25.03.2025 |
Дослідники Ізраїльського технологічного інституту (Technion) розробили метод на основі ШІ, який прискорює пошук даних, збережених у ДНК, на три порядки та одночасно покращує точність.
Молекула ДНК відповідає за збереження генетичного коду живих організмів і складається з послідовності особливих органічних сполук - нуклеотидів. Вони класифікуються за чотирма типами, позначеними літерами A, C, G і T. На відміну від традиційних обчислень, де дані кодуються лише двома цифрами (0 і 1), зберігання у ДНК базується на послідовностях з чотирьох літер, що значно збільшує кількість можливих комбінацій.
Розміщення даних у ДНК може дати справді тривале зберігання інформації (сотні тисяч років) та щільність даних 100 млн разів більшу, ніж наявне цифрове зберігання. Для зберігання даних за цією технологією потрібний синтез ДНК - створення молекул ДНК на основі послідовностей, що кодують інформацію. Щоб прочитати збережені дані, потрібне секвенування ДНК.
Зберігання інформації на ДНК пов'язане з кількома технологічними проблемами. Синтез та секвенування є тривалими процесами, схильними до помилок видалення, вставки та заміни. Через обмеження процесу синтезу створюється кілька копій кожної молекули ДНК, що кодує дані. Ці копії зберігаються разом, без якогось порядку. Під час секвенування трапляються багато помилкових копій цих молекул - більшість з них містять помилки, а деякі повністю зникають.
Нове дослідження, опубліковане в журналі Nature Machine Intelligence, представляє комплексне обчислювальне рішення для пошуку та виправлення помилок у складних системах зберігання на основі ДНК. Використовуючи вдосконалені алгоритми та методи кодування, дослідники продемонстрували, що їх рішення скорочує час пошуку та читання даних з кількох днів до 10 хвилин.
Розроблений у Technion метод DNAformer базується на моделі трансформері, навченій на змодельованих даних, генерованих за допомогою симулятора, який також був розроблений у Technion. Метод реконструює точні послідовності ДНК з помилкових копій. Він включає спеціальний код виправлення помилок, адаптований для ДНК.
Механізм додаткового запасу безпеки виявляє найбільш шумні послідовності ДНК (небажані сигнали або помилки, що виникають під час процесу секвенування, які можуть заважати точній інтерпретації даних) та застосовує алгоритмічні інструменти для ефективнішої обробки. Наприкінці процесу дані переводяться у цифрову інформацію.
Новий метод дозволяє зчитувати 100 МБ даних зі швидкістю, яка у 3200 разів перевищує найточніший наявний метод, без втрати точності. У порівнянні з раніше відомими швидкими методами, DNAformer також покращує точність до 40%. Це було продемонстровано на наборі даних розміром 3,1 МБ, який включав 24-секундний аудіозапис слів астронавта Ніла Армстронга на Місяці, письмовий текст, в якому обговорюються переваги ДНК як перспективного методу зберігання даних, випадкові дані.
Дослідники планують розробити індивідуальні версії DNAformer, адаптовані до різних потреб. Вони підкреслюють, що їхня технологія є масштабованою та адаптованою, тобто її можна оптимізувати для великомасштабних програм зберігання даних, у відповідь на вимоги ринку.
![]() |
![]() |
![]() |
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :