Согласно исследованию Пенна, мощный метод машинного обучения раскрывает неизвестные особенности важных бактериальных патогенов
Добавить в закладки
Статьи

Согласно исследованию Пенна, мощный метод машинного обучения раскрывает неизвестные особенности важных бактериальных патогенов

По словам группы исследователей из Медицинской школы Перельмана в Университете Пенсильвании, новый мощный метод машинного обучения может применяться к большим массивам данных в биологических науках для выявления ранее неизвестных свойств организмов и их генов . Например, метод изучил характерные паттерны экспрессии генов, которые появляются, когда бактерия подвергается воздействию условий с низким содержанием кислорода, и надежно идентифицировал изменения, которые происходят в ответ на антибиотики.

Ссылки по теме
Медицинский факультет Перельмана при Пенсильванском университете

Система здравоохранения Пенсильванского университета

В этом методе используется недавно разработанный алгоритм, называемый «автоэнкодером шумоподавления», который учится определять повторяющиеся особенности или закономерности в больших наборах данных, не сообщая, какие именно особенности следует искать. Например, в 2012 году, когда исследователи, спонсируемые Google, применили аналогичный метод к случайно выбранным изображениям YouTube, их система успешно научилась распознавать основные повторяющиеся особенности этих изображений, включая кошек.

В новом исследовании, опубликованном в онлайн-журнале mSystems на этой неделе, Кейси Грин, доктор философии , доцент кафедры системной фармакологии и трансляционной терапии, в сотрудничестве с Деборой Хоган, кандидатом наук из Дартмутского колледжа, использовали систему шумоподавления автоэнкодеров для анализа многих крупных наборы данных, которые измеряют, как гены бактерий экспрессируются в различных условиях. Грин также является старшим научным сотрудником Пенсильванского института биомедицинской информатики.

«Система изучила фундаментальные принципы бактериальной геномики только из этих данных», — сказал Грин. «Мы ожидаем, что этот подход будет особенно полезен микробиологам, изучающим виды бактерий, которым не хватает многолетних исследований в лаборатории. Микробиологи могут использовать эти модели, чтобы определить, где данные согласуются с их собственными знаниями, а где данные, кажется, указывают в другом направлении ». Грин считает, что это те случаи, когда данные могут указывать на новые биологические механизмы.

В прошлом году Грин и его команда опубликовали первую демонстрацию нового метода в биологическом контексте: анализ двух наборов данных по экспрессии генов рака груди. Новое исследование было значительно более амбициозным — оно охватило все 950 массивов экспрессии генов, публично доступных в то время для бактерии Pseudomonas aeruginosa , из 109 различных наборов данных. Эта бактерия является печально известным патогеном в больнице и у людей с муковисцидозом и другими хроническими заболеваниями легких, и ее часто трудно лечить из-за ее высокой устойчивости к стандартным методам лечения антибиотиками.

Первый автор Джи Тан, аспирант из Дартмута, где до недавнего времени располагалась лаборатория Грина, разработал ADAGE (Анализ с использованием автоэнкодеров с шумоподавлением для экспрессии генов) и применил его к наборам данных P. aeruginosa . Данные включали только идентичность примерно 5000 генов P. aeruginosa , их измеренные уровни экспрессии в каждом опубликованном эксперименте. Цель состояла в том, чтобы показать, что эта «неконтролируемая» обучающая система может раскрыть важные закономерности в экспрессии генов P. aeruginosa и прояснить, как эти закономерности изменяются при изменении среды обитания бактерии, например, в присутствии антибиотика.

Несмотря на то, что модель, построенная с помощью ADAGE, была относительно простой — примерно эквивалентной мозгу всего с несколькими десятками нейронов — у нее не было проблем с изучением того, какие наборы генов P. aeruginosa имеют тенденцию работать вместе или противостоят. К удивлению исследователей, система ADAGE также обнаружила различия между основным лабораторным штаммом P. aeruginosa и штаммами, выделенными от инфицированных пациентов. «Это оказалось одной из самых сильных сторон данных», — сказал Грин.




Добавить в избранное Версия для печати
Поделитесь:
Автор: admin
Опубликовано: 28.01.2021

Adblock
detector
  X