Машинное обучение поможет ускорить исследование состава материала
Студент НИТУ МИСИС описал метод, который позволит материаловедам сэкономить время при расшифровке рентгенограмм. Он предложил использовать машинное обучение для прогнозирования фаз кристаллической структуры переходных металлов и их оксидов на основе данных рентгеновской дифракции. Статья вошла в сборник «ML4Materials» конференции International Conference on Learning Representations (ICLR), которая является самой престижной в мире в сфере ИИ согласно среднему индексу цитирования Google.
Один из основных методов, используемых в материаловедении – рентгенофазовый анализ – основан на получении данных о химическом составе материала при помощи рентгеновской дифракции. На практике в процессе производства и во время дифракции в установке дифрактометра образуются различные оксиды и лишние соединения, которые могут мешать идентификации фаз материала, поэтому по-прежнему существует потребность в более надежных и точных методах определения элементов на дифрактограммах.
Машинное обучение уже давно используется для прогнозирования свойств материалов, анализа кристаллической структуры и классификации дифракционных картин. База данных рентгенограмм позволяет проводить идентификацию более конкретным и целенаправленным образом, снижая вероятность ошибок интерпретации. Однако ранее в научных работах такие подходы практически не применялись по отношению к оксидам переходных металлов, которые используются в различных областях – от трубопроводного транспорта до электронных приборов.
«Метод состоит из трех этапов. Сначала, собираются признаки о пиках на спектограммах, то есть подсчитывается позиция, величина, расстояние и площадь каждого пика. Стоит обратить внимание на главный признак – площадь графика между пиками. Он позволяет сравнивать паттерны дифракций разных веществ и находить точные совпадения. С помощью данного алгоритма идет подсчет количества совпадений. Так как пики могут иметь различные отклонения, используется машинное обучение. Полученные признаки, включая количество совпавших пиков, подается в классические алгоритмы машинного обучения для корректировки итогового результата. Самой лучшей моделью стал случайный лес с увеличенной глубиной», – рассказал автор исследования Максим Жданов.
Одной из ключевых функций, используемых для этого анализа, является расчет площади пиков, который применяется для количественной оценки интенсивности дифракционных пиков. Этот аспект позволяет более точно и быстро идентифицировать различные фазы в рентгенограммах, что в будущем может значительно сэкономить время ученому при исследовании материала.
Описанный метод имеет свои ограничения. Идентификация близких фаз по-прежнему может быть неточной в случаях, где рисунок и кристаллическая структура различаются по ряду причин. Помимо прочего, на точность идентификации влияет состояние дифрактометра и предыдущие проведенные эксперименты.
«Сейчас предложенным методом трудно работать с задачами, где встречается множество разных веществ. Стоит попробовать применение нейронных сетей со структурированным латентным пространством, например, как в вариационных автоэнкодерах, для извлечения более важных признаков из разных групп материалов», – отметил Максим Жданов.
В будущих исследованиях будет расширен спектр материалов, а также в перспективе проведение тестов на реальных данных.