Применение методов машинного обучения для классификации кварцитов по химическому составу: влияние микроэлементов и геохимическая идентификация
https://doi.org/10.24930/1681-9004-2025-25-2-320-335
EDN: XFIXKQ
Аннотация
Объект исследования. Кварциты из различных участков Восточно-Саянского кварценосного района.
Цель. Целью данного исследования является применение методов машинного обучения для эффективной классификации образцов кварцитов по их химическому составу, включая идентификацию ключевых микроэлементов, таких как марганец, и выявление геохимических различий между образцами.
Материалы и методы. В исследовании использовались данные химического анализа 776 образцов кварцита, которые были подвергнуты интерпретации с помощью методов машинного обучения. В качестве методов были применены стандартные техники предварительной обработки данных, такие как нормализация, а также аугментация данных с использованием SMOTE для решения проблемы дисбаланса классов. В итоге был выбран алгоритм CatBoost, который показал высокую точность классификации.
Результаты. Результаты кросс-валидации показали, что алгоритм CatBoost достиг точности классификации до 97 %. Важность признаков указывает на то, что марганец является ключевым элементом в классификации образцов, в то время как такие элементы, как алюминий и калий, оказывают вспомогательное влияние. Также успешно проведен анализ классификации по цвету кварцитов с точностью до 0.94.
Выводы. Исследование демонстрирует эффективность применения методов машинного обучения для анализа химического состава кварцитов, предоставляя новые возможности для геохимических и археологических исследований.
Ключевые слова
Об авторах
А. С. МясниковаРоссия
664033; ул. Фаворского, 1А,; Иркутск
Р. Ю. Шендрик
Россия
664033; ул. Фаворского, 1А,; Иркутск
И. А. Елисеев
Россия
664033; ул. Фаворского, 1А,; Иркутск
О. И. Чачанагова
Россия
664033; ул. Фаворского, 1А,; Иркутск
А. М. Федоров
Россия
664033; ул. Фаворского, 1А,; Иркутск
А. И. Непомнящих
Россия
664033; ул. Фаворского, 1А,; Иркутск
Список литературы
1. Аюржанаева Д.Ц., Федоров А.М., Мазукабзов А.М., Непомнящих А.И., Очирова Э.А. Посохов В.Ф. (2020) Механизмы формирования химически чистых кварцитов Бурал-Сардыкского месторождения. Геология и геофизика, 61(10), 1316-1330. doi: 10.15372/GiG2023128
2. Непомнящих А.И., Федоров А.М., Жабоедов А.П., Волкова М.Г. (2023) Высокочистые кварциты Восточного Саяна. Геология и геофизика, 64(8), 1205-1215. doi: 10.15372/GiG2023128
3. Федоров А.М., Макрыгина В.А., Мазукабзов А.М., Непомнящих А.И., Аюржанаева Д.Ц., Волкова М.Г. (2021) Ресурсы кварцевого сырья Гарганской зоны Восточносаянского кварцитоносного района. Георесурсы, 23(4), 96-106. doi: 10.18599/grs.2021.4.11
4. Юдович Я.Э., Кетрис М.П. (2013) Геохимия марганца в процессах гипергенеза : обзор. Биосфера, 5(1) 21-36.
5. Baak M., Koopman R., Snoek H., Klous S. (2020) A new correlation coefficient between categorical, ordinal and interval variables with Pearson characteristics. Comput. Stat. Data Anal., 152, 107043. doi: 10.1016/j.csda.2020.107043
6. Bajpai J., Singh S. (2019) On orthogonal hypergeometric groups of degree five. Transact. Amer. Math. Soc., 372(11), 7541. doi: 10.1090/tran/7677
7. Breiman L. (2001) Random Forests. Machine Learning, 45(1), 5-32. doi: 10.1023/A:1010933404324
8. Chawla N.V., Bowyer K.W., Hall L.O., Kegelmeyer W.P. (2002) SMOTE: Synthetic minority over-sampling technique. J. Artific. Intellig. Res., 321-357. doi: 10.1613/jair.953
9. Fedorov A.M., Makrygina V.A., Nepomnyaschikh A.I., Zhaboedov A.P., Parshin A.V., Posokhov V.F., Sokolnikova Yu.V. (2019) Geochemistry and petrology of superpure quartzites from East Sayan Mountains, Russia. Acta Geochim. 38(1), 22-39. doi: 10.1007/s11631-018-0268-5
10. Götze J., Möckel R. (2012) Quartz: Deposits, Mineralogy and Analytics. Spring. Geol., Ó Springer-Verlag Berlin Heidelberg.
11. Hnila P., Frahm E., Gilibert A. et al. (2025) “Open Sourcing” Workflow and Machine Learning Approaches for Attributing Obsidian Artifacts to Their Volcanic Origins: A Feasibility Study from the South Caucasus. J. Archaeol. Method. Theory, 32(28).
12. Ke G., Meng Q., Finley Th., Wang T., Chen W., Ma W., Ye Q., Liu T. (2017) LightGBM: A Highly Efficient Gradient Boosting Decision Tree. Proceedings of the 31sup>st</sup> Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, 4-9 December 2017, 314s9-3157. https://dl.acm.org/doi/10.5555/3294996.3295074
13. Lundberg S.M., Lee S.-I. (2017) A Unified Approach to Interpreting Model Predictions. Advances in Neural Information Processing Systems, 30.
14. Manning C.D., Raghavan P., Schütze H. (2008) Introduction to Information Retrieval. Cambridge University Press, 234-265.
15. Müller A., Wanvik J.E., Ihlen P.M. (2012) Petrological and Chemical Characterisation of High-Purity Quartz Depo sits with Examples from Norway. (Eds J. Götze, R. Möckel). Quartz: Deposits, Mineralogy and Analytics. Springer Geology. Springer, Berlin, Heidelberg.
16. Pitblado B.L., Dehler C., Neff H., Nelson S.T. (2008) Pilot study experiments sourcing quartzite, Gunnison Basin, Colorado. Geoarchaeology, 23(6), 742-778. doi: 10.1002/gea.20240
17. Pitblado B.L., Cannon M.B., Neff H., Dehler C.M., Nelson S.T. (2013) LA-ICP-MS analysis of quartzite from the Upper Gunnison Basin, Colorado. J. Archaeol. Sci., 40(4), 2196-2216. doi: 10.1016/j.jas.2012.11.016
18. Prokhorenkova L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. (2017) CatBoost: Unbiased boosting with cate gorical features. arXiv:1706.09516v5. doi: 10.48550/arXiv.1706.09516
19. Shah S.A., Shao Y., Zhang Y., Zhao H., Zhao L. (2022) Texture and Trace Element Geochemistry of Quartz : A Review. Minerals, 12, 1042. doi: 10.3390/min12081042
20. van der Maaten L.J.P. (2014) Accelerating t-SNE using Tree-Based Algorithms. J. Mach. Learn. Res., 15(93), 3221-3245.
21. Wang Y., Qiu K.-F., Müller A., Hou Z.-L., Zhu Z.-H., Yu H.-C. (2021) Machine learning prediction of quartz forming-environments. J. Geophys. Res.: Solid Earth, 126, e2021JB021925. doi: 10.1029/2021JB021925
22. Yu H.F., Huang F.L., Lin C.J. (2011) Dual coordinate descent methods for logistic regression and maximum entropy models. Mach. Learn., 85, 41-75. doi: 10.1007/s10994-010-5221-8
23. Zhu G.-D., Niu Y.-Y., Liao S.-B., Ruan L., Zhang X.-H. (2023) Discrimination of Quartz Genesis Based on Explainable Machine Learning. Minerals, 13, 997. doi: 10.3390/min13080997
Рецензия
Для цитирования:
Мясникова А.С., Шендрик Р.Ю., Елисеев И.А., Чачанагова О.И., Федоров А.М., Непомнящих А.И. Применение методов машинного обучения для классификации кварцитов по химическому составу: влияние микроэлементов и геохимическая идентификация. Литосфера. 2025;25(2):320-335. https://doi.org/10.24930/1681-9004-2025-25-2-320-335. EDN: XFIXKQ
For citation:
Myasnikova A.S., Shendrik R.Yu., Eliseev I.A., Chachanagova O.I., Fedorov A.M., Nepomniyschikh A.I. Application of machine learning methods to classify quartzites by chemical composition: the influence of trace elements and geochemical identification. LITHOSPHERE (Russia). 2025;25(2):320-335. (In Russ.) https://doi.org/10.24930/1681-9004-2025-25-2-320-335. EDN: XFIXKQ