Модели и методы гибридной реляционной кластеризации данных
Диссертация
Структура и объем работы. Диссертационная работа состоит из введения, обзора существующих методов кластеризации и визуализации данных, анализа традиционных подходов к классификации и визуализации, исследования свойств реляционной схемы инвариантных иерархических кластерных процедур, разработки новой инвариантной иерархической кластерной процедуры, разработки методов гибридной кластеризации… Читать ещё >
Список литературы
- Загоруйко, Н.Г. Методы распознавания и их применение/ Н. Г. Загоруйко. -М.: Советское радио, 1972. 208 с.
- Delgado, M. On the use of hierarchical clustering in fuzzy modeling / M. Delgado, A.F.Gomez-Skarmeta, A. Vila // International Journal of Approximate Reasoning. -1996. № 14.-P. 237−257.
- Барсегян, A.A. Технологии анализа данных: DataMining, VisualMining, TextMining, OLAP / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод 2-е изд., перераб. и доп. — СПб.: БХВ-Петербург, 2008. — 384 с.
- Бериков, B.C. Современные тенденции в кластерном анализе / В. С. Бериков, Г. С. Лбов // Всероссийский конкурсный отбор обзорно-аналитических статей по приоритетному направлению «Информационно-телекоммуникационные системы». 2008. — 26 с.
- Hardle, W. Applied Multivariate Statistical Analysis / W. Hardle, L. Simar -Springer-Verlag, Berlin-Heidelberg, 2007. 455 p.
- Strehl, A. Cluster Ensembles A Knowledge Reuse Framework for Combining Multiple Partitions / A. Strehl, J. Ghosh // Journal of Machine Learning Research. — 2002. -№ 3. — P. 583−617.
- Jain, A.K. Data Clustering: A Review / A.K. Jain, M.N. Murty, P.J. Flynn // ACM Computing Surveys. 1999. — Vol. 31, № 3. — P. 264−323.
- Murty, M.N. Computationally efficient technique for data clustering / M.N. Murty, G. A. Krishna // Pattern Recogn. 1980. — № 12. — P. 153−158.
- Babu, G.P. Clustering with evolution strategies / G.P. Babu, M.N.Murty // Pattern Recogn. 1994. -№ 27. — P. 321−329.
- Батыршин, И.З. Нечеткие гибридные системы. Теория и практика/ И. З. Батыршин, А. О. Недосекин, А. А. Стецко, В. Б. Тарасов, А. В. Язенин, Н. Г. Ярушкина. М.: Физматлит, 2007. — 208 с.
- Jardine, N. Mathematical taxonomy / N. Jardine, R. Sibson//London: John Wiley & Sons. 1971.-286 p.
- Johnson, S.C. Hierarchical clustering schemes. // Psychometrika. 1967. — № 32. -P. 241−254.
- Батыршин, И.З. Методы анализа систем на основе взвешенных отношений: дис. канд. техн. наук: 05.13.17 «Теоретические основы информатики"/ Ильдар Закирзянович Батыршин. — М., 1982. — 218 с.
- Butyrshin, I. On two dimensional visualization of hierarchical clustering / I. Butyrshin, L. Sheremetov, A. Klimova // IEEE International Conference Сотр. Cybern, ICCC 2003. -Hungary- Siofok. 2003. — P. 181−184.
- Климова, А.С. Методы гибридной реляционной кластеризации в анализе среднего потребления электроэнергии странами бывшего Советского Союза/ А.С. Климова// Известия высших учебных заведений. Проблемы энергетики.- 2008. -Вып. № 5−6. С. 124−127.
- Батыршин, И.З. Гибридная кластеризация на основе реляционной схемы инвариантных кластерных процедур / И. З. Батыршин, А.С. Климова// Вестник Тверского государственного университета. Серия: Прикладная математика 2007. — Вып. № 7. — С. 27−42.
- Batyrshin, I.Z. Hybrid clustering of time series / I.Z. Batyrshin, L.B. Sheremetov, J.X.Velasco-Hernandez, A.S.Klimova // In: East West Fuzzy Colloquium 2006, 13th Zittau Fuzzy Colloquium. Germany -HS Zittau — Gorlitz. — 2006. — P. 140 146.
- Климова, А.С. Применение методов гибридной кластеризации к анализу нефтяных скважин / А. С. Климова, И. З. Батыршин, Н.К.Шайдуллина// Вестник Казанского технологического университета. 2013. — № 8. — С. 297 301.
- Hubert, J.C. Monotone invariant clustering procedures/ J.C. Hubert // Psychometrica. 1973. -Vol. 38. — № 1 — P. 47−62.
- Классификация и кластер: пер. с англ. / Дж. Вен Райзина, П. П. Кольцов, Ю. И. Журавлева. М.: Мир, 1980. — 392 С.
- Batyrshin, I. On invariance of clustering procedures /1. Batyrshin, R. Khabibulin // The journal of fuzzy mathematics. 1998. -№ 6. — P. 721−733.
- Хабибуллин, Р.Ф. Новые методы тестирования кластерных алгоритмов на инвариантность относительно нумерации объектов/ Р.Ф. Хабибуллин// Труды международного семинара «Мягкие вычисления 96». — Казань, 1996. -С. 209−213.
- Batyrshin, I. Invariant clustering procedures based on corrections of similarities /1. Batyrshin, T. Rudas // In: Proceedings of East West Fuzzy Colloquium. Zittau, Germany, 2000. — P. 302−309.
- Батыршин, И.З. Тестирование кластерных алгоритмов на инвариантность относительно нумерации объектов / И. З. Батыршин, Р. Ф. Хабибуллин // Известия академии наук. Теория и системы управления. 1997. — № 2 — С. 165−168.
- Batyrshin, I. A new invariant relational clustering procedures / I. Batyrshin, A. Klimova I I Proceedings East West Fuzzy Colloquium. IPM, Zittau, Germany. -2002. — P. 264−269.
- Батыршин, И.З. Структура семантического пространства словесных оценок поступков / И. З. Батыршин, В. А. Шустер // Принципиальные вопросы теории знаний. Труды по искусственному интеллекту. Ученые записки Тартуского гос. ун-та. Тарту, 1984. — С. 20−38.
- Lance, G.N. A general theory of classificatory sorting strategies / G.N. Lance, W.T. Williams //1. Hierarchical systems, Comput. J. 1969. — Vol. 9, № 4. — P. 373−380.
- Жамбю, M. Иерархический кластерный анализ/ M. Жамбю.- М.: Финансы и статистика, 1988. 344 с.
- Parniczky, G. A statisztikai informatika alapjai/ G. Parniczky. Budapest: Statisztikai Kiado Vallalat. — 1976. — P. 318−319.
- Barthelemy, J.P. Trees and Similarity Representations/ J.P. Barthelemy, A. Guenoche. Chichester: John Wiley & Sons, 1991. — 238 p.
- Peay, E.R. Nonmetric grouping: clusters and cliques/ E.R. Peay// Psychometrica. -1975. -Vol. 40. № 3. — P. 297−313.
- Jardine, C.J. The structure and construction of taxonomic hierarchies / C.J. Jardine, N. Jardine, R. Sibson//Math. Biosci. 1967, — Vol.1. — P. 173−179.
- Johnson, S.C. Hierarchical clustering schemes/ S.C. Johnson // Psychometrica. -1967.-Vol. 32-P. 241−254.
- Альпин, Ю.А. О деревьях, порождающих ультраметрические матрицы / Ю. А. Альпин, А. С. Климова // Материалы Международной научной конференции «Актуальные проблемы математики и механики». Казань: «Унипресс». -2000.-С. 15−16.
- Nabben, R. Generalized ultrametric matrices A class of inverse M- matrices / R. Nabben, R. S. Varga // Linear Algebra Appl. — 1995. — Vol. 220. — P. 365−390.
- Alpin, J. The bases of weighted graphs / J. Alpin, R. Mubarakzianow // Discrete Math. 1997. — Vol. 175.-P. 1−11.
- Barthelemy, Jean-Pierre. Trees and proximity representations / Jean-Pierre Barthelemy, A. Guenoche. New York: John Wiley & Sons, 1991. — 237 p.
- Tamura, S. Pattern classification based on fuzzy relations / S. Tamura, S. Higuchi, K. Tanaka// IEEE Trans. SMC. 1971. -Vol.1. — P. 61−66.
- Zadeh, L.A. Similarity relations and fuzzy orderings/ L.A. Zadeh //Information Sciences. 1973. -Vol. 3.-P. 177−200.
- Fodor, J.C. Structure of transitive valued binary relations / J.C. Fodor, M. Roubens // Mathematical Social Sciences. 1995. -Vol. 30 — P. 71−94.
- Gupta, K.C. Fuzzy equivalence relation redefined / K.C. Gupta, R.K. Gupta // Fuzzy Sets and Systems. 1996. — № 79. — P. 227−233.
- Boixader, D. Transitive closure and betweenness relations / D. Boixader, J. Jacas, J. Recasens // Fuzzy Sets and Systems. 2001. — № 120. — P. 415−422.
- Dunn, J.C. A graph-theoretic analysis of pattern classification via Tamura’s fuzzy relation/ J.C. Dunn// IEEE Trans. SMC. 1974. — Vol. 4. — P. 310−313.
- Lee, Hsuan-Shih. An optimal algorithm for computing the max-min transitive closure of a fuzzy similarity matrix/ Hsuan-Shih Lee // Fuzzy Sets and Systems. -2001.-№ 123.-P. 129−136.
- Батыршик, И.З. Гибридная реляционная кластеризация и визуализация данных / И. З. Батыршин, А. С. Климова // Труды Всеросс. научн. конф. по нечетким системам и мягким вычислениям НСМВ-2006. М.: Физматлит. -2006.-С. 193−209.
- Сокал, P.P. Кластер-анализ и классификация: предпосылки и основные направления/ P.P. Сокал // Классификация и кластер М: Мир, 1980. — С. 719.
- Guoyao, Fu. Optimization methods for fuzzy clustering/ Fu Guoyao // Fuzzy Sets and Systems. 1998. — № 93. — P. 301−309.
- Дуда, P. Распознавание образов и анализ сцен / Р. Дуда, П. Харт. М.: Мир, 1976.-512 С.
- Gorban, A. Principal Manifolds for Data Visualisation and Dimension Reduction / A. Gorban, B. Kegl, D. Wunsch, A. Zinovyev (Eds.) // LNCSE 58. Springer, Berlin — Heidelberg — New York. — 2007. — P. 340.
- Айвазян, С.А. Прикладная статистика: Классификация и снижение размерности: справочное издание / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин. М.: Финансы и статистика, 1989. — 608 с.
- Терехина, А.Ю. Анализ данных методами многомерного шкалирования/ А. Ю. Терехина. М.: Наука, 1986. — 165 с.
- Дэйвисон, М. Многомерное шкалирование/ М. Дэйвисон. М.: Финансы и статистика, 1988. — 128 с.
- Толстова, Ю.Н. Основы многомерного шкалирования/ Ю. Н. Толстова. Изд.: КДУ, 2006.- 160 с.
- Скурихин, А.Н. Генетические алгоритмы/ А. Н. Скурихин // Новости искусственного интеллекта. 1995. — № 4 — С. 6−46.
- Васильев, В.И. Интеллектуальные системы управления с использованием генетических алгоритмов / В. И. Васильев, Б. Г. Ильясов. Уфа: Редакционно-издательский комплекс УГАТУ, 1999. — 106 с.
- Дюран, Б. Кластерный анализ / Б. Дюран, П. Оделл. М.: Статистика, 1977. -128 с.
- Мандель, И.Д. Кластерный анализ/ И. Д. Мандель. М.: Финансы и статистика, 1988. — 176 с.
- Zhou, A. A Hybrid approach to clustering in very large databases / A. Zhou, W. Qian, H. Qian, J. Wen, Sh. Zhou, Y. Fan // PAKDD 2001, LNAI 2035. 2001. -P. 519−524.
- Батыршин, И.З. Эволюционные процедуры иерархической двухмерной визуализации данных / И. З. Батыршин, А. С. Климова // Исследования по информатике. Институт проблем информатики АН РТ. Казань: Отечество. --2004.-№ 7. -С. 119−124.
- Пегат, А. Нечеткое моделирование и управление: пер. с англ. / А. Пегат. -М.:БИНОМ. Лаборатория знаний, 2009. 798 с.
- Блюмин, C.JI. Нечеткая логика: алгебраические основы и приложения/ C.JI. Блюмин, И. А. Шуйкова, П. В. Сараев П.В. Липецк: ЛЭГИ. — 2002. — 113 с.
- Рыбин, В.В. Основы теории нечетких множеств и нечеткой логики/ В. В. Рыбин. М.: МАИ, 2007. — 96 с.
- Деменков, Н.П. Нечеткое управление в технических системах/ Н. П. Деменков. Издательство: МГТУ им. Н. Э. Баумана, 2005. — 200 с.
- Поспелов, Д.А. Логико-лингвистические модели в системах управления/ Д. А. Поспелов. М.: Энергоиздат, 1981. — 232 с.
- Поспелов, Д.А. Большие системы. Ситуационное управление/ Д. А. Поспелов. -М.: Знание, 1975.-62 с.
- Batyrshin, I. Invariant clustering procedures based on corrections of similarities /1. Batyrshin, T. Rudas // In: Proceedings of East West Fuzzy Colloquium. -Germany- Zittau. 2000. — P. 302−309.
- Ахо, А. Построение и анализ вычислительных алгоритмов / А. Ахо, Дж. Хопкрофт, Дж. Ульман. М.: Мир, 1979. — 536 с.
- Reingold, Е.М. Combinatorial Algorithms. Theory and Practice / E.M. Reingold, J. Nievergelt, N. Deo. New Jersey: Prentice-Hall. — 1977. — 433 p.
- Golberg, E. Genetic algorithm in search, optimization and machine learning / E. Golberg. Addison-Wesley Publishing Company, Reading, MA. — 1989. — P. 403.
- Лю, Б. Теория и практика неопределенного программирования: пер. с англ./ Б.Лю. М.:БИНОМ. Лаборатория знаний, 2005. — 416 с.
- Klimova, A. Evolutionary procedures of visualization of multidimensional data/
- A.Klimova// Proceedings International Conference on Fuzzy Sets and Soft Computing in Economics and Finance. Saint-Petersburg, Russia, 2004. — P. 130 139.
- World Stock Market Data Base Электронный ресурс. Режим доступа: http://www.countrybriefings.com.
- Hand, D. Principles of Data Mining / D. Hand, H. Manilla, P.Smyth. MIT Press, Cambridge. — 2001. — 546 p.
- KDnuggets: Polls: Time-Series Data Mining (Nov 2004). What Types of Time-Series Data Mining You’ve Done? Электронный ресурс. Режим дocтyпa: http://www.kdnuggets.com/polls/2004/timeseriesdatamining.htm.
- Agrawal, R. Efficient similarity search in sequence databases / R. Agrawal, C. Faloutsos, A. Swami // Proc. 4th Int. Conf. Foundations of Data Organization and Algorithms. Chicago, 1993. — P. 69−84.
- Bollobas, B. Time-Series Similarity Problems and Well-Separated Geometric Sets/
- B. Bollobas, G. Das, D. Gunopulos, H. Mannila // in Proc. of 13th Annual ACM Symposium on Computational Geometry. 1998. — P. 454−456.
- Wu, Y.-L. A Comparison of DFT and DWT Based Similarity Search in Time-Series Databases / Y.-L. Wu, D. Agrawal, A.E.Abbadi // in: Proceedings of the 9th ACM Int’l. Conference on Information and Knowledge Management CIKM. -McLean, VA, 2000. P. 488−495.
- Batyrshin, I. Moving approximations in time series data mining / I. Batyrshin, R. Herrera, L. Sheremetov, R. Suarez // in: Proc. of Int. Conference on Fuzzy Sets andк.
- Soft Computing in Economies and Finance. St. Petersburg, Russia, June 17−20, 2004.-Vol. l.-P. 62−72.
- Batyrshin, I. Association networks in time series data mining / I. Batyrshin, R. Herrera-Avelar, L. Sheremetov, A. Panova // NAFIPS 2005. Soft Computing for Real World Applications, Ann Arbor. Michigan, USA. — 2005. — P. 754−759.
- Батыршин, И.З. О визуализации многомерных данных / И. З. Батыршин, А. С. Климова // Материалы II Всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике». -Пенза, 2002.-С. 156−158.
- Россия в цифрах. Федеральная служба государственной статистики Электронный ресурс. РежимflocTyna: http://www.gks.ru/scripts/dbinet/dbinet.cgi?pl=2 702 005.