-پیش بینی سرطان سینه با استفاده از روش خوشه‌بندی انتشار وابستگی با در نظر گرفتن وزن متغیرها

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار، گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران،

2 دانش‌آموخته کارشناسی ارشد، گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران،

چکیده

با استفاده از ابزارهای داده­کاوی در حوزه­ی تشخیص پزشکی محدودیت­هایی همچون هزینه­های بالای برخی از آزمایشات یا زمان­بر بودن آن­ها مرتفع می­گردد. به علاوه، وجود خطا در برخی از آزمایشات موجب شده تا روش­های دسته­بندی مورد استقبال پژوهشگران قرار گیرد. در همین راستا پژوهش جاری با تکیه بر ترکیب روش­های خوشه­بندی و دسته­بندی روش جدیدی را برای تشخیص بدخیمی سرطان سینه ارائه نموده است که در آن عمل ترکیب با استفاده از یک الگوریتم ابتکاری تکرار شونده و الگوریتم خوشه­بندی انتشار وابستگی انجام می­شود. این روش با استفاده از یک الگوریتم ابتکاری وزن­هایی را برای متغیرها تولید نموده و براساس الگوریتم انتشار وابستگی، خوشه­های موزون تشکیل می­دهد. سپس شماره خوشه­ها به عنوان یک متغیر جدید به داده­ها افزوده شده و در مرحله­ی بعد، الگوریتم دسته­بند بر روی مجموعه داده­ی اصلاح شده حاوی داده­های اصلی و شماره­ی خوشه­ها اجرا می­گردد. با توجه به شاخص دقت، تولید اوزان تا رسیدن به بیشترین دقت ممکن ادامه می­یابد. بر طبق آزمایشات عددی انجام شده در این پژوهش، ترکیب الگوریتم خوشه­بندی انتشار وابستگی با میانگین دقت 36/98 دارای بیشترین دقت بوده است. به علاوه، آزمون فرض ویلکاکسون برتری شبکه­ی عصبی ترکیبی را نسبت به سایر روش­ها مورد تأیید قرار داده است.

کلیدواژه‌ها


عنوان مقاله [English]

Breast Cancer Prediction Using the Affinity Propagation Clustering with Regard to the Weights of Variables

نویسندگان [English]

  • Sina Dami 1
  • Zeinab Hatamchuri 2
1 Dept. Computer Engineering, West Tehran Branch, Islamic Azad University, Iran
2 Dept. Computer Engineering, West Tehran Branch,Islamic Azad University, Iran
چکیده [English]

By using data mining tools in the field of medical diagnosis, some limitations such as the high cost of some tests or their timing will be addressed. In addition, the existence of errors in some experiments has led researchers to be welcomed by categorization methods. In this regard, the present study, based on the combination of clustering and categorization methods, has proposed a new method for the diagnosis of breast cancer. In this operation, the combination is performed using an iterative algorithm and a dependency propagation clustering algorithm. This method produces weights for variables using an innovative algorithm and forms cluster clusters based on the dependency propagation algorithm. Then the number of clusters as a new variable is added to the data, and in the next step, the block algorithm is implemented on the modified dataset containing the main data and the number of clusters. According to the accuracy index, the weights production continues to reach the highest possible precision. According to the numerical experiments conducted in this study, the combination of the dependency emission clustering algorithm with an average accuracy of 36.98 was the most accurate. In addition, the Wilcoxon assumption test confirmed the superiority of the combined neural network compared to other methods.

کلیدواژه‌ها [English]

  • Clustering
  • Breast Cancer
  • Dependency Propagation Algorithm
  • Wilcoxon Assumption Test
 Arevalo J, González FA, Ramos-Pollán R, Oliveira JL, Lopez MA. (2016). Representation learning for
mammography mass lesion classification with convolutional neural networks. Computer
methods and programs in biomedicine. 127, 248-57.
 De Sampaio WB, Silva AC, de Paiva AC, Gattass M. (2015). Detection of masses in mammograms
with adaption to breast density using genetic algorithm, phylogenetic trees, LBP and SVM.
Expert Systems with Applications. 42(22), 8911-28.
 Ghayomi Zade. A. (2013). Clustering and Diagnosis of Breast Cancer via Thermal Images Using a
Combination of SVM and SOM Neural Network. ijbd. 2013; 5 (4), 13-22
 Hassanien AE, Moftah HM, Azar AT, Shoman M. (2014). MRI breast cancer diagnosis hybrid
approach using adaptive ant-based segmentation and multilayer perceptron neural networks
classifier. Applied Soft Computing. 14, 62-71.
 He, X., Wang, Z., Jin, C., Zheng, Y., Xue, X. (2012). A simplified multi-class support vector machine
with reduced dual optimization, Pattern Recognition Letters, 33, 71-82.
 Jiao Z, Gao X, Wang Y, Li J. (2016). A deep feature based framework for breast masses classification.
Neurocomputing. 197, 221-31
 Mishra G, Ananth V, Shelke K, Sehgal D, Valadi J. (2015). Hybrid ACO Chaos-Assisted Support
Vector Machines for Classification of Medical Datasets. InProceedings of Fourth International
Conference on Soft Computing for Problem Solving 2015. Springer India. 91-101
 Naush J, González FA, Ramos-Pollán R, Oliveira JL, Lopez MA. (2016). Representation learning for
mammography mass lesion classification with convolutional neural networks. Computer
methods and programs in biomedicine. 127, 248-57.
 Naushad SM, Ramaiah MJ, Pavithrakumari M, Jayapriya J, Hussain T, Alrokayan SA, Gottumukkala
SR, Digumarti R, Kutala VK. (2016). Artificial neural network-based exploration of genenutrient

interactions in folate and xenobiotic metabolic pathways that modulate susceptibility to
breast cancer. Gene. 580(2), 159-68.
 Rouhi R, Jafari M. (2016). Classification of benign and malignant breast tumors based on hybrid level
set segmentation. Expert Systems with Applications. 46, 45-59.
 Sivakami K. (2015). Mining Big Data: Breast Cancer Prediction using DT-SVM Hybrid Model.
 Sweilam NH, Tharwat AA, Moniem NA. (2010). Support vector machine for diagnosis cancer disease:
A comparative study. Egyptian Informatics Journal. 11(2), 81-92.
 Wang P, Hu X, Li Y, Liu Q, Zhu X. (2016). Automatic cell nuclei segmentation and classification of
breast cancer histopathology images. Signal Processing. 122, 1-3.
 World Health Organization. (2014) "Cancer Fact sheet N°297".
 Zheng B, Yoon SW, Lam SS. (2014). Breast cancer diagnosis based on feature extraction using a
hybrid of K-means and support vector machine algorithms. Expert Systems with Applications.
41(4), 1476-82.
 Zheng-Feng LI, Guang-Jin XU, Jia-Jun WA, Guo-Rong DU, Wen-Sheng CA, Xue-Guang SH. (2016).
Outlier Detection for Multivariate Calibration in Near Infrared Spectroscopic Analysis by Model
Diagnostics. Chinese Journal of Analytical Chemistry. 44(2), 305-9.

 
CAPTCHA Image