ترکیب الگوریتم خوشه‌بندی ازدحام ذرات و الگوریتم خوشه‌بندی کا-مین

پژوهش مُروز نشان داد که اگر زمان کافی تعیین شود، الگوریتم خوشه‌بندی پی.اس.اُ نسبت به الگوریتم خوشه‌بندی کامین می‌واند نتایج خوشه‌‌بندی شده‌ی فشرده‌تری از دیتاست کم بعد ارائه دهد. با این حال، هنگام خوشه‌بندنی دیتاست‌های اسناد بزرگ، انتقال آهسته از مرحله جهانی به مرحله بهینه‌سازی محلی موجب می‌شد الگوریتم خوشه‌بندی پی.اس.اُ نیاز به تکرار بیشتری انحراف به بهینه در گام اصلاح نسبت به کامین داشته باشد. اگرچه الگوریتم پی.اس.اُ ذاتا موازی است و می‌تواند با استفاده از چند سخت‌افزار موازی به عنوان کامپیوتر کلاستر پیاده‌سازی شود، نیاز محاسبه برای خوشه‌بندی دیتاست بزرگ اسناد هنوز بالا است. در آزمون ما، این نیاز به بیش از ۵۰۰ تکرار برای الگوریتم پی.اس.ا، برای رفتن به سوی نتیجه برای یک دیتاست سندی داشت که شامل ۸۰۰ سند بود، در حالی که کامین نیاز به ۱۰ تا ۲۰ تکرار داشت.

اگرچه الگوریتم پی.اس.اُ نتایج خوشه‌بندی بهتری نسبت به الگوریتم کا-مین ارائه می‌دهد، در شرایط زمان اجرا، الگوریتم کا-مین برای دیتاست‌های بزرگ کاراتر است. به این دلیل ما رهیافت پی.اس.اُ ترکیبی ارائه می‌دهیم که از الگوریتم کا-مین جایگزن گام اصلاح در الگوریتم پی.اس.اُ می‌شود. در الگوریتم پی.اس.اُ ترکیب شده، اینا لگوریتم شامل دو ماژول، ماژول پی.اس.اُ و ماژول کا-مین است. گام جستجوی جهانی و گام اصلاح محلی به وسیله دو ماژول ترتیبی انجام می‌شوند. در گام اولیه، ماژول پی.اس.اُ برای یک دوره کوتاه (۵۰ تا ۱۰۰ تکرار) بمجاوت راه حل بهینه را به وسیله یک جستجوی جهانی  کشف می‌کند و در زمان یکسانی از انجام محاسبات فراوان دور می‌شود.  نتیجه از ماژول پی.اس.اُ به عنوان جستجوی اولیه ماژول کا-مین استفاده می‌‌شود. الگوریتم کا-ین برای اصلاح و تعمیم نتایج پایانی به کار گرفته می‌شود.

رهیافت کامل می‌تواند به گام‌های زیر خلاصه شود:

۱: شروع فرایند خوشه‌بندی پی.اس.اُ تا زمانی که به ماکسیمم تعداد تکرارها برسد

۲: نتایج خوشه‌بندی پی.اس.اُ به عنوان بردارهای مرکزی اولیه برای ماژول کا-مین استفاده می‌شود.

۳: شروع فرایند کا-مین تا زمانی که به حداکثر تکرار برسد.

دیدگاه‌تان را بنویسید: