الگوریتم بهینه‌سازی ازدحام ذرات برای خوشه‌بندی سند

در الگوریتم خوشه‌بندی سند پی.اس.اُ، فضای بردار سند چند بعدی به عنوان فضایی مسئله مدل‌سازی می‌شود. هر عبارت در دیتاست سند یک بعد از فضای مسئله ارائه می شود. هر بردار سند می‌تواند به عنوان  ضرب  در فضای مسئله ارائه شود. دیتاست سند کامل می‌تواند به عنوان فضای چند بعدی با یک  تعداد بزرگی از ضرب در  این فضا به دست بیاید.

یک ذره در این ازدحام یک راه حل ممکن برای خوشه‌بندی اسناد ملاحظه می‌شود. بنابراین یک ازدحام یک تعداد نماینده راه‌ حل‌های خوشه‌بندی را برای مجموعه سند نشان می‌دهد. هر ذره یک ماتریس ایکس آی حاوی سی را دارد که سی بردار مرکز خوشه را نشان می‌دهد و کا تعداد کلاسترها را بیان می‌کند. این ذره بر طبق تجربه خود و همسایگانش جایگاه بردار مرکز خوشه در فضای بردار را در هر تعمیم تعیین می‌کند. فاصله میانگین اسناد تا مرکز خوشه به عنوان مقدار مناسب برای ارزیابی راه حل ارائه شده توسط هر ذره استفاده می‌شود. مقدار تناسب با معادله پایین به دست می‌آید :

خلاصه این الگوریتم به شکل زیر است:

۱: در گام اول ، هر ذره به طور تصادفی کا بردار سند محتلف از مجموعه سند را به عنوان بردارهای مرکز خوشه انتخاب می‌کند.

۲: برای هر ذره:

  1. هر بردار سند در مجموعه سند به عنوان مرکز خوشه تعیین می‌شود
  2. مبتنی بر معادل ۷ مقدار تناسب محاسبه می‌گردد
  3. با استفاده از سرعت و جایگاه ذره معادله ۶ به روزگشته و  راه حل بعدی را تولید می‌کند.

۳: گام ۲ تا زمانی که یک شرط انقضا حاصل شود تکرار می‌گردد

دیدگاه‌تان را بنویسید: