تکنیک ترکیب الگوریتم پی.اس.اُ و کا-مین برای خوشه‌بندی سند

این مقاله دو تکنیک برای خوشه‌بندی اسناد ارائه می‌دهد:

کا پی اس اُ:

ترکیب کا مین و پی.اس.اُ با ماژول کا مین مقدار دهی اولیه شده و سپس پی.اس.اُروی نتایج اولیه تولید شده توسط ماژل کا مین به کار برده شده است. در ماژول کا مین باز محاسبه سنتروید خوشه‌ها انجام شده به عنوان:

https://screenshots.firefoxusercontent.com/images/59c5f9ba-e36d-49fc-8e39-cd05388f2a78.png

جایی که دی جی بردار‌های سند متعلق به خوشه اس جی؛ سی جی بردار مرکز، ان جی تعداد بردار اسناد متعلق به خوشه اس جی است. تابع تناسب برای کمینه کردن ماژول پی.اس.اُ در ای.دی.دی.سی (فاصله میانگین اسناد تا مرکز خوشه) به عنوان زیر محاسبه می‌شود:

فرایند الگوریتم کا پی اس ا، به وسیله نقاط زیر توصیف شده‌ است:

گام ۱: [ماژول کا مین] انتخاب کا نقطه به عنوان مراکز اولیه

گام ۲:‌ تکرار

 1. از هر کلاستر با ارزیابی هر نقطه از نزدیکترین مرکزش
 2. مرکز هر خوشه را محاسبه کن

گام ۳: تا زمانی که مراکز تغییر نیابند

گام ۴: [ماژول پی.اس.اُ] پی.اس.اُ را روی مقادیر اولیه تولید شده کا مین اجرا کن

 1. ذرات [خوشه‌ها] را مقداردهی اولیه کن
 2. اندازه جمعیت را مقداردهی اولیه کن و تکرار
 3. خوشه‌ها به داده‌های ورودی مقداردهی اولیه کن
 4. جایگاه اصلی را به دست بیاور

گام ۵: تکرار ازدحام

 1. نقاط برنده را بیاب
 2. با استفاده از معادله ۱۳ و ۱۴ جایگاه و سرعت را به روز رسانی کن

گام ۶: ارزیابی قدرت ازدحام

 1. تولید تکرار
 2. مصرف ذرات ضعیف
 3. بازمحاسبه جایگاه

گام ۷: بسته شو زمانی که تعداد ماکزیمم تکرار حاصل شود یا هر معیار توقف دیگری اغنا شود.

دیدگاه‌تان را بنویسید: