مقالات در رابطه با الگوریتم خوشه بندی دسته‌ای ذرات مبتنی بر غلظت برای یافتن سوالات، و متن‌های مشابه

ظاهرا مقالات زیادی در این خصوص نوشته شدند، در گوگل اسکالر این‌ها را پیدا کردم:

اولین مقاله‌ای که می‌خوام بررسی کنم:

Evaluation of text document clustering approach based on particle swarm optimization

یعنی ارزیابی رهیافت خوشه بندی سند مبتنی بر بهینه‌سازی دسته‌ای ذرات

البته من در آن پست نوشتم متن کاوی که اشتباه شد، خوشه‌بندی سند یکی از شاخه‌های متن‌کاوی است.

خوب بریم سراغ این مقاله

چکیده:

خوشه‌بندی از تکینک‌های مهم داده‌کاوی است که تکنیک یادگیری خودکار به کمک گروه‌بندی کردن دسته‌ای از اشیا به زیردسته‌ها یا خوشه‌ها است. هدف این کار ایجاد خوشه‌هایی است که ذاتا منسجم هستند، اما اساسا متفاوت از یکدیگرند. خوشه‌بندی متن به خوشه‌بندی اسناد مرتبط ببا گروه‌های مبتنی بر محتوایشان ارجاع داده می‌شود. این عملیات پایه‌ای استفاده شده در سازماندهی اسناد غیرنظارتی، داده متن کاوی، استخراج خوکار موضوع، و بازیابی اطلاعات است. الگوریتم‌های خوشه‌بندی سریع و با کیفیت اسناد نقش مهمی در ناوبری، خلاصه‌سازی، و سازماندهی اطلاعات بر عهده دارند. اسناد خوشه‌بندی شده می‌توانند مقالات خبری وب، چکیده مقلات پژوهشی و … باشند. این مقاله دو تکنیک برای خوشه‌بندی کارای اسناد درگیر در برنامه‌های رهیافت رایانش نرم به عنوان یک رهیافت ترکیبی هوشمند الگوریتم پی.اس.اُ نشان می‌دهد. این رهیافت درگیر افراز فازی الگوریتم سی-مین فازی و الگوریتم کا مین است که هر کدام با الگوریتم بهینه‌سازی دسته‌ای ذرات ترکیب شده‌اند. کارایی این الگوریتم‌های ترکیبی در مقابل تکنیک‌های افراز سنتی ارزیابی شده است.

جاشیه: باز این ترس سراغ اومد که ممکنه این مقاله مرتبط نباشه، اما من ادامه می‌دم

حاشیه ۲: ظاهرا این یک مقاله ساده است، یا ساده نوشته شده

حاشیه ۳: بخش بیان مشکل این مقاله می‌تواند برای من عالی باشه

بیان مشکل:

یعنی پاراگراف اول دقیقا کپی چکیده است

خوشه‌بندی از تکینک‌های مهم داده‌کاوی است که تکنیک یادگیری خودکار به کمک گروه‌بندی کردن دسته‌ای از اشیا به زیردسته‌ها یا خوشه‌ها است. هدف این کار ایجاد خوشه‌هایی است که ذاتا منسجم هستند، اما اساسا متفاوت از یکدیگرند. خوشه‌بندی متن به خوشه‌بندی اسناد مرتبط ببا گروه‌های مبتنی بر محتوایشان ارجاع داده می‌شود. این عملیات پایه‌ای استفاده شده در سازماندهی اسناد غیرنظارتی، داده متن کاوی، استخراج خوکار موضوع، و بازیابی اطلاعات است. الگوریتم‌های خوشه‌بندی سریع و با کیفیت اسناد نقش مهمی در ناوبری، خلاصه‌سازی، و سازماندهی اطلاعات بر عهده دارند. اسناد خوشه‌بندی شده می‌توانند مقالات خبری وب، چکیده مقلات پژوهشی و … باشند.

حاشیه: از اینجا حالا متفاوت است

مشکل خوشه‌بندی اسناد می‌تواند به شکل زیر فرمول بندی شود:

  • تعیین یک مجموعه از اسناد دی
  • تعداد دلخواه خوشه‌ها کا
  • یک تابع هدف اف که کیفیت خوشه‌بندی را ارزیابی می‌کند، ما می‌خواهیم ارزیابی γ: D → ۱ ;:::;K را محاسبه کنیم. به گونه‌ای که تابع هدف ماکسیماس یا مینیماز شود. وای قانون جبری است (برای مثال هیچ یک از خوشه‌ها نبایستی خالی باشد.  تابع هدف معمولا در شرایط سنجه‌های شباهت یا فاصله تعریف می‌شود.

حاشیه: از بخش انگیزه این مقاله نیز می‌توان در پایان نامه به کار برد، اما اینجا نمی‌نویسم

حاشیه: انگار این مقاله برای پایان‌نامه ارائه شده

حاشیه: این بار این قابلیت تازه اظافه شده بلاگفا در زمینه ذخیره متن واقعا کمکم کرده،

 همش پاک شد.

پیش‌زمینه خوشه‌بندی و هوش گروهی را معرفی کرده بود.

من آنها را یکبار ترجمه کردم که پاک شد، الان فقط انگلیسیش را می‌ذارم:

Some of the previously mentioned optimization techniques are Genetic Algorithm (GA), Hill climbing, Simulated Annealing, and Differential Evolution (DE) [15, 62]. Swarm Intelligence (SI) is an innovative distributed intelligent paradigm for solving optimization problems that originally took its inspiration from the biological examples by swarming, flocking and herding phenomena in vertebrates [3]. Swarm Intelligence is the property of a system whereby the collective behaviour of (unsophisticated) agents interacting locally with their environment causes coherent functional global patterns to emerge. Swarm behaviour can be seen in bird flocks, fish schools, as well as in insects like mosquitoes and midges. The efforts to mimic such behaviour through computer simulation have finally resulted into the fascinating field of Swarm Intelligence (SI). Data mining and Swarm Intelligence may not have many properties in common; however, recent studies [4] suggest that they can be used together for several real world data mining problems especially when other methods would be too expensive or difficult to implement. Swarm intelligence involves use of meta-heuristics with soft computing approach which is potentially useful in many fields e.g. Data Mining, Web mining, Wireless sensor networks, Job scheduling in computer grids, Network Routing etc. Advantages of SI include flexibility, robustness and self-organization [21], generally good in high dimensions, with lots of variables; they tend to be robust in noisy spaces. According to Ajith Abraham et al. [1] since SI algorithms are stochastic search and optimization techniques which are guided by the principles of collective behaviour and self organization of insect swarms; they are quite efficient, adaptive and robust techniques producing near optimal solutions and have a large amount of implicit parallelism. On the other hand, data clustering may be well formulated as a difficult global optimization problem; thereby making the application of SI tools more obvious and appropriate.

در کل گفته هوش گروهی یک راه برای یافتن مسائل بهینه‌سازی است. بهینه‌سازی را تعریف کرده یعنی یافتن بهترین مقدار برای پارامترها به گونه‌ای که تابع هدف ماکسیمم یا مینیمم بشه

بعدش گفته هوش گروهی یک رهیافت نو برای حل مسائل بهینه سازی است. این الگوریتم از حرکت دسته جمعی پرندگان، ماهی‌ها و … الهام گرفته.

گفته چون داده‌کاوی مسائل بهینه‌سازی است پس این رهیافت که از الگوریتم‌های تصادفی می کنه به درد می‌خوره

حاشیه: کلا مطلب انگیزشی خوبی بود.

خوب حالا رفته سراغ مرور نوشته‌ها:

حاشیه: یک بار هر چی در مورد خوشه‌بندی متن یا همان خوشه‌بندی سند نوشتم پاک شد، الان در این مقاله خیلی قشنگ توضیح داده

چون این کار را می‌خوام قشنگ ترجمه‌ش کنم حواله‌ش می کنم به پست بعد

دیدگاه‌تان را بنویسید: