الگوریتم بهینه‌سازی ازدحام ذرات برای خوشه‌بندی سند

در الگوریتم خوشه‌بندی سند پی.اس.اُ، فضای بردار سند چند بعدی به عنوان فضایی مسئله مدل‌سازی می‌شود. هر عبارت در دیتاست سند یک بعد از فضای مسئله ارائه می شود. هر بردار سند می‌تواند به عنوان  ضرب  در فضای مسئله ارائه…

الگوریتم بهینه‌سازی ازدحام ذرات

در الگوریتم خوشه‌بندی اسناد پی.اس.اُ، فضای بردار سند چند بعدی به عنوان فضایی مسئله مدل‌سازی می‌شود. هر عبارت در دیتاست سند یک بعد از فضای مسئله ارائه می شود. هر بردار سند می‌تواند به عنوان  ضرب  در فضای مسئله ارائه…

الگوریتم خوشه‌بندی کا مین

الگوریتم کا مین یک الگوریتم ساده و سرراست که مبتنی بر پایه محکم تحلیل متغیرها قرار دارد. این الگوریتم گروهی از بردارهای داده را به تعداد پیش‌تعریف شده خوشه‌ها خوشه‌بندی می‌کند این الگوریتم با تعیین تصادفی مراکز خوشه شروع می‌کند،…

سنجه شباهت برای بررسی شباهت بین اسناد

من در یک مقاله به طور کامل آن را بررسی کردم اینجا دوباره همونا را می‌ذارم، البته این‌ها سنجه‌های شباهت خارجی هستند، برای سنجه‌های شباهت‌ داخلی باید بیشتر مطالعه کرد. چندین سنجش شباهت برای محاسبه سنجش شباهت میان اسناد وجود…

ارائه سند

در بیشتر الگوریتم‌های خوشه‌بندی، دیتاست به عنوان مجموعه‌ای از بردارها مثال: X {x۱,x۲, …} لحاظ می‌شند که بردار ایکس آی همگام با یک شی مفرد است که بردار ویژگی صدا زده می‌شود، یعنی ایکس آی بردار ویژگی است. یا همان…

مدل فضای بردار

در طی خوشه‌بندی اسناد همش با عبارت مدل فضای بردار مواجه می‌شویم: در این ۹ دقیقه می‌خوام این را توضیح بدم، پس کمربندها را محکم ببندید! مدل فضای بردار یا مدل فضای عبارت یک مدل جبری برای ارائه اسناد متنی…

رویه‌های خوشه‌بندی سند

رویه‌های خوشه‌بندی سند خوشه‌بندی سند کاری مشکل در حوزه متن کاوی است و این مشکلیش دلیلش بُعد بالا بودن سند متنی است. الگوریتمی کارا لازم است که بتواند از بس خوشه‌بندی بعد بالا بر بیاد. خوشه‌بندی سند نقش مهمی در…

تکنیک‌های خوشه‌بندی سند

خوشه‌بندی سند در ادبیات علم کامپیوتر به صورت گسترده مطالعه شده است. تلاش‌های پژوهشی گذشته در گذشته توسعه کارای رهیافت‌های خوشه‌بندی سند بررسی کرده‌اند. یک مطالعه تجربی که به وسیله کاریپس انجام شد درگیر مقایسه میان خوشه‌بندی سلسله مراتبی و…

مقالات در رابطه با الگوریتم خوشه بندی دسته‌ای ذرات مبتنی بر غلظت برای یافتن سوالات، و متن‌های مشابه

ظاهرا مقالات زیادی در این خصوص نوشته شدند، در گوگل اسکالر این‌ها را پیدا کردم: اولین مقاله‌ای که می‌خوام بررسی کنم: Evaluation of text document clustering approach based on particle swarm optimization یعنی ارزیابی رهیافت خوشه بندی سند مبتنی بر بهینه‌سازی دسته‌ای…

خوشه بندی مبتنی بر چگالی یا غلظت

مقاله‌ای در این زمینه یافتم که در اینجا قرار می‌دهم. خوشه بندی مبتنی بر چگالی: خوشه‌بندی ارجاع به کار شناسایی گروه‌ها یا خوشه‌ها در یک دیتاست داده می‌شود. در خوشه بندی مبتنی بر غلظت، یک خوشه‌، مجموعه‌ای از اشیای داده‌ای…

الگوریتم خوشه بندی مبتنی بر چگالی

دوباره سراغ الگوریتم مبتنی بر چگالی میرم معادل انگلیسی آن = Density-based clustering من سعی می‌کنم با استفاده از این الگوریتم سوالات مشابه در یک سیستم پرسش و پاسخ خوشه‌بندی کنم. من باید مقالاتی را پیدا کنم که با استفاده از این الگوریتم دست…

خلاصه کردن پاسخ‌ها در جامعه نان فکتوید پرسش و پاسخ

حاشیه: الان که دارم می‌نویسم، تنها انگشتانم دارند تایپ می‌کنند، و تا آنجا که می توان سعی در آن دارم که از مغز و چشمانم کمک نگیرم Summarizing Answers in Non-Factoid Community Question-Answering خلاصه کردن پاسخ‌ها در جامعه نان فکتوید پرسش…

یوزر کلاسترینگ ـ خوشه بندی کاربر

یک دسته‌ای دیگری از خوشه‌بندی‌ها هست که می‌توانه جالب باشه، یعنی خوشه‌بندی کاربر Inferring  User Interests in Streams of Short Texts for User Clustering این یک مقاله ژورنالی آی.اس.آی در سال ۲۰۱۷ است. پس باید خوب باشهه در خط اول…

دوباره شروع با خوشه بندی متن کوتاه

با جستجویی در گوگل اسکالر یک گزینه خوب پیدا کردم Improving Document Clustering for Short Texts by Long Documents via a Dirichlet Multinomial بهبود خوشه‌بندی سند برای متن‌های کوتاه با استفاده از متن‌ها بلند از طریق چند جمله‌ای دریکتل چند…

مقالات دسته اول: مقالات کاربرد خوشه‌بندی متن- راهبرد یافتن

برای یافتن این مقالات باید از کلیدواژه‌های زیر استفاده کنم من باید کلیدواژه‌ها را تولید کنم در این کلیدواژها چند کلمه بای باشند ۱: متن، یا خبر، توییت، سوال ۲: خوشه‌بندی خوب با خوشه‌بندی خبر شروع می‌کنم من باید هدفم…

خوشه‌بندی سند

با جستجویی که با عبارت text clustering در ژورنال سیستم‌های خبره و کاربردها انجام دادم به نتایجی رسیدم که در زیر آوردم: البته قبل از اون باید بگم که این مقالات از اون دسته مقالات هستند که نگفتند چطوری می‌شه…