دوباره شروع با خوشه بندی متن کوتاه

با جستجویی در گوگل اسکالر یک گزینه خوب پیدا کردم

Improving Document Clustering for Short Texts by Long Documents via a Dirichlet Multinomial
بهبود خوشه‌بندی سند برای متن‌های کوتاه با استفاده از متن‌ها بلند از طریق چند جمله‌ای دریکتل

چند تا یافته خوب اول اینکه خوشه‌بندی متن کوتاه به انگلیسی میشه: Short text clustering

برای مثال: document clustering for twitter messages

البته کاربرد آن بر خلاف هدف من: تحلیل نظرات و علایق عموم است.

داکیومنت کلاسترینگ برای کشف ساختار پنهان متون استفاده می‌شود

بیشتر از این روی این مقاله کار نمی‌کنم،

فقط سری به مولف‌هاش می‌زنم

اما اصلا نمیشه سر زد

اما سری به مقالاتی که استناد کرده می‌زنم تا ببینم در زمینه خوشه‌بندی متن کوتاه چه خبره

Semi-supervised model-based document clustering: A comparative study

یک مدل نیمه نظارت برای خوشه‌بندی سند

Comparing
twitter and traditional media using topic models

مقایسه توییتر و رسانه‌های سنتی با استفاده از مدل‌های موضوعی

خوشه‌بندی اسناد از طریق مخلوط مدل فرایند دیریکله با انتخاب ویژگی‌ها: اینم مقاله کنفرانسه

A dirichlet multinomial mixture model-based approach for short text clustering

یک رهیافت مبتنی بر مدل مخلوط  چند جمله‌ای دیریکله برای خوشه‌بندی متن کوتاه: ۲۰۱۴ ، مقاله کنفرانس

Mining hidden concepts: Using short text clustering and wikipedia knowledge

این هم ….

Short text clustering via convolutional neural networks

این هم با شبکه‌های عصبی کانولوشن به خوشه‌بندی متن کوتاه پرداخته

شبکه‌های عصبی زیر سر ونگ است.\

Twitterrank: finding topic-sensitive influential twitterers

extraction andmining of academic social networks

Learning to classify short and sparse text & web with hidden topics from large-scale data collections

hidden topic-based framework toward building applications with short web documents

Transferring topical knowledge from auxiliary long texts for short text clustering

و اما مقالات ژورنالی

Dirichlet process mixture model for document clustering with feature partition

Wordnet improves text document clustering

خوب ظاهرا این مقاله نمی‌تواند زیاد قوی باشه

فرایند دیریکه: یک دسته ازفرایند تصادفی است. این فرایند یک توزیع روی توزیع هاست. به عبارت دیگر یک فرایند دریکله یک توزیع احتمالاتی است که بازه آن خود یک مجموعه از احتمالات است.

دیدگاه‌تان را بنویسید: