سای هاب

ذخیره‌گاه مقالات دزدیده شده سای‌هاب به اندازه‌ای بزرگ است که ژورنال‌های اشتراکی به فنا می‌روند

شکی وجود ندارد که سای‌هاب، منبع آنلاینی از مقالات پژوهشی سرقت شده، شگفت آورانه محبوب است. (بررسی آخر سال از اینکه چه کسانی مقالات سای هاب را دانلود می‌کنند را ببینید.) اما این منبع چه قدر بزرگ است؟ این سوالی است که پاسخش را دانیل هیمیلستین، دانشمند بیوداده در دانشگاه پنسلوانیا پس از ارزیابی سای هاب می‌دهد.

هیمیلستین و همکارانش مقاله پیش‌چاپی در سایت ژورنال پیرجی در ۲۰ ژولای منتشر کردند، مقاله‌‌ی آنها نشان می‌دهد که سای‌هاب می‌تواند فورا دسترسی به بیش از دو سوم مقالات علمی را میسر بسازد، مقداری که هیمیلستین می‌گوید «حتی بالاتر»از آنچه که پیش‌بینی می‌شده است. برای مقالات پژوهشی محافظت شده با یک درگاه پرداخت، این مطالعه دریافت که سای‌هاب حتی عالی‌تر است و دسترسی به ۸۵ درصد مقالات منتشر شده در ژورنال‌های اشتراکی را میسر می‌سازد. برای بیشتر این ناشران این درصد حتی بیش از ۹۷ درصد فهرست مقالات ژورنال‌های آنها است که در سرور‌های سای‌‌هاب ذخیره شده است. یعنی اینکه عملا مقالات این ناشران از سای‌هاب به رایگان در دسترس است.

یعنی اینکه سای‌هاب تقریبا هر مقاله‌ای که شخصی بخواهد آن را بخواند را در دسترسش به رایگان قرار می‌دهد، آیا این وبسایت می‌تواند موجب واژگون شدن نشر سنتی مقالات شود؟ در گفتگوی که ساینس‌ اینسایدر با هیمیلستین داشت به این نتیجه رسیده شد که نتایج این مطالعه می‌تواند به عنوان «شروع پایانی» برای پژوهش‌های پرداختی باشد. این مصاحبه برای خلاصه‌ و واضح‌تر شدن ویرایش شده است.

چه چیزی موجب شد تا به بررسی اندازه پوشش سای‌هاب بپردازید؟

همه‌ٔ این‌ها زمانی شروع شد که سای‌هاب لیست در ۱۹ مارس لیست تمام مقالاتی در ذخیره‌گاه‌هایش داشت را توییت کرد. با خود اندیشیدم: «وووو، می‌توانیم در مورد عملکرد و پوشش موضوعی آن یاد بگیریم، کاری که قبلا نمی‌توانستیم.» بیشتر عموم می‌دانند که سای‌هاب دسترسی به تعدادی از مقالات پژوهشی را فرآهم ساخته است. اما سوالی اینجا بود و آن اینکه چقدر؟

چه رهیافتی برای محاسبه این اندازه‌گیری به کار گرفید؟

گام اصلی تصور این است که چه تعداد مقالات علمی وجود دارند. برای این کار ما از کروس‌رف که پایگاه‌ داده‌ای از شناسه‌گرهای ژورنال‌ها داشت استفاده کردیم. البته این تنها پایگاه نیست، اما رایج‌ترین برای نشریات علمی است. بعد از تعدادی اصلاحات، ما لیستی از ۸۱.۶ میلیون مقاله به کامپایل کردیم. این گام مهم بود چون به ما مشتق‌کننده‌ای برای معادله‌ مان فراهم می‌آورد. قبلا افرادی که پوشش موضوعی سای‌هاب را برسی می‌کردند واقعا این گام  را به درستی برای دیدن اینکه چه درصدی از نوشته‌ها در سای‌هاب وجود دارد انجام نداده بودند، چون ابتدا نیاز است که شما تعداد کل را بدانید.

عمده‌ یافته‌‌های مطالعه شما چه بود؟

ساده‌ترین نتیجه این بود که سای‌هاب حاوی ۶۹ درصد تمام مقالات علمی است. ما همچنین دریافتیم که این سایت بیشتر روی  مقالات ژورنال‌های با ضریب تاثیر بالا و ناشرانی که دسترسی به مقالات آنها بسته شده است تمرکز دارد. من فکر می‌کنم که ژورنال‌های الزویر و انجمن شیمی آمریکا از ژورنال‌های مورد علاقه سای‌هاب هستند که پوشش بالایی در سای‌هاب دارند. شاید آنها فهمیده‌اند که اساسا تمام محصولاتشان در سای‌هاب است. بسیاری از ژورنال‌هایی تمام مقاله‌هایشان روی سای‌هاب وجود داشت.

آن ۳۱ درصدی‌های چه کسانی هستند؟

تازه چون چون یک مقاله در دیتابیس سای‌هاب نیست، به این معنا نیست که نمی‌توانید به آن دسترسی داشته باشید. ما تخمین می‌زنیم که سای‌هاب قادر است ۹۹ درصد اوقات به کامل کردن درخواست‌ها پاسخ دهد، که نشان می‌دهد این ۳۱ درصد مقالاتی که توسط سای‌هاب پوشش داده نشده‌اند چیزهایی هستند که افراد آن را درخواست نمی‌دهند..

آیا شما پوشش شاخه‌های علمی در سای‌هاب را نیز بررسی کردید؟

بله. بین رشته‌ها تفاوت‌هایی وجود داشت، اما من فکر می‌کنم که احتمالا کمتر فردی باشد که نیاز به خریدن مقالات پیدا بکند. بالاترین پوشش را شیمی با ۹۳ درصد داشت، و پس از آن علوم کامپیوتر با ۷۶ درصد بود. این نتایج می تواند بخش‌های انتشارات را به زمینه‌هایشان متصل کند، ما دریاتیم که ژورنال‌های دسترسی محدود پوشش بیشتری نسبت به دسترسی آزاد دارند.

دیدگاه‌تان را بنویسید: