سمینار تجزیه و تحلیل همبستگی و رگرسیون معیار های عملکردی و معیارهای آنالیز شبکه اجتماعی
چکیده
در این مطالعه،ما یک مدل نظری مبتنی بر نظریه های شبکه های اجتماعی و روش های تحلیلی برای بررسی همکاری شبکه های دانشمندان ( تالیف مشترک) ایجاد نمودیم.ما بااستفاده از اقدامات تجزیه و تحلیل شبکه اجتماعی (SNA) ( بعنوان مثال. مرکزیت درجه نرمال، مرکزیت نزدیکی نرمال،مرکزیت میانوندینرمال،مرکزیت بردارهای ویژه نرمال،میانگین استحکام روابط، و بهره وری) تاثیر شبکه های اجتماعی را بر (مبتنی برCitation) عملکرد دانشمندان در یک نظم داده شده (برای مثال سیستم های اطلاعاتی) بررسی می کنیم.نتایج حاصله از آنالیز اماری ما بااستفاده از یک مدل رگرسیون پواسون ،نشان می دهد که عملکرد تحقیقاتی دانشمندان (شاخص-g) بطور مثبت با چهار اقدام SNAبه استثنایمرکزیت میانوندینرمال و مرکزیت نزدیکی نرمال، در ارتباط است.علاوه براین، نشان می دهد که تنها مرکزیت درجه نرمال،بهره وری، و میانگین استحکام روابط ، یک اثرمثبت قابل ملاحظه، بر روی شاخص g (بعنوان یک اقدام عملکردی) دارد.مرکزیت بردارهای ویژه نرمال تاثیر منفی قابل توجهی بر روی شاخص g دارند. براساس این نتایج،ما می توانیم بگوییم که دانشمندان، کسانیکه با محققان جداگانه ی بسیاری در ارتباط هستند،دارای عملکرد مبتنی بر Citation بهتری (شاخص g ) نسبت به محققان با ارتباطات کمتر می باشند.علاوه براین، دانشمندان با نقاط قوت نسبتا زیاد (برای مثال تکرار مشارکت در تالیف) عملکرد تحقیقی بهتری نسبت به آنها که نقطه قوت کمتری دارند ارائه می دهند . (برای مثال، یک مولف تنها با چندی از دانشمندانهمکاری می کند). نتایج مربوط به بهره وری نشان می دهد که دانشمندانی که یک ارتباط همکاری قوی با تنها یک نویسنده از یک گروه مرتبط با نویسندگان را نگهداشته اند، عملکرد اجرایی بهتری نسبت به دیگر دانشمندان ، که ارتباطات بسیاری با گروه مشابه نویسندگان مرتبط داشته اند ،را دارا می باشند.تاثیر منفی بردارهای ویژه نرمال نشان می دهد که دانشمندان باید با دانش آموزان بسیاری بجای دانشمندان حرفه ای کار کنند. در نتیجه، می توانیم این رابیان کنیم که شبکه های اجتماعی حرفه ای دانشمندان می تواند برای پیش بینی عملکرد آینده محققان استفاد شوند .
مقدمه
ارزیابی عملکرد یک تابع اجتناب ناپذیر از مدیریت در هر سطحمی باشد. ان موجب پیشرفت و توسعه می باشد. درنتیجه، در یک محیط تحقیقاتی (مانند دانشگاه ها و موسسات تحقیقاتی) ، همچنین باید یک ارزیابی عملکرد برای دانشگاهیان وجود داشته باشد.ارزیابی محققان، که باید براساس خروجی محقق (مثلا بهره وری) باشد،نه تنها برای ارزیابی عملکرد بلکه همچنین برای استخدام در دانشکده،تخصیص بودجه دولتی، و برای رسیدن به درجه اعتبار بالا در جامعه پژوهشی مورد نیاز است.اعتبار سازمانهای پژوهشی بطور غیرمستقیم بر رفاه جامعه تاثیر می گذارد، زیرا که اعتبار بالا خریدهای خارجی ، سرمایه گذاران خارجی و دانش آموزان واجد شرایط را از سراسر دنیا به خود جذب می نماید.
بنابراین، نیازی اساسی برای ارزیابی خروجی دانشگاه ها و خروجی محققان وجود دارد. باتوجه به بودجه های دولتی ، مثلا تخصیص بودجه برای یک پروژه خاص، انتخاب مناسب ترین دانشمندان با هدف بیشترین خروجی ،صرفه جویی در هزینه، و بهره برداری از منابع بسیار مهم است. بنابراین، مشکل اصلی شناسایی مناسب ترین دانشمندانی که می توانند به اهداف دست یابند می باشد ( جیانگ،2008).
بمنظور ارزیابی عملکرد دانشمندان،بسیاری از مطالعات نشان می دهند که فعالیت های انتشاراتی دانشمندان معدودی بعنوان یک معیار خوب برای عملکرد دانشمندان می باشد. ایده کلی این بود که یک دانشمند ارزش بالایی در یک جامعه تحقیقاتی بدست می آورد، اگرانتشاراتآن محقق مستند شده و ذکر گردد.تعدادی از استنادها تنها واجد شرایط برای منتشر شدن هستند. (Lehmann،Jackson، و Lautrup ،2006 ). Hirsch(2005)
پروژه خطای اندازه گیری در رگرسیون
قسمتی از متن:
مقدمه
در اکثر آزمایشاتی که در سراسر دنیا صورت می گیرد، مشاهدات علمی مقدار واقعی نبوده بلکه مقادیر به دست آمده همراه با یک نوع خطا است. در علوم آماری چنین خطایی به خطای اندازه گیری[1] معروف است. به خصوص در علومی مانند علوم آموزشی، علوم زیستی خطای اندازه گیری غیرقابل انکار است. به عنوان مثال در تعیین سطح نمرات یک کلاس یا تعیین ضریب هوشی افراد بسته به موقعیت زمانی، نوع سؤالات و وضعیت روحی افراد چنین خطایی وجود دارد. به عنوان مثال دیگر، در اندازه گیری فشار و کلسترول خون افراد، نمی توان به صورت دقیق مقادیر واقعی آن ها را اندازه گیری کرد. به عبارتی دیگر در بسیاری از آزمایشات در علوم مختلف، اگر اندازه گیری بر روی یک فرد تکرار شود، انتظار نمی رود همیشه به نتایج یکسانی دست پیدا کرد. این نوع خطا ممکن است به دلایل مختلفی از جمله دقت پایین دستگاه اندازه گیری، شرایط نامناسب زمان آزمایش و اشتباه در ثبت اطلاعات رخ دهد. چنین خطایی باعث بروز مشکلاتی در تحلیل داده ها شده و می تواند اعتبار نتایج به دست آمده را زیر سوال ببرد و حتی نادیده گرفتن چنین خطایی معمولا باعث نتیجه های گمراه کننده ای می شود (دگرسی و فولر،1972). از نقطه نظر تاریخی هنگامی که فولر (1987) قصد داشت رابطه رگرسیونی بین ذرت به دست آمده و نیتروژن موجود در خاک را برازش دهد، متوجه این نوع خطا شد. ایشان بعد از آزمایشات دقیق متوجه شد که نیتروژن موجود در خاک را نتوانسته به صورت دقیق اندازه گیری کند. سپس نشان داد که با نادیده گرفتن خطای اندازه گیری پارامترهای مدل های رگرسیونی اریب برآورد شده و در نتیجه باعث برازش مدل های گمراه کننده شده است. به علاوه ایشان مطالعات گسترده ای روی مدل های رگرسیونی ساده که متغیرهای تبیینی یا متغیر پاسخ یا هردوی آن ها آمیخته به خطای اندازه گیری است انجام داد و ثابت کرد که در صورت معلوم بودن نرخ قابلیت اعتماد[2]، می توان پارامترهای مدل را با دقت زیادی برآورد کرد و مدل دقیق تری را برازش داد. حاصل تلاش های وی منجر به نگارش کتاب جامع ای به نام مدل های خطای اندازه گیری[3] شد. البته موضوع خطای اندازه گیری تنها محدود به مدل های رگرسیونی خطی نشده بلکه در مدل های مختلف از جمله مدل های رگرسیونی غیرخطی (کارول و همکاران،2006) و بد رده بندی[4] (گلداستاین و همکاران، 2008) نیز گسترش یافته است.
به منظور مطالعه دقیق تاثیر خطای اندازه گیری بر نتایج حاصل از مدل های رگرسیونی، در این فصل به مفاهیم اولیه خطای اندازه گیری پرداخته می شود.
2.1 خطای اندازه گیری در رگرسیون خطی ساده
برای ارائه تصویر روشنی از موضوع خطای اندازه گیری و تأثیر آن در برازش یک مدل و برآورد پارامترهای آن، مدل رگرسیونی خطی ساده مورد مطالعه قرار داده می شود. بدین منظور مدل رگرسیونی خطی ساده
(1.2.1)
را در نظر بگیرید، که در آن خطاهای مدل هستند که دارای توزیع نرمال با میانگین صفر و واریانس ثابت می باشند و متغیر پاسخ و متغیر پیشگوی رگرسیونی است واضح است که و و پارامترهای مدل هستند. در مدل (1.2.1) ها ترکیبی از انواع خطاها از جمله خطای رگرسیونی لحاظ نمی شود. به طور دقیق تر ها ترکیبی از انواع خطاها از جمله خطای اندازه گیری، خطای لحاظ نکردن متغیرهای تبیینی دیگر در مدل و ... است که نادیده گرفتن هریک از این خطاها باعث برازش مدل های غیرواقعی می شود. فرض معمول در رگرسیون این است که ها مقادیر کنترل شده معلوم هستند. اما برای مدل (1.2.1) فرض می شود مقادیر دقیق ها معلوم نیستند. به عبارتی دیگر قبول می کنیم که در این مدل ها مقادیر واقعی هستند لیکن به دلیل آلودگی با خطای اندازه گیری آن ها را مشاهده نکردیم. چنین متغیرهایی در آمار به متغیرهای پنهان[5] معروف اند. آنگاه خطای اندازه گیری به صورت اختلاف مقادیر مشاهده شده و متغیر پنهان تعریف می شود. از این رو می توان نوشت:
[1] Measurement error
[2] Reliability rate
[3] Measurement error models
[4] Misclassification
[5] Latent variables