بهینه سازی آنتروپی شبکه های مقیاس آزاد
جهت استحکام در برابر خرابی های تصادفی
چکیده
بسیاری از شبکه ها با توزیع بسیار ناهمگن از پیوندهایشان شناخته می شوند، اینگونه شبکه ها مقیاس آزاد یا مستقل از مقیاس نامیده می شوند که توزیع درجه آن ها از فرمول ck-α p(k) ̴ پیروی میکند. در این مقاله ، استحکام این شبکه ها در مقابل خرابی های تصادفی را با توجه به خصیصه ناهمگونی آنها بررسی میکنیم. آنتروپی توزیع درجه میتواند معیار متوسطی از ناهمگونی یک شبکه باشد. بهینه سازی استحکام شبکه های مقیاس آزاد با میانگنین اتصال ثابت در مقابل خرابی های تصادفی برابر است با بیشینه کردن آنتروپی توزیع درجه ها. با بررسی رابطه بین آنتروپی توزیع درجه ها و توان مقیاس[1] و کمینه اتصال، میتوان به یک طراحی بهینه برای شبکه های مقیاس آزاد مستحکم در مقابل خرابی های تصادفی رسید. در انتها نتیجه میگیریم که آنتروپی توزیع درجه ها یک معیار موثر برای استحکام شبکه ها در مقابل خرابی های تصادفی است.
کلمات کلیدی : شبکه های مقیاس آزاد، نظریه اطلاعات، آنتروپی، خرابیهای تصادفی.
[1] Scaling exponent
. مقدمه
بسیاری از سیستم های پیچیده توسط شبکه ای از تعاملات میان اجزاء آن مشخص می شوند. نشان داده شده است که بسیاری از شبکه ها در الگوهای ارتباطی خود به شدت ناهمگن هستند. با نگاه کردن به توزیع درجه ی p(k) که بیانگر، احتمال داشتن یک گره با k لینک است، به راحتی می توان ناهمگنی را تشخیص داد. اکثر شبکه های پیچیده را می توان با توزیع درجه ck-α p(k) ̴ توصیف کرد، که α ∈ (2,3). این شبکه ها شامل شبکه های اجتماعی (مانند شبکه های فیلم ـ بازیگر، شبکه های استناد علمی و شبکه های همکاری)، اینترنت و وب جهان گستر، شبکه های متابولیک، شبکه های تعامل پروتئین، و غیره هستند [1-5].
از زمانی که آلبرت و همکاران، مسئله ی خرابی های تصادفی و حملات عمدی در شبکه ها را مطرح کردند [6]، علاقه شدیدی برای مطالعه انعطاف پذیری شبکه ها در مقابل خرابی گره ها و حملات عمدی بوجود آمده است [7-12]. ماگونی استراتژی های عمومی حمله در اینترنت را مورد بررسی قرار داده است [13]. مهم است که بفهمیم چطور میتوان شبکههایی طراحی کرد که هم در مقابل خرابی ها و هم در مقابل حملات بصورت بهینه مستحکم باشند.
بسیاری از محققان از نظریه نفوذ [1] برای بررسی این مسئله استفاده می کنند [14،7]. کسر p از گره ها به همراه اتصالاتشان بصورت تصادفی برداشته شدند، یکپارچگی می توانست به خطر بیافتد، برای آلفای بزرگتر از 3 و یک مقدار دقیقی از آستانه تحمل که با pc نشان داده می شود و هنگامی که مقدار p بزرگتر از آن شود شبکه تقسیم میشود به قسمت های کوچکتر که جدا از هم هستند. در زیر آن مقدار آستانه بحرانی، شبکه همچنان متصل است. برای α بین 2 و 3 شبکه ارتجاعی تر است و مقدار pc متمایل به 1 است [7]. تعدادی از پژوهشگران نیز، روی بهینه سازی شبکه جهت استحکام در مقابل هر دو عامل خرابی های تصادفی و حملات، بر اساس نظریه نفوذ، مطالعه میکنند [17-15].
یک ویژگی ساده و ذاتی در شبکه های مقیاس آزاد، توزیع ناهمگون پیوندهایشان است. بعلاوه، ناهمگونی شبکه ارتباط مستقیمی با داشتن حالت ارتجاعی در برابر حملات دارد. بسیاری از شبکه های دنیای واقعی، مقیاس آزاد و مستحکم در برابر خطاهای تصادفی هستند ولی در مقابل حملات هدفدار آسیب پذیرند. ناهمگونی را می توان توسط آنتروپی اندازه گیری کرد [19-18]. سوله و همکاران، از آنتروپی درجه های باقیمانده و اطلاعات متقابل، برای بررسی تعدادی از شبکه ها که ناهمگونی و درهمیدگی متفاوتی داشتند استفاده کردند [19].
در این مقاله، جدا از نظریه نفوذ، دیدگاه دیگری را بررسی می کنیم؛ آنتروپی توزیع درجه گره ها، برای توصیف ناهمگونی شبکه های مقیاس آزاد. برای طراحی بهینه شبکه های مقیاس آزاد، در برابر خرابی های تصادفی، ما استحکام شبکه در برابر خرابی های تصادفی را بیشینه میکنیم در حالی که هزینه را ثابت نگه می داریم، یعنی میانگین تعداد پیوندها به ازای هر گره ثابت می ماند. ما به این نتیجه می رسیم که استحکام شبکه های مقیاس آزاد در مقابل خرابی های تصادفی برابر است با بیشینه کردن آنتروپی توزیع درجه ها. با بهینه کردن آنتروپی توزیع درجه ها به طراحی بهینه ی شبکه های مقیاس آزاد در مقابل خرابی های تصادفی می رسیم.
[1] Percolation theory
طرح توجیهی احداث مولد مقیاس کوچک با قابلیت CHP به ظرفیت 5 مگاوات
دارای فرمت PDF می باشد.
مفصل و با تمام جزئیات – بسیار کامل و مرتب
مناسب برای شروع یک کسب و کار
مناسب جهت ارائه به دانشگاه به عنوان پروژه درسی
نگارش طرح توجیهی یک طرح کسب و کار خوب باید مانند یک داستان، گویا و واضح باشد و باید اهداف کسب و کار را به صورت موجز و کامل بیان کرده و راه رسیدن به آنها را نیز مشخص نماید. بهگونهای که سرمایهگذاران (دستاندرکاران کسب و کار) دقیقاً مفهوم را متوجه شده و خودشان نیز راغب به خواندن و درک دیگر بخشها گردند.
طرح توجیهی در واقع سندی آماده ارائه می باشد که در آن نحوه برآورد سود و زیان و سرمایه ثابت، سرمایه در گردش و نقطه سر به سر، بازدهی سرمایه، دوره برگشت سرمایه و ... بیان خواهد شد.
آناتومی یک موتور جستجو وب فوق متنی در مقیاس وسیع
خلاصه:
در این بخش، به گوگل خواهم پرداخت، یک نمونة اصلی از یک موتور جستجوی در مقیاس وسیع که استفاده وسیعی از ساختار اراده شده در فوق متنی می کند. گوگل برای جستجو و یافتن (Crawl) و شاخص بندی وب به طور مؤثر و تولید نتایج هرچه رضایت بخش تر نسبت به سیستم های موجود طراحی شده است. این نمونه اصلی با پایگاه داده ای متشکل متن و فوق پیوند کامل 24 میلیون صفحه در http://google.standard.edi/ موجود می باشد. مهندسی یک موتور جستجو یک وظیفة چالش آور است. موتورهای جستجو دهها تا صدها میلیون صفحه وب متشکل از تعداد قابل ملاحظه ای موضوعهای متفاوت را شاخص بندی می کنند و پاسخ گوی دهها میلیون پرس و جو به صورت روزانه هستند. بر خلاف اهمیت بالای موتورهای جستجوی برروی وب تحقیقات آکادمیک بسیار اندکی برروی آنها صورت گرفته است (در کشور عزیز ما دقیقاً هیچ مطالعه و تحقیقی صورت نگرفته است). علاوه بر این به دلیل سرعت پیشرفت تکنولوژی وب، امروزه ساخت یک موتور جستجو مسبت به سه سال پیش بسیار متفاوت است. این بخش به بررسی و توصیف عمقی این موتور جستجوی وب در مقیاس وسیع می پردازد. جدای از مشکلات تغییر مقیاس تکنیکهای جستجوی قدیمی داده با این وسعت، چالشهای تکنیکی جدیدی در زمینه استفاده از اطلاعات اضافی ارائه شده در فوق متن برای تولید نتایج جستجوی بوجود آمده است. این بخش به این که چگونه می توان یک سیستم در مقیاس وسیع عملی که بتواند اطلاعات اضافی ارائه شده در فقو متن را استخراج کند را تولید کرد، پاسخ خواهد گفت. همچنین ما به این مشکل که چگونه می توان با مجموعه های فوق متن کنترل نشده (هر کسی می تواند هر چه خواست بنیسد) کنار آمد، نیز دقت خواهیم کرد.
معرفی
وب چالشهای جدیدی برای بازیابی اطلاعات ایجاد می کند. حجم اطلاعات موجود برروی وب به سرعت در حال افزایش است و به همان نسبت تعداد کاربران جدید که در جستجوی وب بی تجربه هستند افزایش می یابد. مردمی که احتمالاً وب را از طریق گراف پیوند آن مرور می کنند، اغلب کار خود را با شاخصهای ذخیره شده با کیفیت بالای انسانی مانند یاهو! یا موتورهای جستجو شروع می کنند. لیتهاس ذخیره و نگهداری شده توسط انسانی موضوعهای معروف را به طور موثری پوشش می دهند اما شخصی بودن، گران و پرهزینه بودن برای ساخت و نگهداری، کندی در پیشرفت و ناتوانی در پوشش موضوعهای مبهم و پیچیده از عیبتهای عمده آنها محسوب می شود.
موتورهای جستجوی وب – گسترش یافتن: 1994-2001
تکنولوژی موتورهای جستجو باید به میزان زیادی تغییر پیدا می کرد تا بتواند هماهنگی خود را با گسترش وب حفظ کند. در 1994، یکی از اولین موتورهای جستجوی وب یعمی کرم وب گسترة جهانی (WWWW) شاخصی از000/110 صفحه وب و اسناد در دسترس وب داشت. از نوامبر 1998 موتورهای جستجوی برتر ادعای شاخص بندی از 2 میلیون (WebCrawler) تا 100 میلیون (از (Search Engine Watch صفحه وب و سند را داشتند. قابل پیش بینی است که تا سال 2001 یک شاخص جامع از وب شامل بیش از دو میلیارد سند باشد. در همان زمان تعداد پرس و جوهایی که موتورهای جستجو اداره می کنند به طور شگفت آوری افزایش می یابد.
گوگل: تغییر دادن وب
این موتور جستجوایی که در سطح وب امروز باشد چالشهای بسیاری را پدید می آورد. تکنولوژی جستجو و یافتن سریع برای جمع آوری و به روز رسانی سندهای وب لازمی می باشد. فضای ذخیره سازی بهید به طور کارآمدی برای ذخیره شاخصها و به طور اختیاری خود سندها بکار گرفته شود. سیستم شاخص بندی باید صدها گیگا بایت داده را به طور کارآمد پردازش کند. پرس و جحوها باید به سرعت اداره شوند (با نرح صدها تا هزاران پرس و جو در ثانیه).
تحقیقات موتور جستجوی آکادمیک
جدای از گسترش بسیار زیاد، وب به طور افزایشی در طول زمان حالت تجاری به خود گرفته است، در سال 1993، %5/1 از سرویس دهندگان وب بر دامنه .com قرار داشتند. این مقدار در سال 1998 به %60 رسید. در همان زمان، موتورهای جستجو از حوزة آکادمیک به تجاری کوچ کردند. تا امروز اغلب پیشرفتهای موتورهای جستجو در شرکتهایی صورت می گیرد که حداقل میزان انتشار جزئیات را دارند. این باعث می شود تکنولوژی موتور جستجو تا حد زیادی مثل جادوی سیاه مخفی باقی بماند و گرایش تبلیغاتی پیدا کند. با گکوگل، سعی شده است تا پیشرفت و فهم بیشتری در قلمرو آکادمیک صورت گیرد.
با کمک ابزارهای معتبر و مطرح در حوزه نوجوانان همچون پرسشنامه خطرپذیری نوجوانان2 ARQ (گالونه، مور، موس و بوید، 2000) و پرسشنامه سیستم کنترل رفتار پرخطر جوانان3 YRBSS (برنر، کان، کینچن، گرامبام، والن4 و همکاران، 2004) و در نظر گرفتن شرایط فرهنگی و محدودیت¬های اجتماعی جامعه ایرانی، مقیاس خطرپذیری نوجوانان ایرانی توسط زاده¬محمدی و احمد آبادی (1388) ساخته شد.
این مقیاس شامل 39 گویه برای سنجش آسیب¬پذیری نوجوانان در مقابل 7 دسته رفتارهای پرخطر (رانندگی خطرناک، خشونت، سیگار کشیدن، مصرف مواد مخدر، مصرف الکل، گرایش به جنس مخالف و روابط جنسی) است که پاسخگویان موافقت و مخالفت خود را با این گویه¬ها در یک مقیاس 5 گزینه¬ای از کاملا موافق (5) تا کاملا مخالف (1) بیان می¬کنند.
آزمون کفایت نمونه¬گیری کایزر- مایر- اولکین (KMO) برابر با 952/0 و در سطح بسیار مطلوب و رضایت-بخش بود و آزمون کرویت بارتلت از نظر آماری معنادار بود (زاده¬محمدی و احمدآبادی، 1388).
با توجه به شرایط اجتماعی و فرهنگی جامعه ایرانی و شیوع گسترده برخی از رفتارهای پرخطر که در مقیاس خطرپذیری نوجوانان ایرانی (IARS) ذکر نشده است، زیر مقیاس قلیان کشیدن با 7 گویه توسط کُر (1392) به مقیاس اصلی اضافه گردید. و بدین ترتیب تعداد کل گویه¬های مقیاس به 46 گویه افزایش یافت.
روایی محتوای گویه¬های افزوده شده توسط جمعی از اساتید مشاوره و روانشناسی مورد تایید قرار گرفته است و ضریب آلفای 92/0 نشان دهنده همسانی درونی بالای زیر مقیاس قلیان گشیدن است. نتایج آزمون کفایت نمونه¬گیری کایزر- مایر- اولکین (KMO) برابر با 931/0 و در سطح بسیار مطلوب بود و آزمون کرویت بارتلت (143/13707) از نظر آماری معنادار بود.
مقدار آلفای کرونباخ این برای پرسشنامه برای مقیاس رانندگی خطرناک 71/0، خشونت 74/0، سیگار کشیدن 92/0، مصرف مواد مخدر 88/0، مصرف الکل 90/0، گرایش به جنس مخالف 84/0، روابط جنسی 84/0 و کل مقیاس 95/0 می¬باشد (کُر، 1392).