طراحی سیستمهای مدرن اطلاعاتی بازشناسی خودکار الگوها
فهرست مطالب
فصل اول- مقدمه ۳
۱-۱- شناسایی الگو ۳
شکل۱-۱-نمودار بلوکی یک سیستم شناسایی الگو ۴
۱-۲- کاربردهای بازشناسی الگو ۴
۱-۳- طرح پژوهش ۵
فصل دوم- مروری بر سیتمهای OCR 7
2-1-بخشهای مختلف سیستمهای ocr 7
2-1-1- بازشناسی نوری حروف ۷
۲-۱-۴- برخی ویژگی های متون چاپی فارسی از دیدگاه پردازش رایانه ای ۱۰
شکل ۲-۱-۴ . برخی از ویژگی های نگارش زبان فارسی :الف) کلمه خورشید از سه زیرکلمه تشکیل شده؛ ب) چهار شکل مختلف حرف «ع» با توجه به موقعیت آن در کلمه، ج) همپوشانی دو حرف «ح» و «ک» در کلمه «حکم»؛ د) اتصال حروف «ک» و «ا» در دو محل؛ ه)حروف متفاوت با بدنه مشابه؛ و)کشیدگی حرف«ب» در کلمه «با». ۱۱
۲-۱-۵-انواع سیستم های « اُسی آر » از لحاظ نوع الگوی ورودی ۱۲
۲-۱-۶- معرفی بخش های مختلف یک سیستم « اُسی آر » ۱۳
شکل ۲-۱-۶ نمودار بلوکی دیاگرام یک سیستم « اُسی آر » ۱۳
کاهش نویز: ۱۴
شکل ۲-۱-۶-۱ تصویر یک صفحه که کج اسکن شده است ۱۵
ب. نرمالیزه کردن اریب شدگی : ۱۶
د. هموارسازی کانتور: ۱۶
شکل ۲-۱-۶-۲ عملیات نازک سازی بر روی یک تصویر متنی نمونه ۱۷
شکل ۲-۱-۶-۳ قطعه بندی یک کلمه به حروف ۱۹
۲-۱-۶-۴- طبقه بندی و بازشناسی(با یک یا چند طبقه بندی کننده) ۲۲
۲-۱-۶-۵- به کارگیری اطلاعات جانبی(پس پردازش) ۲۲
۲-۲- روشهای مختلف در حوزه بازشناسی اسناد ۲۴
۲-۲-۱- تبدیل سراسری(بسط سری) ۲۴
۱-۱-۲-۲- تبدیلات فوریه(توصیف کننده های فوریه) ۲۴
۲-۱-۲-۲- موجکها ۲۵
شکل ۲-۲-۱-۲ ۲۷
۳-۱-۲-۲- تبدیل گابور ۲۸
شکل ۳-۱-۲-۲ ۲۹
۴-۱-۲-۲- ممانها(گشتاورها) ۳۱
۵-۱-۲-۲ – بسط کارهونن لوئو( K-L ) 32
شکل ۲-۲-۲ ویژگی های جهتی کانتور و ویژگی های نقاط خمش را نشان می دهد. ۳۳
شکل ۲-۲-۲ ۳۳
۳-۲-۲- ویژگیهای هندسی و توپولوژیکی ۳۴
الف – ویژگیهای توپولوژیکی ۳۴
شکل ۲-۲-۳ ۳۵
ب – ویژگیهای هندسی ۳۵
ج – کدگذاری ۳۶
فصل سوم- تکنیک آنالیز اجزای اصلی ۳۷
۱-۳- روشهای کاهش ابعاد ۳۷
۳-۱-۱- روشهای مبتنی بر استخراج ویژگی ۳۸
۲-۳ -تکنیک آنالیز اجزای اصلی(PCA) 39
شکل ۳-۱ انتخاب محورهای جدید برای داده های دو بعدی ۴۰
۱-۲-۳ مفاهیم مقدماتی مورد نیاز در PCA 40
مفاهیم جبر ماتریسها ۴۲
مرحله ۲- کم کردن میانگین از داده ها ۴۳
مرحله ۳- محاسبه ی ماتریس کواریانس ۴۳
مرحله ۵- انتخاب مؤلفه ها و ساختن Feature Vector 45
مرحله ۶- بدست آوردن داده های جدید ۴۶
شکل ۳-۴ داده های بدست آمده از تبدیل PCA با انتخاب مهمترین بردار ویژگی ۴۶
شکل ۳-۵ داده های بازیابی شده از تبدیل PCA با انتخاب مهمترین بردار ویژگی ۴۷
فصل چهارم- شبکه عصبی ۴۸
۱-۴- شبکه عصبی چیست؟ ۴۸
۲-۴- چرا از شبکه های عصبی استفاده می کنیم؟ ۵۰
۳-۴- شبکه عصبی MLP 51
1-3-4- قاعده فراگیری MLP 51
الگوریتم پرسپترون چند لایه ای ۵۲
شکل۴-۸ توانایی پرسپترون ها را در تفکیک فضاهای دلخواه نشان می دهد. ۵۸
برخی تواناییها و ضعفهای شبکه های عصبی ۶۰
تحمل نقص ۶۱
شکل ۴-۱۰ ۶۱
مشکلات آموزش ۶۱
کاهش ضریب بهره ۶۲
افزایش تعداد گره های داخلی ۶۲
عبارت گشتاور ۶۲
سایر مشکلات آموزش ۶۳
فصل پنجم – پیاده سازی یک نرم افزار تشخیص خودکار اعداد فارسی ۶۴
شکل۵-۱-۱ ۶۵
۵-۲- مرحله آموزش: ۶۵
۵-۲-۱- چند نکته در رابطه با آموزس شبکه: ۶۵
۵-۴-نتایج ۶۸
فصل ششم- مراجع ۶۹
فصل اول- مقدمه
پیدایش علوم و فنون جدید، جوامع بشری را با شکلهای مختلفی از اطلاعات روبرو نموده است. سطح توسعة یک جامعه را می توان با مقدار اطلاعات و دانش تولید شده در آن ارزیابی کرد. تولید فزایندة اطلاعات به شکلهای مختلف صورت می گیرد و با درجات متفاوتی از پیچیدگی همراه میباشد. در نتیجه نیاز به سیستمهای پردازش اطلاعات بصورت روزافزون افزایش می یابد. یکی از مسائل مهم در طراحی سیستمهای مدرن اطلاعاتی، بازشناسی خودکار الگوها است.
۱-۱- شناسایی الگو
شناسایی الگو، شاخه ای از هوش مصنوعی است که با طبقه بندی و توصیف مشاهدات سروکار دارد.شناسایی الگو به ما کمک میکند داده ها (الگوها) را با تکیه بر دانش قبلی یا اطلاعات آماری استخراج شده از الگوها، طبقه بندی نماییم. الگوهایی که می بایست طبقه بندی شوند، معمولاً گروهی از سنجش ها یامشاهدات هستند که مجموعه نقاطی را در یک فضای چند بعدی مناسب تعریف می نمایند.یک سیستم شناسایی الگوی کامل متشکل است از یک حسگر ،که مشاهداتی را که می بایست توصیف یا طبقه بندی شوند جمع آوری می نماید، یک سازوکار برای استخراج ویژگی ها که اطلاعات عددی یا نمادین را از مشاهدات، محاسبه می کند، (این اطلاعات عددی را با یک بردار بنام بردار ویژگیها نمایش می دهند)؛ ویک نظام طبقه بندی یا توصیف که وظیفه اصلی طبقه بندی یا توصیف الگوها را با تکیه بر ویژگی های استخراج شده عهده داراست.
شکل ۱-۱ نمودار بلوکی یک سیستم شناسایی الگو را نشان می دهد. همانطوری که از پیکان های برگشتی مشخص است، این بلوک ها لزوماً مستقل نیستند و بسته به نتایج حاصله گاهی لازم است که
بلوک های اولیه مجدداً طراحی گردند تا راندمان کلی سیستم بهبود یابد.