پایان نامه جهت اخذ درجه کارشناسی
عنوان کامل: بررسی و داده کاوی در پایگاه داده ها
فرمت فایل: فایل Word ورد 2007 یا 2003 (Docx یا Doc) قابل ویرایش
تعداد صفحات پایان نامه: 77
______________________________________________________
مقدمه
در
دو دهه قبل توانایی های فنی بشر برای تولید و جمع آوری داده ها به سرعت
افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری،
به خدمت گرفتن
کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در
وسایل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستم های سنجش از دور
ماهواره ای، در این تغیرات نقش مهمی دارند. بطور کلی استفاده
همگانی از وب و
اینترنت به عنوان یک سیستم اطلاع رسانی جهانی، ما را مواجه
با حجم زیادی از داده و اطلاعات می کند. این رشد انفجاری در داده های ذخیره
شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده
که به صورت هوشمند به انسان یاری می رسانند تا این حجم زیاد داده را به
اطلاعات و دانش تبدیل کند. داده کاوی بعنوان یک راه حل برای این مسائل مطرح
می باشد. در یک تعریف غیر رسمی، داده کاوی فرآیندی است خودکار برای
استخراج الگوهایی که دانش را بازنمایی می کنند که این دانش به صورت ضمنی در
پایگاه داده های عظیم، انبار داده و دیگر مخازن بزرگ اطلاعات ذخیره شده
است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد. نظیر:
تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار،
شناسایی الگو، سیستم های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات،
محاسبات سرعت بالا و بازنمایی بصری داده. داده کاوی در اواخر دهه 1980
پدیدار گشته، در دهه 1990 گام های بلندی در این شاخه از علم برداشته شده و
انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد. واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. تکامل
تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف، سبب جمع
آوری حجم فراوانی از داده ها شده است. این داده های فراوان باعث ایجاد نیاز
برای ابزارهای قدرتمند برای تحلیل داده ها گشته زیرا در حال حاضر به لحاظ
داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم. ابزارهای داده کاوی
داده ها را آنالیز می کنند و الگوهای داده ای را کشف می کنند که می توان از
آن در کاربردهایی نظیر: تعیین استراتژی برای کسب و کار، پایگاه دانش و
تحقیقات علمی و
پزشکی استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب
ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزشی را به
دانشی ارزشمند تبدیل کنیم.
امروزه نامگذاری داده کاوی بسیار
عمومیت پیدا کرده است، البته اسامی دیگری نیز برای این فرآیند پیشنهاد شده
که بعضا بسیاری متفاوت با واژه داده کاوی است نظیر: استخراج دانش از
پایگاه داده، آنالیز داده/الگو،
باستان شناسی داده و لایروبی داده ها. کشف
دانش در پایگاه داده فرآیند شناسایی درست، ساده، مفید و نهایتا الگوها و
مدل های قابل فهم در داده ها می باشد. داده کاوی مرحله ای از فرآیند کشف
دانش می باشد و شامل الگوریتم های مخصوص داده کاوی است بطوریکه تحت محدودیت
های مؤثر محاسباتی قابل قبول، الگوها و یا مدل ها را در داده کشف می کند.
به بیان ساده تر، داده کاوی به فرآیند استخراج دانش ناشناخته، درست و
بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که داده کاوی گونه ای
از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می
باشد به نحوی که با استخراج آنها در حوزه های تصمیم گیری، پیش بینی،
پیشگویی و تخمین مورد استفاده قرار می گیرد. داده ها اغلب حجیم اما بدون
ارزش می باشند، داده به تنهایی قابل استفاده نیست بلکه دانش نهفته در داده
ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای
ثانویه گفته می شود.