پایان نامه جهت اخذ درجه کارشناسی
عنوان کامل: کاربرد داده کاوی در
تجارت الکترونیکدسته:
فناوری اطلاعاتفرمت فایل: فایل Word ورد 2007 یا 2003 (Docx یا Doc) قابل ویرایش
تعداد صفحات: 151
________________________________________________________
مقدمهاز هنگامی که
رایانه در تحلیل و ذخیره سازی داده ها به کار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات (IT) هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافته اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند. امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با
رایانه های موجود است. [3]حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و
تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است. این واقعیت، ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است، چنان که در عصر حاضر گفته می شود اطلاعات طلاست. هم اکنون در هر کشور، سازمان، شرکت و غیره برای امور
بازرگانی، پرسنلی، آموزشی، آماری و غیره پایگاه داده ها ایجاد یا خریداری شده است. به طوری که این پایگاه داده ها برای مدیران، برنامه ریزان، پژوهشگران جهت، تصمیم گیری های راهبردی، تهیه گزارش های مختلف، توصیف وضعیت جاری خود و سایر اهداف می تواند مفید باشد. بسیاری از این داده ها از
نرم افزارهای تجاری، مثل کاربردهای مالی، ERPها، CRMها و web log ها، می آیند. نتیجه این جمع آوری داده ها این می شود که در سازمانها، داده ها غنی ولی دانش ضعیف، است. جمع آوری داده ها، بسیار انبوه می شود و بسرعت اندازه آن افزایش می یابد و استفاده عملی از داده ها را محدود می سازد. [2]داده کاوی استخراج و تحلیل مقدار زیادی داده بمنظور کشف قوانین و الگوهای معنی دار در آنهاست. هدف اصلی داده کاوی، استخراج الگوهایی از داده ها، افزایش ارزش اصلی آنها و انتقال داده ها به صورت دانش است.
داده کاوی، به همراه OLAP، گزارشگری تشکیلات
اقتصادی (Enterprise reporting) و ETL، یک عضو کلیدی در خانواده محصول Business Intelligence (BI)، است. [2Error! Reference source not found.]
حوزه های مختلفی وجود دارد که در آنها حجم بسیاری از داده در پایگاه داده های متمرکز یا توزیع شده ذخیره می شود. برخی از آنها به قرار زیر هستند: [6Error! Reference source not found.]
کتابخانه دیجیتال: یک مجموعه سازماندهی شده از اطلاعات دیجیتال که به صورت متن در پایگاه داده های بزرگی ذخیره می شوند.
آرشیو تصویر: شامل پایگاه داده بزرگی از تصاویر به شکل خام یا فشرده.
اطلاعات زیستی: بدن هر انسانی از 50 تا 100 هزار نوع ژن یا پروتئین مختلف ساخته شده است. اطلاعات زیستی شامل تحلیل و تفسیر این حجم عظیم داده ذخیره شده در پایگاه داده بزرگی از ژنهاست.