دانلود پاورپوينت داده کاوی الگو های تکرار شونده در جریان داده ها جهت رشته مهندسی نرم افزار در قالب 40 اسلايد و با فرمت pptx بصورت کامل و جامع و با قابليت ويرايش
در جريان داده تعدادی يا همه داده های ورودی که بايد روی آنها عمليات انجام شود روی ديسک يا حافظه اصلی قرار ندارند و بيشتر به صورت جريان داده پيوسته می رسند .
جريان داده ها از داده های ذخيره شده در موارد زير متفاوت اند :
عناصر داده ها به صورت بر خط می رسند .
سيستم هيچ گونه کنترلی روی ترتيب عناصر دادهای ( روی عناصر جريان يا جريانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .
جريانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .
يک عنصر از جريان داده پس از پردازش يا ناديده در نظر گرفته می شود يا آرشيو می شود .
دادهکاوی استخراج اطلاعات مفيد و دانش از حجم زياد داده ها است .
تکنيک هايی دادهکاوی :
تحليل قواعد وابستگی : کشف قواعد وابستگی است که هر قاعده وابستگی به صورت جفت صفت- مقدار هايی است که اغلب با هم در يک مجموعه داده اتفاق می افتند .
کلاسهبندی : فرايند يافتن مجموعه مدلهايی است که کلاس های داده را توصيف و مشخص میکنند تا بدين وسيله بتوان کلاس اشيايی را که نامشخص است مشخص کرد .
تحليل خوشه ها : اشيا بر اساس قاعده " زياد کردن شباهت بين عناصر کلاس و کم کردن شباهت بين کلاس ها " ، اشيا را به خوشه هايی تقسيم می کند . اشيا داده ای موجود در يک خوشه بيشترين شباهت را با هم دارند و با اشيا ساير خوشه ها بسيار متفاوت هستند.
دادهکاوی جريان داده ها يک فرايند بلادرنگ استخراج الگوهای جالب توجه از جريان داده ها است .
برای مثال ممکن است بخواهيم ورود به حريم شبکه کامپيوتری را بر اساس جريان غير عادی پيام ها شناسايی بکنيم که از طريق مقايسه الگوهای تکرارشونده فعلی با يک زمان قبلی ، قابل کشف است .
فهرست مطالب
جریان داده
داده کاوی
داده کاوی روی جریان داده ها
الگوهای تکرار شونده در پایگاه داده
لگوهای تکرار شونده
الگوریتم Apriori
نحوه تولید کاندید
الگوریتم Lossy Counting
ساختن درخت الگوهای تکرارشونده از یک پایگاه داده تراکنشی
پنجره زمانی
الگوهای تکرارشونده و پنجره های زمانی
تعریف مساله
استفاده از تقریب
هرس کردن دم
الگوریتم FP-Stream
منابع