60,000 تومان
ویژگی های دوره
داده کاوی یکی از تخصص های به روز و مورد نیاز تقریبا تمام کسب و کارهای داده محور است. داده کاوی فرآیندی است که طی آن دیتای خام و بی مفهوم به اطلاعات مفید و با ارزشی برای تصمیم گیری و تعیین اهداف استراتژیک مشخص سازمانی تبدیل می شوند.
داده کاوی یا دیتا ماینینگ در واقع علمی میان رشته ای است که علوم کامپیوتر، هوش مصنوعی، یادگیری ماشین، ریاضی و آمار را دربر می گیرد. با ساخت فرآیند داده کاوی، می توان دیتاهای حجیم و پیچیده سازمان ها و مؤسسات تحقیقاتی را کشف و الگوهای پنهان آن را تحلیل نمود.
به طور کلی میتوان داده را برابر با طلا دانست. هر چقدر داده های موجود در پایگاه داده یک شرکت افزایش پیدا کند، سرمایه شرکت نیز بیشتر می شود. حال، برای تبدیل کردن این داده های حجیم و تمیز نشده به اطلاعات مفید و گزارشات مناسب برای تصمیم گیری، نیاز است تا از داده کاوی استفاده کرد تا با کشف الگوهای پنهان از پردازش میلیون ها داده، نتایج شگفت انگیزی را بدست آورد و تحلیل کرد.
کاربردهای داده کاوی
- حوزه بازرگانی (بازاریابی مستقیم، بخش بندی بازار، رتبه بندی اعتباری و …)
- پزشکی (تشخیص سرطان و بازاریابی دارو)، نفت و گاز (حوزه استخراج و بهره برداری)
- بانک و بیمه (کشف تخلف و کلاهبرداری، مدیریت ریسک، افزایش صدور بیمه نامه و …)
- و…
یادگیری ماشین (Machine learning) را نیز می توان فرآیند بکارگیری هوش در سیستم یا ماشین بدون برنامه نویسی آشکار (explicit programming) تعریف کرد.
در این دوره چه مباحثی آموزش داده شده است؟
در این دوره، به آموزش جامع مفاهیم داده کاوی پرداخته می شود و به طور کامل، مفاهیم مربوط با داده کاوی و یادگیری ماشینی را یاد خواهید گرفت.
سرفصل های دوره آموزش جامع مبانی و مفاهیم داده کاوی و یادگیری ماشین
فصل اول: معرفی دوره (آشنایی با مفاهیم اولیه)
- تعریف داده کاوی (data mining)
- اهمیت داده کاوی
- کاربرد داده کاوی در صنایع و کسب و کارهای مختلف
- تعریف فرآیند داده کاوی
- تعریف یادگیری ماشین (machine learning) و کاربرد آن در داده کاوی
- تفاوت میان داده کاوی و علم داده (data science)
- هدف دوره
فصل دوم: جبر خطی در داده کاوی و یادگیری ماشین
- تعریف جبر خطی
- اهمیت جبر خطی در داده کاوی
- بردارها و محاسبات برداری
- نرم برداری
- ماتریسها و محاسبات ماتریس
فصل سوم: آشنایی با انواع دیتا
- دیتای ساختار یافته (Structured data)
- دیتای نیمه ساختار یافته (Semi-structured data)
- دیتای بدون ساختار (Unstructured data)
فصل چهارم: تحلیل آماری و رسم نمودار در داده کاوی و یادگیری ماشین
- آشنایی با انواع نمودار (پیاده سازی در پایتون)
- تعریف آمار و علم آمار
- ابزارهای مورد استفاده برای تهیه گزارش آماری
- آشنایی با شاخصهای مرکزی و پراکندگی
- متغیرها
- همبستگی و ماتریس همبستگی
- نمودار پراکندگی (scatterplot)
- Crosstab
- توابع Aggregation
- آشنایی با مفهوم Group by
- استفاده از تابع Group by برای محاسبه فراوانی یک متغیر کیفی
- استفاده از نمودار هیستوگرام برای محاسبه فراوانی یک متغیر کمی
- مفهوم significance یا P-value
- آزمون های آماری پارامتریک
- آزمون های آماری ناپارامتریک
- تعریف نمونه گیری
- مزایا و معایب نمونهگیری دار داده کاوی
- انواع روش پرکاربرد نمونه گیری
فصل پنجم: پیش پردازش داده ها
- پر کردن مقادیر NULL (کمی، کیفی اسمی و ترتیبی)
- فیلتر کردن رکورد یا وِیژگی
- تولید ویژگی (feature generation)
- ساخت Dummy برای ویژگیهای کیفی
- طبقه بندی مجدد مقادیر (Reclassification)
- Join
- Append
- بخش بندی دیتا (Train_Test_Split)
- نرمالسازی
- استاندارد سازی
- تعریف کاهش ابعاد
- اهمیت کاهش ابعاد
- تعریف انتخاب ویژگی (Feature selection)
- اهمیت انتخاب ویژگی
- انواع روش انتخاب ویژگی
فصل ششم: سریهای زمانی
- تعریف سری زمانی
- تعریف برازش (Fitting) و پیش بینی (Forecasting)
- مدل ARIMA
- شاخصهای نیکویی برازش
- میانگین
- خطای معیار (SE)
- R2 ایستایی
- میانگین مجذور خطا (RMSE)
- میانگین قدر مطلق درصد خطا (MAPE)
- ماکزیمم قدر مطلق درصد خطا (MAX PE)
- میانگین قدر مطلق خطا (MAE)
- ماکزیمم قدر مطلق خطا (MAX AE)
- معیار اطلاعاتی نرمال شده بیز (Normalized BIC)
فصل هفتم: رگرسیون خطی
- تعریف رگرسیون خطی
- رابطه خطی
- R Square
- خطای معیار تخمین
- فرضیه آماری آزمون معناداری کل مدل رگرسیون (به کمک جدول Anova)
- مقدار ثابت (B0)
- مقدار ضریب متغیر مستقل (B1)
- فاصله اطمینان
- Regularization
- مفهوم Overfitting
فصل هشتم: خوشه بندی (Clustering)
- تعریف خوشه بندی
- اهمیت خوشه بندی
- تفاوت خوشه بندی با کاهش ابعاد
- انواع روش خوشه بندی
- مفهوم distance / similarity
- Dendrogram
- مفهوم Agglomerative clustering
- مفهوم Linkage و انواع آن
- مفهوم Ward
فصل نهم: طبقه بندی (Classification)
- تعریف طبقه بندی
- تفاوت طبقه بندی با خوشه بندی
- اهمیت طبقه بندی
- آشنایی با الگوریتمهای طبقه بندی، مفاهیم و کاربردهای آنها
- کارنامه طبقه بندی و ارزیابی مدل
فصل دهم: آنالیز RFM
- تعریف اولیه
- اهمیت RFM
- مفهوم Recency
- مفهوم Frequency
- مفهوم Monetary
فصل یازدهم: قواعد انجمنی
- آشنایی با مفاهیم قواعد انجمنی
- محاسبات مربوطه
حاصل دوره
- تسلط به مفاهیم فرآیند داده کاوی
- تسلط به مفاهیم جبر خطی و آمار در داده کاوی
- تسلط به مفاهیم پیش پردازش دیتا
- تسلط به الگوریتم های یادگیری ماشین (نظارتی و غیر نظارتی)
- تسلط به مفاهیم آنالیز RFM برای شناسایی مشتریان وفادار و سود آور
لینک دیگر دوره های داده کاوی و یادگیری ماشین :
- آموزش داده کاوی و یادگیری ماشینی با IBM SPSS modeler
- آموزش داده کاوی و یادگیری ماشینی با پایتون
- آموزش متن کاوی با پایتون
- آموزش داده کاوی با رپیدماینر
- آموزش تصویر کاوی با رپیدماینر
- آموزش متن کاوی و وب کاوی با رپیدماینر
- آموزش یادگیری عمیق با پایتون
- پکیج جامع علم داده با رپیدماینر
- پکیج جامع علم داده با پایتون
فصل اول
معرفی دوره ویدئو
30:08
جبر خطی در داده کاوی و یادگیری ماشین ویدئو
19:14
انواع دیتا برای داده کاوی ویدئو
12:08
رسم نمودار ویدئو
11:32
آشنایی با تحلیل آماری ویدئو
31:00
تحلیل آماری تک متغیره ویدئو
04:44
تحلیل آماری چند متغیره ویدئو
20:08
آزمون های آماری ویدئو
19:06
نمونه گیری ویدئو
08:04
پیش پردازش دادهها (بخش اول) ویدئو
33:17
پیش پردازش داده ها (کاهش ابعاد / تحلیل فاکتور) ویدئو
08:07
پیش پردازش داده ها (انتخاب ویژگی) ویدئو
08:46
سری های زمانی ویدئو
24:27
رگرسیون خطی ویدئو
24:36
خوشه بندی ویدئو
46:03
طبقه بندی ویدئو
53:02
طبقه بندی (شبکههای عصبی) ویدئو
14:42
آنالیز RFM ویدئو
08:32
قواعد انجمنی ویدئو
04:38
گام های بعدی و ابزارهای لازم ویدئو
11:23
فایل های آموزش فایل های ضمیمه
دوره های مرتبط
آموزش جامع هوش تجاری BI و تحلیل داده با تبلو Tableau
آموزش پایه متلب Matlab
پکیج جامع علم داده با پایتون
پکیج جامع علم داده با رپیدماینر RapidMiner
آموزش جامع داده کاوی با رپیدماینر RapidMiner
rate_reviewامتیاز دانشجویان دوره
chat_bubble_outlineنظرات
سلام. من متخصص علوم داده و یادگیری ماشینی فعال در شرکت بیمه نوین (هلدینگ بانک اقتصاد نوین) هستم. دارای مدرک کارشناسی آمار و احتمال از دانشگاه شهید بهشتی و دانشجوی سال آخر مدیریت فناوری در دانشگاه تهران هستم.
مهدی نعمت شاهی( دانشجوی دوره )
واقعا متاسفم با این اموزش از روی اسلاید خوندن و یک برگه دستش گرفته داره از روش میخونه واقعا آموزش این طوری نیست
شاهین نوری
سلام وقتتون خیر؛
قربان تهیه مطالب این دوره چندین ماه طول کشیده و اینکه میفرمایید از روی اسلاید خونده میشود، بنظرم بی انصافیه چرا که تمام فرآیند داده کاوی با ارائه مثال، فرمولها و توابع به زبان بسیار ساده توضیح داده شده است!! حتی به صورت اختصاصی توابع مهم کتابخانههای داده کاوی پایتون و رسم نمودار در پایتون هم برای علاقهمندان داده کاوی با پایتون ارائه شده است(فایل ویدیویی و اکسل پیوست شده).
لطفاً ابتدا مجدداً تمام فایل های ویدیویی و پیوست موجود در صفحه را مشاهده بفرمایید و سپس در صورت تمایل میزان رضایت خود را از این دوره اعلام بفرمایید.
با تشکر و احترام
rainman89( دانشجوی دوره )
عالی بود جمع بندی سریع و کاربردی مباحث مقدماتی برای داده کاوی و شروع کار در این زمینه بسیار وسیع. تسلط استاد عالیه و کاملا مشخصه ایشون به صورت حرفه ای در این زمینه فعالیت می کنن. سیستم کویئز و مدرک رو هم فعال کند دیگه کارتون بی نظیر می شه
ملیحه سلیمیان( دانشجوی دوره )
سپاسگزارم از آقای مهندس نوری بابت تهیه فایلهای جامع و کاربردی و همچنین ارائه مطالب با بیان ساده و قابل فهم
آرش کیوان( دانشجوی دوره )
ممنون از جناب نوری
Ali amini( دانشجوی دوره )
سپاسگزارم از مهندس نوری و مجموعه داناپ
دوره بسیار جامع و مفیدی بود.
Kouroshh( دانشجوی دوره )
کیفیت آموزش و تسلط مدرس عالی بود
Cyrus62( دانشجوی دوره )
عالی. این دوره را به تمام کسانی که با مفاهیم یادگیری ماشین آشنا نیستند و در زمینه آمار و جبر خطی تسلط کافی ندارند توصیه میکنم.
PariN( دانشجوی دوره )
سلام
بسيار عالي بود و خيلي ممنون كه اين همه جزئيات را با مثال توضيح داديد. مفاهيم يادگيري ماشين بسيار جامع و ساده توضيح داده شده و براي كسي كه اصلا با مفاهيم اماري و روش هاي يادگيري ماشين اشنا نيست، شديدا پيشنهاد ميشه.
Mahsa( دانشجوی دوره )
فوق العاده دوره کامل و جامعی بود و تمامی مباحث را خیلی عالی توضیح دادن
Raz NV( دانشجوی دوره )
فوق العاده دوره عالی بود، ممنون از این آموزش بسیار مفید
peyman65( دانشجوی دوره )
عالی حرف نداره. برا شروع کار حوزه دیتاساینس عالیه و کافی