498,000 تومان 74,700 تومان
ویژگی های دوره
هدوپ Hadoop و اسپارک Spark دو تکنولوژی ذخیره سازی داده های حجیم در پایگاه های nosql هستند. این دو تفاوت های عمده ای با یکدیگر دارند که در ادامه به طور مختصر در مورد هر کدام صحبت خواهیم کرد.
هدوپ Hadoop یک فریمورک مدیریت و پردازش کلان داده به صورت توزیع شده می باشد که در آن داده های بزرگ به داده های کوچک شکسته می شوند. استفاده از هدوپ راهی آسان برای گسترش داده های مورد نیاز یک شرکت را فراهم می کند و به MapReduce اجازه می دهد تا وظایف خود را بر روی مجموعه های کوچکتر داده به منظور پردازش سریع تر انجام دهد. لازم به ذکر است که هدوپ می تواند از انواع داده ها پشتیبانی کند.
اسپارک Spark یک موتور پردازشی توزیع شده و درون حافظه ای است که با هدف استفاده حداکثری از مموری برای کوئری و تحلیل داده به وجود آمده است. اسپارک قابلیت بسیار بالایی در پردازش داده ها با استفاده از یادگیری ماشین دارد. برخی از فعالین این حوزه مدعی هستند که سرعت پردازش آپاچی اسپارک چیزی در حدود 100 برابر بیشتر از هدوپ است. اسپارک نیز مانند هدوپ قابلیت استفاده از ETL و یکپارچه کردن دیتا را دارد.
در این دوره چه مباحثی آموزش داده شده است؟
در دوره آموزشی مفاهیم بنیادی پردازش و مدیریت بیگ دیتا، به معرفی اکوسیستم هدوپ و موتور پردازشی توزیع شده آپاچی اسپارک می پردازیم. هدف این دوره آموزشی پرداختن به مباحث پایه ای در حوزه ابزارهای اکوسیستم هدوپ جهت احراز نیازمندی های مشاغل Data Engineer و Data Scientist می باشد.
سرفصل های دوره آموزش مفاهیم کلیدی هدوپ Hadoop و اسپارک Spark
آشنایی با بیگ دیتا
- تعریف، توصیف و بررسی ویژگی های کلیدی بیگ دیتا
- جایگاه بیگ دیتا و پردازش بیگ دیتا
- کاربرد بیگ دیتا و تحلیل آنها
- منابع تولید کننده بیگ دیتا
- چالش های مدل های سنتی ذخیره سازی در مواجهه با بیگ دیتا
- داده های Stream، مشخصات و تولید کننده های آن ها
- کاربرد و علت Stream Processing
معرفی Hadoop و شروع کار با اکو سیستم Hadoop
- معرفی Hadoop به عنوان سکوی پردازش و ذخیره سازی بیگ دیتا
- آشنایی با اجزا Hadoop
- مدل پردازش توزیع شده MapReduce
- سیستم فایل توزیع شده Hadoop HDFS
- سیستم مدیریت منابع و وظایف YARN
- قابلیت ها و توانمندی های Hadoop
- نقاط قوت و ضعف Hadoop در مقایسه با سیستم های پردازشی موجود
- معرفی مدل پردازشی MapReduce
- مراحل انجام کار در اجرای وظایف MapReduce
- حل مسئله شمارش کلمات در MapReduce
- معماری و ویژگی های HDFS
- نحوه عملکرد HDFS NameNode و DataNode و وظایف هر کدام
- ساختار داده ها و بلاک ها در HDFS
- معرفی YARN
- اجزاء YARN
بخش Apache Spark
- معرفی Spark و مدل پردازش در Spark
- ویژگی ها و کاربرد های Spark
- انواع روش های مدیریت منابع در Spark
- بررسی معماری Apache Spark Spark Session Spark Context
- آماده سازی محیط توسعه و نصب Spark
- Spark Core
- مدل داده ای
- Operations
- Transformations
- Actions
- تبدیل منابع داده ای به RDD
- Submit Jobs
- Jobs, Stages, and Tasks
- مانیتورینگ Job ها
- RDD Execution Plan
حاصل دوره
دانشجویان عزیز پس از گذراندن این دوره آموزشی علاوه بر شناخت کامل مفاهیم بیگ دیتا، درک کاملی از اکوسیستم هدوپ و موتور پردازشی توزیع شده آپاچی اسپارک پیدا می کنند و می توانند از ابزارهای مربوطه جهت انجام فعالیت های لازم در حوزه مهندسی، تحلیل و علم داده استفاده کنند.
ویدئوهای دوره
معرفی دوره ویدئو
27:39
دانلود یکجا قسمت های 1 الی 23 ویدئو
04:55:10
کارشناس مهندسی نرم افزار و کارشناس ارشد مهندسی فناوری اطلاعات، مهندس داده در سرویس های فناوری اطلاعات همت، بنیانگذار مدرسه بیگ دیتا و در حال حاضر مطالعه، پژوهش و تمرکزم روی فیلد استفاده از تکنیک های یادگیری ماشین و یادگیری عمیق به منظور تحلیل بیگ دیتاست. از جمله دیگر علاقه مندی های من، دیتاساینس، مهندسی بیگ دیتا، تحلیل شبکه های اجتماعی، پردازش گراف های حجیم و پردازش متن می باشد.
دوره های مرتبط
آموزش پردازش تصویر با پایتون – کتابخانه OpenCV
ارائه شده توسط< ایمان صادقی
آموزش پردازش تصویر با پایتون – پردازش چهره
ارائه شده توسط< علیرضا امرالهی
آموزش جامع متن کاوی و پردازش زبان طبیعی و صوت با پایتون Python
ارائه شده توسط< شاهین نوری
آموزش جامع متن کاوی و وب کاوی با رپیدماینر RapidMiner
ارائه شده توسط< شاهین نوری
آموزش جامع داده کاوی و یادگیری ماشینی با IBM SPSS modeler
ارائه شده توسط< شاهین نوری
rate_reviewامتیاز دانشجویان دوره
chat_bubble_outlineنظرات
498,000 تومان 74,700 تومان
فرصت باقیمانده تا پایان جشنواره نوروزی
کارشناس مهندسی نرم افزار و کارشناس ارشد مهندسی فناوری اطلاعات، مهندس داده در سرویس های فناوری اطلاعات همت، بنیانگذار مدرسه بیگ دیتا و در حال حاضر مطالعه، پژوهش و تمرکزم روی فیلد استفاده از تکنیک های یادگیری ماشین و یادگیری عمیق به منظور تحلیل بیگ دیتاست. از جمله دیگر علاقه مندی های من، دیتاساینس، مهندسی بیگ دیتا، تحلیل شبکه های اجتماعی، پردازش گراف های حجیم و پردازش متن می باشد.
helmashmsaei( دانشجوی دوره )
حتما پیشنهاد میدم این دوره رو از نظر محتوا و نحوه آموزش عالی بود
Joseph Hoseini( دانشجوی دوره )
خیلی دوره خوبی بود و تبریک میگم به مدرس دوره برای تولید و انتشار این محتوای آموزشی