انواع تجزیه و تحلیل داده ها

ساخت وبلاگ

types of data analysis

تجزیه و تحلیل داده ها فرایند ضبط اطلاعات مفید با بازرسی ، پاکسازی ، تبدیل و مدل سازی مجموعه داده ها است. روش شناسی های مربوط به انجام این کار را می توان به عنوان تجزیه و تحلیل توصیفی طبقه بندی کرد (بینش داده ها به صورت عددی به دست می آید) ، تجزیه و تحلیل اکتشافی (این خرد اطلاعات را به صورت بصری دریافت می کند) ، تجزیه و تحلیل پیش بینی کننده (این احساس داده ها را با استفاده از رویدادهای تاریخی منتقل می کند) وتجزیه و تحلیل استنباطی (این شامل درک جمعیت با به دست آوردن اطلاعات از نمونه است).

انواع تجزیه و تحلیل داده ها

بر اساس روشهای مورد استفاده ، تجزیه و تحلیل داده ها را می توان به چهار بخش زیر تقسیم کرد:

Hadoop ، علوم داده ، آمار و دیگران

  • تجزیه و تحلیل توصیفی
  • تجزیه و تحلیل پیش بینی کننده
  • تجزیه و تحلیل استنباطی

1. تجزیه و تحلیل توصیفی

تجزیه و تحلیل توصیفی روش عددی برای به دست آوردن بینش در مورد داده ها است. در تجزیه و تحلیل توصیفی ، یک مقدار خلاصه از متغیرهای عددی دریافت می کنیم. فرض کنید شما در حال تجزیه و تحلیل داده های فروش یک سازنده خودرو هستید. در ادبیات تجزیه و تحلیل توصیفی ، شما به دنبال سؤالاتی مانند میانگین ، نحوه فروش یک نوع خودرو هستید ، درآمد حاصل از فروش یک نوع خاص از ماشین و غیره چه چیزی بوده است. پراکندگی متغیرهای عددی داده ها با استفاده از این نوع تجزیه و تحلیل. در اکثر موارد استفاده از داده های علوم داده ، یک تجزیه و تحلیل توصیفی به شما کمک می کند تا اطلاعات سطح بالایی را در مورد داده ها بدست آورید و به مجموعه داده ها استفاده کنید. اصطلاحات مهم تجزیه و تحلیل توصیفی عبارتند از:

  • میانگین (میانگین همه اعداد در لیست اعداد)
  • حالت (بیشترین تعداد در لیست اعداد)
  • متوسط (ارزش متوسط لیستی از اعداد)
  • انحراف استاندارد (میزان تغییر مجموعه ای از مقادیر از میانگین مقدار)
  • واریانس (مربع انحراف استاندارد)
  • دامنه بین کوارتیل (مقادیر بین 25 تا 75 درصد از لیست اعداد)

در پایتون ، کتابخانه پاندا روشی به نام "توصیف" را ارائه می دهد که شامل اطلاعات توصیفی در مورد قاب داده است. ما همچنین می توانیم از کتابخانه های دیگری مانند مدل Stats استفاده کنیم یا کد خود را در مورد مورد استفاده توسعه دهیم.

360+ دوره آنلاین |50+ پروژه |1500+ ساعت |گواهینامه های قابل تأیید |Access Lifetime 4. 7 (84،037 رتبه بندی)

2. تجزیه و تحلیل داده های اکتشافی

برخلاف تجزیه و تحلیل داده های توصیفی ، جایی که ما داده ها را به صورت عددی تجزیه و تحلیل می کنیم ، تجزیه و تحلیل داده های اکتشافی روش بصری برای تجزیه و تحلیل داده ها است. هنگامی که ما درک اساسی از داده های موجود از طریق تجزیه و تحلیل توصیفی داشته باشیم ، به تجزیه و تحلیل داده های اکتشافی حرکت خواهیم کرد. ما همچنین می توانیم تجزیه و تحلیل داده های اکتشافی را به دو بخش تقسیم کنیم:

  • تجزیه و تحلیل متغیر UNI (کاوش در خصوصیات یک متغیر واحد)
  • تجزیه و تحلیل چند متغیره (تجزیه و تحلیل مقایسه ای متغیرهای متعدد ، اگر همبستگی دو متغیر را با هم مقایسه کنیم ، به آن تجزیه و تحلیل دو متغیره گفته می شود)

در روش بصری تجزیه و تحلیل داده ها ، از توطئه ها و نمودارها برای تجزیه و تحلیل داده ها استفاده می کنیم. برای کشف یک متغیر واحد (تجزیه و تحلیل تک متغیره) ، می توانیم از یک طرح نوار ، هیستوگرام ، طرح جعبه با ویسکر ، طرح ویولن و غیره استفاده کنیم. برای تجزیه و تحلیل چند متغیره ، ما از توطئه های پراکنده ، توطئه های کانتور ، توطئه های چند بعدی و غیره استفاده می کنیم.

اما چرا ما به تجزیه و تحلیل داده های اکتشافی نیاز داریم؟

  • تجزیه و تحلیل داده های اکتشافی یک روش بصری برای توصیف داده ها ارائه می دهد ، که به شناسایی واضح تر ویژگی های داده ها کمک می کند.
  • این به ما کمک می کند تا مشخص شود که کدام ویژگی ها از اهمیت بیشتری برخوردار هستند. این امر به ویژه در هنگام برخورد با داده های با ابعاد بالا مفید است.(به عنوان مثال ، روشهایی مانند PCA و T-SNE در کاهش ابعاد کمک می کنند).
  • این یک روش مؤثر برای توضیح نتیجه تحمیل شده برای مدیران و دارندگان پشته های غیر فنی است.

در پایتون ، بسیاری از کتابخانه ها برای انجام تجزیه و تحلیل داده های اکتشافی وجود دارند. Matplotlib ، Seabo ، Plotly ، Bokeh و غیره محبوب ترین هستند.

3. تجزیه و تحلیل پیش بینی کننده

چه اتفاقی می افتد اگر ما اشتباهاتی را که در آینده انجام خواهیم داد ، بدانیم؟آیا سعی خواهیم کرد از آن جلوگیری کنیم؟تجزیه و تحلیل پیش بینی چیزی جز علمی ترین روش برای پیش بینی نتایج آینده با تجزیه و تحلیل وقایع تاریخی نیست. قلب علم داده ها مبتنی بر تجزیه و تحلیل پیش بینی است. تجزیه و تحلیل پیش بینی کننده به ما کمک می کند تا به سؤالات زیر پاسخ دهیم: "آیا می توانیم پیش بینی کنیم که آیا یک خریدار یک محصول خاص را خریداری می کند یا نه؟" یا "آیا می توانیم کل هزینه ای را که یک بیمه گذار برای پرداخت مطالبات پرداخت می کند تخمین بزنیم؟‘یا‘ آیا می توانیم میزان بارندگی در موسمی آینده را تخمین بزنیم؟ "

تجزیه و تحلیل پیش بینی کننده به ما کمک می کند تا نتیجه تقریبی یا به احتمال زیاد سؤالات مهم را ارائه دهیم که منجر به تغییرات گسترده در تجارت و تغییرات اقتصادی و اجتماعی و اقتصادی می شود. مدل های یادگیری ماشین بر اساس داده های تاریخی برای پیش بینی نتیجه وقایع مشابه آینده غیب ساخته شده اند.

4- تجزیه و تحلیل استنباطی

تجزیه و تحلیل استنباطی ادبیات علوم داده است ، در حالی که ما نتیجه مرجع برای بخش های مختلف را پیش بینی می کنیم. به عنوان مثال ، ما شاخص قیمت مصرف کننده یا درآمد سرانه را استخراج می کنیم. رسیدن به هر مصرف کننده یک به یک امکان پذیر نیست و محاسبه می شود. درعوض ، ما از نظر علمی نمونه هایی را از جمعیت می گیریم و با کمک تجزیه و تحلیل آماری ، شاخص را استخراج می کنیم.

نتیجه

در این مقاله ، ما در مورد روشهای مختلف تجزیه و تحلیل داده ها بحث کرده ایم. آیا ما باید از همه این روش ها استفاده کنیم یا می توانیم از هر یک از آنها استفاده کنیم؟خوب ، اکنون بر اساس مورد استفاده و دامنه برنامه است. اما در بیشتر موارد ، ما با تجزیه و تحلیل داده های توصیفی و اکتشافی شروع خواهیم کرد و مدلهای پیش بینی کننده ای را برای پیش بینی نتایج آینده توسعه خواهیم داد.

مقالات توصیه شده

این راهنما برای انواع تجزیه و تحلیل داده ها است. در اینجا ما در مورد یک مرور کلی از تجزیه و تحلیل داده ها و روش های مختلف بر اساس مورد استفاده و دامنه برنامه بحث می کنیم. همچنین می توانید مقالات پیشنهادی ما را برای کسب اطلاعات بیشتر طی کنید -

برنامه آموزش Hadoop (20 دوره ، 14+ پروژه ، 4 مورد) 20 دوره آنلاین |14 پروژه دستی |135+ ساعت |گواهی قابل تأیید تکمیل 4. 5

تجارت با گزینه‌‌های باینری...
ما را در سایت تجارت با گزینه‌‌های باینری دنبال می کنید

برچسب : نویسنده : نازنین فراهانی بازدید : 32 تاريخ : سه شنبه 16 خرداد 1402 ساعت: 17:42