ضریب همبستگی چیست؟ارزش R در آمار توضیح داده شده است

ساخت وبلاگ

Eric Leung

اریک لئونگ

What is a Correlation Coefficient? The r Value in Statistics Explained

همبستگی ابزاری عالی برای یادگیری در مورد چگونگی تغییر یک چیز با دیگری است. پس از خواندن این مطلب ، باید بفهمید که چه ارتباطی دارد ، چگونه می توانید در مورد همبستگی در کار خود فکر کنید و برای محاسبه همبستگی ها حداقل اجرای را کدگذاری کنید.

همبستگی در مورد چگونگی تغییر دو چیز با یکدیگر است

همبستگی یک مفهوم ریاضی انتزاعی است ، اما شما احتمالاً در مورد معنی آن ایده ای دارید. در اینجا چند نمونه از سه دسته کلی همبستگی آورده شده است.

هرچه غذای بیشتری می خورید ، احتمالاً احساس پر شدن بیشتری خواهید کرد. این یک مورد از زمانی است که دو چیز به همان روش با هم تغییر می کنند. یکی بالا می رود (خوردن غذای بیشتر) ، سپس دیگری نیز بالا می رود (احساس پر). این یک همبستگی مثبت است.

pos_plot

همبستگی مثبت بین غذای خورده شده و احساس کامل. غذای بیشتری خورده می شود ، هرچه احساس می کنید پر می شود (روند بالا سمت راست). کد R

وقتی در ماشین هستید و سریعتر می رود ، احتمالاً سریعتر به مقصد خود خواهید رسید و زمان سفر شما کمتر خواهد بود. این یک مورد از دو چیز است که در جهت مخالف تغییر می کند (سرعت بیشتری ، اما زمان کمتری). این یک همبستگی منفی است.

neg_plot

همبستگی منفی بین سرعت ماشین و زمان سفر. سریعتر ماشین ، زمان سفر کمتر (روند به پایین سمت راست). کد R

همچنین یک روش ممکن سوم وجود دارد که دو چیز می توانند "تغییر" کنند. یا بهتر بگوییم ، تغییر نمی کند. به عنوان مثال ، اگر می خواهید وزن خود را افزایش دهید و به چگونگی تغییر نمرات آزمون خود توجه کنید ، احتمالاً هیچ الگوی کلی تغییر در نمرات آزمون شما وجود نخواهد داشت. این بدان معنی است که هیچ ارتباطی وجود ندارد.

non_plot

یک طرح اغراق آمیز از هیچ ارتباطی بین افزایش وزن و نمرات آزمون. کد R

دانستن در مورد چگونگی تغییر دو چیز با هم ، اولین قدم برای پیش بینی است

قادر به توصیف آنچه در مثالهای قبلی ما اتفاق می افتد عالی و همه است. اما نکته چیست؟دلیل این است که این دانش را به روشی معنادار برای کمک به پیش بینی آنچه در آینده اتفاق خواهد افتاد ، استفاده کنید.

در مثال خوردن ما ، ممکن است ثبت کنیم که چقدر برای یک هفته کل غذا می خوریم و سپس یادداشت می کنیم که بعد از آن چقدر احساس می کنیم. همانطور که قبلاً فهمیدیم ، هرچه بیشتر غذا بخوریم ، احساس می کنیم.

پس از جمع آوری همه این اطلاعات ، می توانیم سؤالات بیشتری در مورد اینکه چرا این اتفاق برای درک بهتر این رابطه رخ می دهد بپرسیم. در اینجا ، ممکن است ما شروع کنیم به این سؤال که چه نوع غذاهایی ما را پر می کند ، یا اینکه آیا زمان روز بر میزان کامل بودن ما نیز تأثیر می گذارد.

تفکر مشابه می تواند برای شغل یا تجارت شما نیز اعمال شود. اگر متوجه می شوید که فروش یا معیارهای مهم دیگر با اندازه گیری دیگر مشاغل شما بالا یا پایین می روند (به عبارت دیگر ، همه چیز با همبستگی مثبت یا منفی همبستگی دارد) ، ممکن است ارزش آن را داشته باشد که در مورد آن رابطه بیشتر برای بهبود تجارت خود کاوش و یادگیری کنید.

همبستگی می تواند سطح قدرت مختلفی داشته باشد

ما برخی از همبستگی های کلی را به عنوان هر یک از آنها پوشش داده ایم

  • مثبت ،
  • منفی ، یا
  • عدم وجود

اگرچه این توضیحات خوب است ، اما همه همبستگی های مثبت و منفی همه یکسان نیستند.

این توضیحات همچنین می تواند به اعداد ترجمه شود. یک مقدار همبستگی می تواند هر مقدار اعشاری را بین منفی ، (-1 ) و مثبت ، (+1 ) به خود اختصاص دهد.

مقادیر اعشاری بین (-1 ) و (0 ) همبستگی های منفی مانند (-0. 32 ) هستند.

مقادیر اعشاری بین (0 ) و (+1 ) همبستگی مثبت دارند ، مانند (+0. 63 ).

یک همبستگی کامل صفر به این معنی است که هیچ ارتباطی وجود ندارد.

برای هر نوع همبستگی ، طیف وسیعی از همبستگی های قوی و همبستگی های ضعیف وجود دارد. مقادیر همبستگی نزدیک به صفر همبستگی ضعیف تری دارند ، در حالی که مقادیر نزدیک به مثبت یا منفی همبستگی قوی تری دارند.

همبستگی های قوی روندهای واضح تری در داده ها نشان می دهد ، در حالی که ضعیف تر به نظر می رسد ظالمانه است. به عنوان مثال ، همبستگی مثبت و مثبت قوی تر در زیر بیشتر شبیه یک خط در مقایسه با همبستگی ضعیف تر و پایین تر است.

Examples of low, high, and perfect positive correlations between x and y

سطح مختلف همبستگی مثبت. کد R

به طور مشابه ، همبستگی های به شدت منفی روند واضح تری نسبت به همبستگی منفی ضعیف تر و پایین تر دارند.

Examples of low, high, and perfect negative correlations between x and y

سطح مختلف همبستگی های منفی. کد R

مقدار R از کجا می آید؟و چه ارزشی می تواند داشته باشد؟

"مقدار r" یک روش مشترک برای نشان دادن یک مقدار همبستگی است. به طور خاص ، این به همبستگی (نمونه) پیرسون یا R. Pearson اشاره دارد. یادداشت "نمونه" این است که تأکید کنید که شما فقط می توانید همبستگی داده های خود را ادعا کنید و باید در مطالبات بزرگتر فراتر از داده های خود محتاط باشید.

جدول زیر آنچه را که تاکنون در مورد همبستگی ها پوشش داده ایم ، خلاصه می کند.

 

ارزش R پیرسون همبستگی بین دو چیز است. مثال
r = -1 کاملاً منفی ساعت روز و تعداد ساعات باقی مانده در روز
r <0 منفی سرعت سریعتر ماشین و زمان سفر کمتر
r = 0 مستقل یا غیر مرتبط افزایش وزن و نمرات آزمون
r> 0 مثبت غذای بیشتر خورده و احساس پر شدن بیشتر
r = 1 کاملاً مثبت افزایش سن من و افزایش سن شما

در چند بخش بعدی ، ما خواهیم کرد

  • معادله ریاضی را برای محاسبه همبستگی ها تجزیه کنید
  • برای استفاده از این معادله همبستگی از شماره های مثال استفاده کنید
  • معادله ریاضی را در پایتون و جاوا اسکریپت کدگذاری کنید

شکستن ریاضیات برای محاسبه همبستگی ها

به عنوان یک یادآوری ، همبستگی ها فقط می توانند بین (-1 ) و (1 ) باشند. چرا این است؟

پاسخ سریع این است که ما میزان تغییر در هر دو متغیر را به یک مقیاس مشترک تنظیم می کنیم. از نظر فنی تر ، ما عادی می کنیم که این دو متغیر با چه میزان تغییر می کنند که هر یک از این دو متغیر به خودی خود تغییر می کنند.

از ویکی پدیا ، می توانیم تعریف ریاضی از ضریب همبستگی پیرسون را بدست آوریم. به نظر می رسد بسیار پیچیده است ، اما بیایید آن را با هم تجزیه کنیم.

بیایید روی بالای معادله تمرکز کنیم ، همچنین به عنوان شماره ساز شناخته می شود. برای هر یک از متغیرهای (x ) و (y ) ، ما باید فاصله مقادیر (x ) را از میانگین (x ) پیدا کنیم و با هم تفریق را انجام دهیم (y ).

به طور شهودی ، مقایسه تمام این مقادیر با میانگین یک هدف هدف به ما می دهد تا ببینیم در یکی از متغیرها چقدر تغییر وجود دارد.

This is seen in the math form, ( extcolor^>( extcolor>)), ( extcolor>) the ( extcolor>) مقادیر شما با مقدار متوسط برای متغیر (x ) خود.

در پایین معادله ، که به عنوان مخرج نیز شناخته می شود ، ما یک محاسبه مشابه انجام می دهیم. با این حال ، قبل از اینکه همه مسافت ها را از ارزش های خود و میانگین آنها اضافه کنیم ، ما آنها را به خودی خود چندگانه خواهیم کرد (این همان کاری است که (( ldots)^2 ) انجام می دهد).

این مخرج همان چیزی است که همبستگی را "تنظیم" می کند تا مقادیر بین (-1 ) و (1 ) باشد.

استفاده از اعداد در معادله ما برای واقعی ساختن آن

برای نشان دادن ریاضیات ، بیایید همبستگی بین سنین شما و خواهر و برادرهای شما در سال گذشته پیدا کنیم ([1 ، 2 ، 6] ) و سنین شما برای این سال ([2 ، 3 ، 7] ). توجه داشته باشید که این یک مثال کوچک است. به طور معمول می خواهید بیش از سه نمونه اعتماد به نفس بیشتری به همبستگی شما داشته باشند.

با نگاهی به اعداد ، به نظر می رسد که آنها یکسان را افزایش می دهند. همچنین ممکن است متوجه شوید که آنها همان دنباله اعداد هستند اما مجموعه دوم اعداد دارای یک اضافه شده به آن است. این به همان اندازه نزدیک به یک همبستگی کامل است. به عبارت دیگر ، ما باید (r = 1 ) دریافت کنیم.

ابتدا باید میانگین هر یک را محاسبه کنیم. میانگین ([1 ، 2 ، 6] ) ((1+2+6)/3 = 3 ) و میانگین ([2 ، 3 ، 7] ) است (2+3+7)/3 = 4 ). معادله خود را پر می کنیم ، می گیریم

با نگاهی به بالای معادله ، باید تفاوت های زوجی (x ) و (y ) را پیدا کنیم. به یاد داشته باشید ، ( sum ) نمادی برای افزودن است. بالا

بنابراین بالا 14 می شود.

در پایین معادله ، ما باید برخی از محاسبات بسیار مشابه را انجام دهیم ، مگر اینکه فقط قبل از ضرب بر روی (x ) و (x ) تمرکز کنیم.

بیایید فقط روی ( sum_^n (x_i - 3)^2 ) تمرکز کنیم. به یاد داشته باشید ، (3 ) در اینجا میانگین تمام مقادیر (x ) است. این تعداد بسته به داده های خاص شما تغییر خواهد کرد.

[= (-2)^2 + (-1)^2 + (3)^2 = 4 + 1 + 9 = 14 ]

و اکنون برای مقادیر (y ).

[(-2)^2 + (-1)^2 + (3)^2 = 4 + 1 + 9 = 14 ]

ما این شماره ها را پر کرده ایم ، می توانیم آنها را در معادله خود قرار دهیم و برای همبستگی خود حل کنیم.

ما با موفقیت تأیید کردیم که (r = 1 ) را دریافت می کنیم.

اگرچه این یک مثال ساده بود ، همیشه بهتر است از نمونه های ساده برای اهداف تظاهرات استفاده کنید. این نشان می دهد که معادله ما واقعاً کار می کند ، که هنگام کدگذاری آن در بخش بعدی مهم خواهد بود.

کد پایتون و جاوا اسکریپت برای ضریب همبستگی پیرسون

ریاضیات گاهی اوقات می تواند خیلی انتزاعی باشد ، بنابراین بیایید این کار را برای آزمایش شما انجام دهیم. به عنوان یک یادآوری ، در اینجا معادله ای است که می خواهیم کدگذاری کنیم.

پس از گذراندن ریاضیات فوق و خواندن کد زیر ، باید در مورد نحوه کار همه چیز کمی واضح تر باشد.

در زیر نسخه پایتون همبستگی پیرسون آورده شده است.

ضریب همبستگی پیرسون که در پایتون برنامه ریزی شده است

در اینجا نمونه ای از کد پایتون ما در محل کار آورده شده است ، و ما می توانیم کار خود را با استفاده از یک عملکرد همبستگی پیرسون از بسته SCIPY بررسی کنیم.

در زیر نسخه JavaScript از همبستگی پیرسون آورده شده است.

ضریب همبستگی پیرسون که در جاوا اسکریپت برنامه ریزی شده است

در اینجا نمونه ای از کد JavaScript ما در محل کار برای بررسی دو برابر کار ما آورده شده است.

برای درک بهتر نحوه عملکرد آن ، فرمول را به پایتون یا جاوا اسکریپت ترجمه کنید.

در نتیجه

همبستگی ابزاری مفید و در دسترس برای درک بهتر رابطه بین هر دو اقدام عددی است. این را می توان به عنوان شروع برای مشکلات پیش بینی کننده یا درک بهتر تجارت خود تصور کرد.

مقادیر همبستگی ، که معمولاً به عنوان R Pearson استفاده می شود ، از (-1 ) تا (+1 ) استفاده می شود و می تواند به همبستگی منفی ( (-1 lt r lt 0 ) طبقه بندی شود) ، مثبت ((0 lt r lt 1 )) ، و بدون همبستگی ( (r = 0 )).

نگاهی اجمالی به دنیای بزرگتر همبستگی ها

بیش از یک راه برای محاسبه همبستگی وجود دارد. در اینجا ما به این مورد اشاره کرده ایم که هر دو متغیر به همان روش تغییر می کنند. موارد دیگری نیز وجود دارد که یک متغیر ممکن است با سرعت دیگری تغییر کند ، اما هنوز هم رابطه روشنی دارد. این امر باعث می شود که روابط غیر خطی به آن گفته شود.

در زیر لیستی از مقاله های دیگر که من به آن رسیدم که به من کمک کردند تا ضریب همبستگی را بهتر درک کنم.

  • اگر می خواهید یک تجسم تعاملی عالی را در مورد همبستگی کشف کنید ، به این سایت ساده و خارق العاده نگاهی بیندازید.
  • با استفاده از پایتون ، چندین روش برای اجرای یک همبستگی وجود دارد و انواع مختلفی از همبستگی وجود دارد. این آموزش عالی نمونه های خوبی از کد پایتون را برای آزمایش با خود نشان می دهد.
  • یک پست وبلاگ توسط Sabatian Sauer با استفاده از "مستطیل های انحراف متوسط" همبستگی می کند ، جایی که هر نقطه یک مستطیل بصری را از هر نقطه با استفاده از میانگین ایجاد می کند و آن را با استفاده از زبان برنامه نویسی R نشان می دهد.
  • و برای افراد عمیق کنجکاو در آنجا ، به این مقاله نگاهی بیندازید که 13 راه برای دیدن ضریب همبستگی (PDF) نشان می دهد.

مرا در توییتر دنبال کنید و وبلاگ شخصی خود را بررسی کنید که در آن بینش و منابع مفید دیگری برای برنامه نویسی ، آمار و یادگیری ماشین به اشتراک می گذارم. در زیر لیستی از مقالات دیگری که من به آن رسیده ام ، به من کمک کردند تا ضریب همبستگی را بهتر درک کنم.

تجارت با گزینه‌‌های باینری...
ما را در سایت تجارت با گزینه‌‌های باینری دنبال می کنید

برچسب : نویسنده : نازنین فراهانی بازدید : 28 تاريخ : شنبه 10 تير 1402 ساعت: 12:20