هنگامی که دو مجموعه از داده ها به شدت با هم در ارتباط هستند ، می گوییم که آنها همبستگی بالایی دارند.
کلمه همبستگی از مشترک (به معنای "با هم") و رابطه ساخته شده است
- همبستگی وقتی مقادیر با هم افزایش می یابد مثبت است و
- با افزایش یک مقدار ، همبستگی منفی است
فرض می شود که یک همبستگی خطی باشد (به دنبال یک خط).
همبستگی می تواند یک مقدار داشته باشد:
- 1 یک همبستگی مثبت کامل است
- 0 همبستگی ندارد (به نظر نمی رسد که مقادیر به هیچ وجه مرتبط نیستند)
- -1 یک همبستگی منفی کامل است
مقدار نشان می دهد که این همبستگی چقدر خوب است (نه خط چقدر شیب دار است) ، و اگر مثبت یا منفی باشد.
مثال: فروش بستنی
فروشگاه بستنی محلی میزان بستنی آنها را در مقابل درجه حرارت در آن روز پیگیری می کند. در اینجا ارقام آنها برای 12 روز گذشته است:
| فروش بستنی در مقابل دما |
| درجه حرارت درجه سانتیگراد | فروش بستنی |
| 14. 2 درجه | 215 دلار |
| 16. 4 درجه | 325 دلار |
| 11. 9 درجه | 185 دلار |
| 15. 2 درجه | 332 دلار |
| 18. 5 درجه | 406 دلار |
| 22. 1 درجه | 522 دلار |
| 19. 4 درجه | 412 دلار |
| 25. 1 درجه | 614 دلار |
| 23. 4 درجه | 544 دلار |
| 18. 1 درجه | 421 دلار |
| 22. 6 درجه | 445 دلار |
| 17. 2 درجه | 408 دلار |
و در اینجا همان داده های یک طرح پراکندگی وجود دارد:
به راحتی می توانیم ببینیم که آب و هوای گرمتر و فروش بالاتر با هم جمع می شوند. رابطه خوب است اما کامل نیست.
در حقیقت این همبستگی 0. 9575 است. در پایان ببینید که چگونه من آن را محاسبه کردم.
همبستگی در منحنی ها خوب نیست
محاسبه همبستگی فقط برای روابط خط مستقیم به درستی کار می کند.
بستنی ما مثال: موج گرما وجود داشته است!
آنقدر داغ می شود که مردم به مغازه نمی روند و فروش شروع به کاهش می کند.
در اینجا آخرین نمودار است:
مقدار همبستگی اکنون 0 است: "بدون همبستگی".!
مقدار همبستگی محاسبه شده 0 است (من آن را کار کردم) ، که به معنی "بدون همبستگی" است.
اما می توانیم ببینیم که داده ها از یک منحنی خوب پیروی می کنند که در حدود 25 درجه سانتیگراد به اوج می رسد
اما محاسبه همبستگی به اندازه کافی "هوشمند" برای دیدن این موضوع نیست.
اخلاق داستان: یک نقشه پراکنده درست کنید و به آن نگاه کنید! ممکن است رابطه ای را مشاهده کنید که محاسبه انجام نمی دهد.
"همبستگی علیت نیست"
یک گفته رایج این است که "همبستگی علیت نیست".
آنچه واقعاً به معنای این است که یک همبستگی اثبات نمی کند یک چیز باعث دیگری می شود:
- یک چیز ممکن است باعث دیگری شود
- دیگری ممکن است باعث شود اولین اتفاق بیفتد
- آنها ممکن است با چیز دیگری مرتبط باشند
- یا می تواند شانس تصادفی باشد!
دلایل زیادی وجود دارد که داده ها همبستگی خوبی دارند.
مثال: عینک آفتابی در مقابل بستنی
فروشگاه بستنی ما می یابد که برای هر روز چند عینک آفتابی توسط یک فروشگاه بزرگ فروخته می شود و آنها را با فروش بستنی خود مقایسه می کند:
همبستگی بین عینک آفتابی و فروش بستنی زیاد است
آیا این بدان معنی است که عینک آفتابی باعث می شود مردم بستنی بخواهند؟
مثال: حومه های فقیر به احتمال زیاد آلودگی زیادی دارند.
- آیا افراد فقیر آلودگی را ایجاد می کنند؟
- آیا حومه های آلوده تنها مکانی است که افراد فقیر می توانند از آن برخوردار شوند؟
- آیا این پیوند مشترک مانند کارخانه هایی با مشاغل کم پرداخت و آلودگی زیادی است؟
مثال: یک مورد واقعی!
چند سال پیش ، یک نظرسنجی از کارمندان بین "مطالعه یک دوره خارجی" و روزهای بیمار همبستگی مثبت داشت.
- مطالعه آنها را بیمار می کند؟
- افراد بیمار زیاد مطالعه می کنند؟
- یا آیا آنها در مورد بیمار بودن دروغ گفتند تا بتوانند بیشتر مطالعه کنند؟
بدون تحقیق بیشتر نمی توانیم مطمئن باشیم که چرا.
نحوه محاسبه
چگونه مقدار 0. 9575 را در بالا محاسبه کردم؟
من از "همبستگی پیرسون" استفاده کردم. نرم افزاری وجود دارد که می تواند آن را محاسبه کند ، مانند عملکرد Correl () در اکسل یا Libreoffice Calc.
بشراما در اینجا نحوه محاسبه خودتان است:
بگذارید دو مجموعه از داده ها را "x" و "y" بنامیم (در مورد ما دمای x و فروش بستنی y است):
- مرحله 1: میانگین x و میانگین y را پیدا کنید
- مرحله 2: میانگین X را از هر مقدار X کم کنید (آنها را "A" بنامید و میانگین Y را از هر مقدار y کم کنید (آنها را "B" بنامید)
- مرحله 3: محاسبه: AB ، 2 و B 2 برای هر مقدار
- مرحله 4: خلاصه AB ، جمع بندی 2 و خلاصه B 2
- مرحله 5: مبلغ AB را بر اساس ریشه مربع [(مجموع 2) × (جمع B 2) تقسیم کنید]
در اینجا نحوه محاسبه اولین نمونه بستنی (مقادیر گرد به 1 یا 0 مکان اعشاری) است:
به عنوان یک فرمول:
- σ سیگما است ، نماد "جمع کردن"
- هر مقدار X-MINUS میانگین X است (به نام "A" در بالا)
- هر مقدار y منهای میانگین y است (به نام "B" در بالا)
احتمالاً لازم نیست که آن را مانند آن محاسبه کنید ، اما حداقل می دانید که این "جادو" نیست ، بلکه به سادگی مجموعه ای از محاسبات است.
توجه برای برنامه نویسان
می توانید آن را در یک پاس از طریق داده ها محاسبه کنید. فقط x ، y ، x 2 ، y 2 و xy را جمع کنید (نیازی به محاسبات a یا b در بالا نیست) سپس از فرمول استفاده کنید:
روشهای دیگر
روش های دیگری برای محاسبه ضریب همبستگی وجود دارد ، مانند "ضریب همبستگی رتبه Spearman".
تجارت با گزینههای باینری...
ما را در سایت تجارت با گزینههای باینری دنبال می کنید
برچسب :
نویسنده : نازنین فراهانی
بازدید : 40
تاريخ : سه
شنبه
16 خرداد
1402 ساعت: 15:31