بدانید که رگرسیون خطی ساده چیست و چگونه کار می کند

یک روش آمار مقدماتی برای تحلیل داده های کمی

Courtesy Colin Brough، عکاس. © 2010 ژوئن 10 Stock.xchng

مدل های رگرسیون خطی برای نشان دادن یا پیش بینی رابطه بین دو متغیر یا عوامل استفاده می شود . عامل پیش بینی شده (عامل که معادله حل می شود ) نامیده می شود متغیر وابسته عواملي كه براي پيش بيني ارزش متغير وابسته استفاده مي شوند، متغيرهاي مستقل هستند.

داده های خوب همیشه به داستان کامل نمی گویند. تجزیه و تحلیل رگرسیون معمولا در تحقیق مورد استفاده قرار می گیرد، زیرا آن را ثابت می کند که همبستگی بین متغیرها وجود دارد.

اما همبستگی با علت نیست . حتی یک خط در یک رگرسیون خطی ساده که با توجه به نقاط داده به خوبی می تواند چیزی قطعی در مورد رابطه علت و اثر نیست.

در رگرسیون خطی ساده، هر مشاهدات شامل دو مقدار می شود. یک مقدار برای متغیر وابسته است و یک مقدار برای متغیر مستقل است.

مدل رگرسیون خطی ساده

مدل رگرسیون خطی ساده به شرح زیر است: y = ( β 0 + β 1 + Ε

با توافق ریاضی، دو عامل که در تجزیه و تحلیل رگرسیون خطی ساده نقش دارند، عبارتند از x و y .

معادله ای که نشان می دهد چگونه y با x مرتبط است به عنوان مدل رگرسیون شناخته می شود. مدل رگرسیون خطی همچنین شامل یک عبارت خطا است که توسط Ε یا نماد یونانی epsilon نشان داده شده است. اصطلاح خطا برای حساب بودن تغییرات در y استفاده می شود که نمی توان با رابطه خطی بین x و y توضیح داد.

پارامترهایی وجود دارد که نشان دهنده جمعیت مورد مطالعه است. این پارامترهای مدل که توسط ( β 0+ β 1 x ) نشان داده شده است.

مدل رگرسیون خطی ساده

معادله رگرسیون خط ساده به صورت زیر نمایش داده می شود: ε ( y ) = ( β 0 + β 1 x ).

معادله رگرسیون خطی ساده به صورت یک خط مستقیم نمایش داده می شود.

( β 0 یقه ی یگانه خط رگرسیون است.

β 1 شیب است.

ε ( y ) میانگین یا مقدار انتظار برای y برای یک مقدار معین از x است .

یک خط رگرسیون میتواند یک رابطه خطی مثبت، یک رابطه خطی منفی یا هیچ ارتباطی را نشان دهد. اگر خط نقاشی در یک رگرسیون خطی ساده صاف باشد (بدون شیب دار)، بین دو متغیر رابطه وجود ندارد. اگر خط رگرسيون با انتهاي پايين خط در يقه (محور) گراف به سمت بالا سمت چپ را بالا ببرد، و انتهاي بال بالايي را به سمت ميدان گراف در ميان مي گذارد، از خط ممتد x (axis)، رابطه مثبت خطي وجود دارد . اگر خط رگرسيون با انتهاي فوقاني خط y در ردياب (محور) گراف، به سمت پايين سمت چپ و در انتهاي خط پايين به سمت ميدان گرافي، به سمت x intercept (محور)، رابطه خطي منفي وجود دارد.

معادله رگرسیون خطی تخمینی

اگر پارامترهای جمعیت شناخته شده بود، معادله رگرسیون خط ساده (که در زیر نشان داده شده است) می تواند برای محاسبه میانگین y برای یک مقدار شناخته شده x استفاده شود .

ε ( y ) = ( β 0 + β 1 x ).

با این حال، در عمل، مقادیر پارامتر شناخته شده نیست، بنابراین آنها باید با استفاده از داده های نمونه ای از جمعیت تخمین زده شوند. پارامترهای جمعیت برآورد شده با استفاده از آمار نمونه . آمار نمونه با b 0 + b نمایش داده می شود . هنگامی که آمار نمونه برای پارامترهای جمعیت جایگزین می شود، معادله رگرسیون تخمین زده می شود.

معادله رگرسیون برآورد شده در زیر نشان داده شده است.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) تلفظ می شود y کلاه .

نمودار معادله رگرسیون ساده برآورد شده خط خطی برآورد شده است.

b 0 یقه ی ی است.

ب 1 شیب است.

ŷ ) مقدار پیش بینی شده ی برای یک مقدار معین از x است .

نکته مهم: تجزیه و تحلیل رگرسیون برای تفسیر رابطه علت و معلول بین متغیرها استفاده نمی شود. با این وجود تجزیه و تحلیل رگرسیون می تواند نشان دهنده نحوه ارتباط متغیرها یا متغیرهای مرتبط با یکدیگر باشد.

در این راستا، تجزیه و تحلیل رگرسیون تمایل به ایجاد روابط برجسته ای دارد که یک محقق دانش آموز را تحت تأثیر قرار می دهد.

همچنین شناخته شده به عنوان: رگرسیون دو جانبه، تجزیه و تحلیل رگرسیون

مثال: روش کمترین مربعات یک روش آماری است برای استفاده از داده های نمونه برای پیدا کردن معادله رگرسیون برآورد شده. روش کمترین مربعات توسط کارل فریدریش گاوس، که در سال 1777 متولد شد و در سال 1855 متولد شد، پیشنهاد شد. روش کمترین مربعات هنوز به طور گسترده ای مورد استفاده قرار می گیرد.

منابع:

Anderson، DR، Sweeney، DJ، و ویلیامز، TA (2003). اهداف آمار برای کسب و کار و اقتصاد (ویرایش سوم) میسون، اوهایو: جنوب غربی، یادگیری تامپسون.

______ (2010). توضیح: تجزیه و تحلیل رگرسیون. اخبار MIT.

McIntyre، L. (1994). استفاده از داده های سیگاری برای معرفی رگرسیون چندگانه. مجله آمار آموزش و پرورش، 2 (1).

Mendenhall، W.، و Sincich، T. (1992). آمار مهندسی و علوم (ویرایش سوم)، نیویورک، نیویورک: انتشارات دلن

Panchenko، D. 18.443 آمار برای برنامه های کاربردی، پاییز 2006، بخش 14، رگرسیون خطی ساده. (موسسه فناوری ماساچوست: MIT OpenCourseWare)