إنني أحاول إجراء اختبار F على الأهمية المشتركة للآثار الثابتة (المتغيرات الوهمية الخاصة بالفرد) على انحدار بيانات عملية شريان الحياة للسودان (في R)، ولكني وجدت طريقة غير كافية لتحقيق ذلك لعدد كبير من الآثار الثابتة . من الناحية المثالية، وأود أن استخدام وظيفة في حزمة بلم، ولكن أنا وجدت أي شيء على وجه التحديد هذا الاختبار. هذا شيء يفعل ستاتا تلقائيا عند استخدام ستريغ، أمر في. في ستاتا، تبدو النتائج كما يلي: مرة أخرى، أحاول إعادة إنتاج نتيجة ستاتا في R لعدد كبير من المتغيرات الوهمية، ربما محدد بواسطة عامل (us. state) باستخدام لم () أو نموذج في باستخدام بلم (). هنا مثال قابل للتكرار: وهو ما يعادل ما يلي ضمن الانحدار باستخدام حزمة بلم. لذلك، فإن الاختبار سيكون الاختبار أن جميع المتغيرات دمية الدولة هي معا مختلفة من الصفر (مشترك بشكل كبير). هذا هو تقييد خطي على النموذج غير المقيد (reg1 و reg1.fe أعلاه). ويوضح هذا الاختبار F بشكل أفضل على الوثيقة التالية (انظر الشرائح 5-7). هنا هو واحد من محاولات بلدي ضعيفة في إنشاء مصفوفة R للاختبار F مع فرضية فارغة: رب ف حيث B هو مصفوفة المعاملات (بيتا قبعة)، و q هو متجه من الأصفار. هذا لا يعمل و، آمل أن يكون هناك نهج مبسط لاختبار أهمية مشتركة لجميع المتغيرات وهمية تأثير ثابت. أولا، إد ترغب في اقتراح أن سؤالك يمكن تحسينها من خلال (1) تقديم مثال استنساخه، و (2) وصف الاختبار الدقيق الذي تشير إليه عندما تقول F اختبار. رابط إلى مستندات ستاتا ربما F هو التوزيع، لذلك يمكن أن يكون هناك اختبارات غازيليون يسمى اختبار F. إذا كانت مصلحتك الجوهرية تكمن في تحديد ما إذا كان نموذج التأثيرات الثابتة يناسب البيانات بشكل أفضل بكثير من عملية شريان الحياة للسودان بدون تأثيرات ثابتة، فيمكنك دائما استخدام اختبار نسبة الاحتمال. أنا متأكد من أن هناك العديد من التطبيقات في R، ولكن واحد التي تقدمها حزمة متيست مريحة جدا. هيريس مثال باستخدام مجموعة بيانات وزعت مع حزمة بلم (يبدو أن لديك أن تثبيت، لذلك ينبغي أن يكون من السهل محاولة). أعتقد plm39s بتست () وظيفة قد تفعل ما تريد (انظر بلدي تحرير الجواب). والنتيجة ليست بالضبط نفس الناتج ستاتا الخاص بك، والذي ربما يرجع إلى حقيقة أن المعلمة الأولى من التوزيع F مختلفة. ولكن عندما كنت تناسب كلا النموذجين بشكل فردي مع لم ()، أحصل على درجات الحرية 543 و 498 (الفرق من 45)، لذلك يبدو R هنا. معرفة ما إذا كنت تحصل على نفس درجات الحرية في ستاتا عندما كنت تناسب التجميع وضمن نماذج بشكل فردي. المشكلة مع البرامج المغلقة المصدر مثل ستاتا هو we39ll لا نعرف على وجه التحديد كيف يحسبون اختبارهم F. نداش فنسنت 30 مايو 11 في 03:50 أنا حقا لا أعتقد أن هذا الاختبار مفيد على الإطلاق. بدلا من تقدير ما تسمونه تأثير ثابت (عدم استدعائه لا تجمع نموذج)، لماذا لا نموذج هرمي نموذج هرمي (أو نموذج التجميع الجزئي) سوف تسمح لتقلص الخاص بك إلى تقليص متوسط كوموم للدول، ولكن من دون فرض لهم أن تكون متساوية. موريفور، إذا كنت بحاجة إلى تقييم مقدار الدول تختلف، تحتاج فقط إلى استخدام التباين المقدرة بين الدولة وبين الدول. إذا كان التباين بين الدول منخفضا (بالقرب من الصفر)، مما كنت تكتسب كسبا كثيرا باستخدام نموذج هرمي والمعارضة هي نفسها تقريبا. إذا كان التباين كبير جدا (في الحد، عندما يذهب إلى ما لا نهاية) النموذج الهرمي يضيف القليل ويمكنك تشغيل نموذج فصل لكل حالة. يمكنك تقدير نموذج هرمي في R مع حزمة Lme4. استخدام البيانات الخاصة بك: الانحراف المعياري المقدر للاعتراض من قبل الدول هو 4.39 والانحراف المعياري من قبل الفرد هو 4.19.NOTICE: سوف إدر المجموعة الاستشارية الإحصائية ترحيل الموقع إلى وردبريس كمس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد . ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة المجموعة الاستشارية للاستشارات من خلال إعطاء هدية ستاتا أسئلة وأجوبة كيف يمكنني إجراء نسبة الاحتمال، والد، و لاغرانج مضاعف (درجة) اختبار في ستاتا نسبة احتمال (لر) اختبار، اختبار والد، واختبار المضاعف لاغرانج (يسمى أحيانا اختبار نقاط) يستخدم عادة لتقييم الفرق بين النماذج المتداخلة. ويعتبر نموذج واحد متداخلة في نموذج آخر إذا كان يمكن توليد النموذج الأول بفرض قيود على المعلمات من الثانية. في معظم الأحيان، فإن التقييد هو أن المعلمة تساوي الصفر. في نموذج الانحدار يتم تقييد معلمات إلى الصفر عن طريق إزالة متغيرات التنبؤ من النموذج. على سبيل المثال، في النماذج أدناه، نموذج مع متغيرات التنبؤ الإناث. و أقرأ . متداخلة داخل النموذج مع متغيرات التنبؤ الإناث. اقرأ . الرياضيات. والعلوم. وتطرح اختبارات المضاعفات لر و والد و لاغرانج نفس السؤال الأساسي الذي يعني تقييد هذه المعلمات إلى الصفر (أي ترك هذه المتغيرات المتوقعة) تقلل إلى حد كبير من ملاءمة النموذج لإجراء اختبار نسبة الاحتمال، من النماذج التي يرغب المرء في مقارنتها. ميزة اختبارات والد والنتيجة هي أنها تقارب اختبار لر ولكن تتطلب أن يتم تقدير نموذج واحد فقط. عندما كانت قوة الحوسبة أكثر محدودية بكثير، واستغرقت العديد من النماذج وقتا طويلا للتشغيل، كانت هذه ميزة كبيرة إلى حد ما. اليوم، بالنسبة لمعظم النماذج من المرجح أن يرغب الباحثون في المقارنة، هذه ليست قضية، ونحن نوصي عموما تشغيل اختبار نسبة الاحتمال في معظم الحالات. هذا لا يعني أن المرء لا ينبغي أبدا استخدام والد أو تسجيل الاختبارات. على سبيل المثال، يستخدم اختبار والد عادة لأداء درجات متعددة من اختبارات الحرية على مجموعات من المتغيرات الوهمية المستخدمة لنمذجة المتغيرات الفئوية في الانحدار (لمزيد من المعلومات انظر موقعنا على الانحدار مع ستاتا، وتحديدا الفصل 3 - الانحدار مع التنبؤات الفئوية). مثال آخر هو كوتموديفيكاتيون إندسسكوت المستخدمة في النمذجة المعادلة الهيكلية، فهي لاغرانج اختبارات المضاعف. كما ذكرنا أعلاه، يتطلب اختبار لر أن يتم تشغيل نموذجين، واحدة منها لديها مجموعة من المعلمات (المتغيرات)، ونموذج ثان مع جميع المعلمات من الأولى، بالإضافة إلى واحد أو أكثر من المتغيرات الأخرى. يفحص اختبار والد نموذجا بمزيد من المعلمات ويقيم ما إذا كان تقييد تلك المعلمات (عموما إلى الصفر، عن طريق إزالة المتغيرات المرتبطة بها من النموذج) يضر بشكل خطير بملاءمة النموذج. وعلى النقيض من ذلك، يدرس اختبار النقاط نتائج نموذج أصغر ويسأل عما إذا كان إضافة متغير واحد أو أكثر محذوف من شأنه أن يحسن ملاءمة النموذج. بشكل عام، يجب أن تأتي الاختبارات الثلاثة إلى نفس الاستنتاج (لأن والد واختبار النتيجة، على الأقل من الناحية النظرية، تقارب اختبار لر). على سبيل المثال، سوف نقوم باختبار فرق ذو دلالة إحصائية بين نموذجين، باستخدام الاختبارات الثلاثة جميعها. تتضمن مجموعة البيانات لهذا المثال البيانات الديموغرافية، وكذلك نتائج الاختبارات القياسية ل 200 طالب في المرحلة الثانوية. وسوف نقارن نموذجين. المتغير التابع لكلا النموذجين هو هوريت (ليتم تداخل نموذجين يجب أن يشتركا في المتغير التابع نفسه)، وهو متغير ثنائي التفرع يشير إلى أن الطالب كان لديه درجة الكتابة التي كانت فوق المتوسط. هناك أربعة متغيرات متوقعة المحتملة، الإناث. وهو متغير وهمية يشير إلى أن الطالب أنثى، والمتغيرات المستمرة قراءة. الرياضيات. والعلوم. والتي هي الطلاب درجات الاختبار موحدة في القراءة والرياضيات والعلوم، على التوالي. وسوف نقوم باختبار نموذج يحتوي فقط المتغيرات التنبؤ الإناث والقراءة. ضد النموذج الذي يحتوي على متغيرات التنبؤ الإناث والقراءة. فضلا عن متغيرات التنبؤ الإضافية والرياضيات والعلوم. مثال لاختبار نسبة الاحتمال. كما نوقش أعلاه، اختبار لر يتضمن تقدير نموذجين ومقارنتها. إن تحديد معلمة واحدة أو أكثر إلى الصفر، عن طريق إزالة المتغيرات المقترنة بتلك المعلمة من النموذج، سيجعل دائما النموذج مناسبا بشكل أقل، لذا فإن التغيير في احتمال السجل لا يعني بالضرورة أن النموذج ذو المتغيرات الأكثر ملاءمة بشكل أفضل. اختبار لر يقارن احتمال السجل من النموذجين واختبار ما إذا كان هذا الاختلاف ذو دلالة إحصائية. إذا كان الفرق ذو دلالة إحصائية، فإن النموذج الأقل تقييدا (النموذج ذو المتغيرات الأكثر) يقال إنه يناسب البيانات بشكل أفضل بكثير من النموذج الأكثر تقييدا. يتم حساب إحصائية اختبار لر على النحو التالي: LR - لن (L (m1) L (m2) 2 (ل (m2) - ll (m1)) حيث يشير L (m) إلى احتمال النموذج المعين، و ل (م) السجل الطبيعي من احتمال النماذج. وتوزع هذه الإحصائية تشي مربع مع درجات الحرية تساوي الفرق في عدد درجات الحرية بين النموذجين (أي عدد المتغيرات المضافة إلى النموذج). من أجل إجراء اختبار نسبة الاحتمالات سوف نحتاج إلى تشغيل كلا النموذجين وتقديم ملاحظة لاحتمالات السجل النهائي. سنقوم بتشغيل النماذج باستخدام ستاتا واستخدام الأوامر لتخزين إمكانيات السجل. يمكننا أيضا نسخ الاحتمالات إلى أسفل (أي عن طريق كتابتها أو قطعها ولصقها)، ولكن استخدام الأوامر أسهل قليلا ومن المحتمل أن تؤدي إلى أخطاء. السطر الأول من بناء الجملة أدناه يقرأ في مجموعة البيانات من موقعنا على الانترنت. السطر الثاني من بناء الجملة تدير نموذج الانحدار اللوجستي، وتوقع هيوريت على أساس الطلاب الجنسين (الإناث)، وقراءة عشرات (قراءة). السطر الثالث من التعليمات البرمجية يخزن قيمة احتمال السجل للنموذج، الذي يتم تخزينه مؤقتا مثل تقدير عاد ه (ل) (لمزيد من المعلومات نوع المساعدة العودة في إطار الأمر ستاتا)، في العدد المسمى m1. أدناه هو الإخراج. من أجل إجراء اختبار نسبة الاحتمالات سنحتاج إلى تتبع احتمال السجل (-10.44)، وبناء الجملة لهذا المثال (أعلاه) يفعل ذلك عن طريق تخزين القيمة في العددية. وبما أنه ليس لدينا الشاغل الرئيسي هنا، ونحن سوف تخطي تفسير بقية نموذج الانحدار اللوجستي. لاحظ أن تخزين التقدير الذي تم إرجاعه لا ينتج أي ناتج. السطر الأول من بناء الجملة أدناه يدير النموذج الثاني، وهذا هو، النموذج مع متغيرات التنبؤ الأربعة. السطر الثاني من التعليمات البرمجية يخزن قيمة احتمال السجل للنموذج (-84.4)، والتي يتم تخزينها مؤقتا كما تقدير عاد (ه (ل))، في العدد المسمى M2. مرة أخرى، ونحن لن نقول الكثير عن الإخراج إلا أن نلاحظ أن معاملات لكل من الرياضيات والعلوم على حد سواء ذات دلالة إحصائية. لذلك نحن نعلم أن، بشكل فردي، فهي تنبؤات هامة إحصائيا من هيوريت. الآن لدينا إمكانيات السجل من كلا النموذجين، يمكننا إجراء اختبار نسبة احتمال. السطر الأول من بناء الجملة يحسب إحصائية اختبار نسبة الاحتمال. السطر الثاني من بناء الجملة يجد قيمة p المرتبطة إحصائية اختبار لدينا مع درجتين من الحرية. ننظر أدناه نرى أن إحصائية الاختبار هي 36.05، وأن قيمة p المرتبطة منخفضة جدا (أقل من 0.0001). وأظهرت النتائج أن إضافة الرياضيات والعلوم كمتغيرات تنبؤ معا (وليس فقط بشكل فردي) النتائج في تحسن كبير إحصائيا في نموذج صالح. لاحظ أنه إذا أجرينا اختبار نسبة الاحتمال لإضافة متغير واحد إلى النموذج، ستكون النتائج هي نفس اختبار الدلالة لمعامل هذا المتغير المعروض في الجدول أعلاه. باستخدام ستاتاس بوستستيماشيون الأوامر لحساب احتمال نسبة اختبار كما رأيت، فمن السهل بما فيه الكفاية لحساب احتمال نسبة اختبار كوبي hand. quot ومع ذلك، يمكنك أيضا استخدام ستاتا لتخزين التقديرات وتشغيل الاختبار بالنسبة لك. هذا الأسلوب هو أسهل لا يزال، وربما أقل عرضة للخطأ. السطر الأول من بناء الجملة تدير نموذج الانحدار اللوجستي، وتوقع هيوريت على أساس الطلاب الجنس (الإناث)، وقراءة عشرات (قراءة). السطر الثاني من بناء الجملة يطلب من ستاتا لتخزين التقديرات من نموذج ركضنا للتو، ويوجه ستاتا أننا نريد أن ندعو التقديرات m1. من الضروري إعطاء التقديرات اسما، حيث أن ستاتا تسمح للمستخدمين بتخزين التقديرات من أكثر من تحليل واحد، وسنقوم بتخزين أكثر من مجموعة واحدة من التقديرات. أدناه هو الإخراج. وبما أنه ليس شاغلنا الرئيسي هنا، فإننا سوف تخطي تفسير نموذج الانحدار اللوجستي. لاحظ أن تخزين التقديرات لا ينتج أي إخراج. السطر الأول من بناء الجملة أدناه هذه الفقرة يدير النموذج الثاني، وهذا هو النموذج مع متغيرات التنبؤ الأربعة. السطر الثاني من بناء الجملة يحفظ التقديرات من هذا النموذج، وأسماء لهم m2. أسفل بناء الجملة هو الناتج ولدت. مرة أخرى، ونحن لن نقول الكثير عن الإخراج إلا أن نلاحظ أن معاملات لكل من الرياضيات والعلوم على حد سواء ذات دلالة إحصائية. لذلك نحن نعلم أن، بشكل فردي، فهي تنبؤات هامة إحصائيا من هيوريت. والاختبارات أدناه تسمح لنا لاختبار ما إذا كان إضافة كل من هذه المتغيرات إلى نموذج يحسن بشكل كبير من تناسب النموذج، مقارنة مع نموذج يحتوي على الإناث فقط وقراءة. السطر الأول من بناء الجملة يقول ستاتا أننا نريد لتشغيل اختبار لر، وأننا نريد لمقارنة التقديرات التي قمنا بحفظها كما m1 لتلك التي قمنا بحفظها كما m2. الإخراج يذكرنا أن هذا الاختبار يفترض أن A متداخلة في B، الذي هو عليه. كما أنه يعطي لنا قيمة تشي مربع للاختبار (36.05) وكذلك قيمة p ل تشي مربع من 36.05 مع درجتين من الحرية. لاحظ أن درجات الحرية للاختبار لر، جنبا إلى جنب مع اثنين من الاختبارات الأخرى، يساوي عدد المعلمات المقيدة (أي إزالتها من النموذج)، في حالتنا، 2. لاحظ أن النتائج هي نفس عندما قمنا بحساب اختبار لر باليد أعلاه. إضافة الرياضيات والعلوم كمتغيرات التنبؤ معا (وليس فقط بشكل فردي) النتائج في تحسن ملحوظ إحصائيا في تناسب النموذج. كما لوحظ عندما قمنا بحساب اختبار نسبة الاحتمال باليد، إذا أجرينا اختبار نسبة الاحتمال لإضافة متغير واحد إلى النموذج، ستكون النتائج هي نفس اختبار الدلالة لمعامل هذا المتغير المعروض في الجدول أعلاه. يبدو التركيب الكامل لاختبار نسبة الاحتمالات، وكله في كتلة واحدة، كما يلي: مثال على اختبار والد كما ذكر أعلاه، فإن اختبار والد يقترب من اختبار لر، ولكن مع ميزة أنه يتطلب فقط تقدير نموذج واحد. ويعمل اختبار والد عن طريق اختبار أن المعلمات ذات الأهمية تساوي في نفس الوقت صفر. إذا كانت هذه، فإن هذا يشير بقوة إلى أن إزالتها من النموذج لن يقلل كثيرا من ملاءمة هذا النموذج، حيث أن المتنبأ الذي يكون معامله صغير جدا بالنسبة لخطأه المعياري عادة ما لا يفعل الكثير للمساعدة في التنبؤ بالمتغير التابع. الخطوة الأولى في إجراء اختبار والد هي تشغيل النموذج الكامل (أي النموذج الذي يحتوي على متغيرات التنبؤ الأربعة). السطر الأول من بناء الجملة أدناه هذا (ولكن يستخدم البادئة بهدوء بحيث لا يظهر الإخراج من الانحدار). السطر الثاني من بناء الجملة أدناه تعليمات ستاتا لتشغيل اختبار والد من أجل اختبار ما إذا كانت معاملات لمتغيرات الرياضيات والعلوم تساوي في وقت واحد الصفر. الإخراج يعطي أولا فرضية فارغة. أدناه نرى قيمة تشي مربع ولدت من اختبار والد، فضلا عن قيمة p المرتبطة تشي مربع من 27.53 مع درجتين من الحرية. استنادا إلى قيمة p، فإننا قادرون على رفض فرضية فارغة، مما يشير مرة أخرى إلى أن معاملات الرياضيات والعلوم ليست في وقت واحد مساوية للصفر، وهذا يعني أن تشمل هذه المتغيرات خلق تحسن كبير إحصائيا في تناسب النموذج. مثال على درجة أو اختبار المضاعف لاغرانج يرجى ملاحظة أن تستوميت مكتوبة المستخدم لم تعد متوفرة في ستاتا. من أجل إجراء اختبار النتيجة، سوف تحتاج إلى تحميل اثنين من حزم مكتوبة المستخدم ل ستاتا. وتسمى هذه الحزم إنوموبت و تستوميت. إذا كان جهاز الكمبيوتر الخاص بك متصلا، يمكنك كتابة فيندت إنوموبت في إطار الأمر ستاتا. (لمزيد من المعلومات أو المساعدة راجع صفحة الأسئلة الشائعة كيف يمكنني استخدام فينديت للبحث عن برامج ومساعدة إضافية) على افتراض تثبيت الحزم الضرورية، وبناء الجملة أدناه يوضح كيفية تشغيل اختبار النتيجة. السطر الأول من بناء الجملة يدير النموذج مع الإناث فقط وقراءة كمتغيرات التنبؤ (أذكر أن اختبار النتيجة يستخدم نموذجا مع عدد أقل من المتغيرات والاختبارات للمتغيرات حذفها). السطر التالي يستخدم الأمر التنبؤ لتوليد متغير جديد يسمى الاختبار الذي يحتوي على النتيجة لكل حالة. دون الدخول في الكثير من التفاصيل، وتستند الدرجات هنا على نموذج يقدر وقيمة المتغيرات في نموذج لكل حالة. السطر الثالث من بناء الجملة يستخدم الأمر تستوميت لفحص ما إذا كانت متغيرات الرياضيات العلم أندور هي المتغيرات التي تم حذفها بشكل غير صحيح من النموذج. تخبر درجة الاختيار (اختبار) ستاتا باسم المتغير الذي يحتوي على الدرجات، على الرغم من أنه في قسم الخيارات (أي بعد الفاصلة)، فهذا مطلوب. يرجى ملاحظة أن تستوميت مكتوبة المستخدم لم تعد متوفرة في ستاتا. الجزء الأول من الإخراج يعطي نوع من تشغيل النموذج، تليها جدول النتائج. يتم توزيع نتائج اختبار النتيجة تشي مربع مع درجات الحرية يساوي عدد المتغيرات المضافة إلى النموذج. يحتوي الجدول على ثلاثة أعمدة، الأولى تعطي قيمة إحصائية الاختبار، والثانية عدد درجات الحرية للاختبار، والثالثة تعطي قيمة p المرتبطة بمربع تشي من قيمة معينة بعدد معين من درجات الحرية. تظهر المتغيرات الرياضيات والعلوم بشكل منفصل في الصفوف الخاصة بهم، الصفين الأولين تحتوي على نتائج لاختبار ما إذا كان إضافة إما (ولكن ليس كلاهما) من هذه المتغيرات إلى نموذج من شأنه أن يحسن بشكل كبير من ملاءمة النموذج. الصف السفلي، وصفت اختبار في وقت واحد، واختبارات ما إذا كان إضافة كل من المتغيرات إلى نموذج تحسين كبير في تناسب النموذج. النتائج الواردة في الجدول تتفق مع اختبارات والد و لر التي أجريناها أعلاه. كما أنها تتفق مع الناتج الانحدار أعلاه، حيث كانت معاملات الرياضيات والعلوم ذات دلالة إحصائية. الأمر تستوميت تتصرف بشكل مختلف إلى حد ما لأوامر تقدير مختلفة. وفيما يلي أمثلة على كيفية استخدام تستوميت مع العديد من الأوامر الانحدار الأخرى. ستستخدم معظم أوامر المعادلات المتعددة بناء جملة مشابها لبناء الجملة ل ملوجيت. هناك استثناءان هما أولوغيت و أوبروبيت. وتراجع. والتي تظهر بشكل منفصل. يرجى ملاحظة أن تستوميت مكتوبة المستخدم لم تعد متوفرة في ستاتا. بالنسبة ل ملوجيت والعديد من الأوامر متعددة المعادلات المتعددة: بالنسبة للالولوجيت والأوبروبيت: أنا أحاول إجراء اختبار F على الأهمية المشتركة للآثار الثابتة (المتغيرات الوهمية الخاصة بالفرد) على انحدار بيانات عملية شريان الحياة للسودان (في R)، ومع ذلك، لقد وجدت وسيلة للعثور على هذا العدد الكبير من الآثار الثابتة. من الناحية المثالية، وأود أن استخدام وظيفة في حزمة بلم، ولكن أنا وجدت أي شيء على وجه التحديد هذا الاختبار. هذا شيء يفعل ستاتا تلقائيا عند استخدام ستريغ، أمر في. في ستاتا، تبدو النتائج كما يلي: مرة أخرى، أحاول إعادة إنتاج نتيجة ستاتا في R لعدد كبير من المتغيرات الوهمية، ربما محدد بواسطة عامل (us. state) باستخدام لم () أو نموذج في باستخدام بلم (). هنا مثال قابل للتكرار: وهو ما يعادل ما يلي ضمن الانحدار باستخدام حزمة بلم. لذلك، فإن الاختبار سيكون الاختبار أن جميع المتغيرات دمية الدولة هي معا مختلفة من الصفر (مشترك بشكل كبير). هذا هو تقييد خطي على النموذج غير المقيد (reg1 و reg1.fe أعلاه). ويوضح هذا الاختبار F بشكل أفضل على الوثيقة التالية (انظر الشرائح 5-7). هنا هو واحد من محاولات بلدي ضعيفة في إنشاء مصفوفة R للاختبار F مع فرضية فارغة: رب ف حيث B هو مصفوفة المعاملات (بيتا قبعة)، و q هو متجه من الأصفار. هذا لا يعمل و، آمل أن يكون هناك نهج مبسط لاختبار أهمية مشتركة لجميع المتغيرات وهمية تأثير ثابت. أولا، إد ترغب في اقتراح أن سؤالك يمكن تحسينها من خلال (1) تقديم مثال استنساخه، و (2) وصف الاختبار الدقيق الذي تشير إليه عندما تقول F اختبار. رابط إلى مستندات ستاتا ربما F هو التوزيع، لذلك يمكن أن يكون هناك اختبارات غازيليون يسمى اختبار F. إذا كانت مصلحتك الجوهرية تكمن في تحديد ما إذا كان نموذج التأثيرات الثابتة يناسب البيانات بشكل أفضل بكثير من عملية شريان الحياة للسودان بدون تأثيرات ثابتة، فيمكنك دائما استخدام اختبار نسبة الاحتمال. أنا متأكد من أن هناك العديد من التطبيقات في R، ولكن واحد التي تقدمها حزمة متيست مريحة جدا. هيريس مثال باستخدام مجموعة بيانات وزعت مع حزمة بلم (يبدو أن لديك أن تثبيت، لذلك ينبغي أن يكون من السهل محاولة). أعتقد plm39s بتست () وظيفة قد تفعل ما تريد (انظر بلدي تحرير الجواب). والنتيجة ليست بالضبط نفس الناتج ستاتا الخاص بك، والذي ربما يرجع إلى حقيقة أن المعلمة الأولى من التوزيع F مختلفة. ولكن عندما كنت تناسب كلا النموذجين بشكل فردي مع لم ()، أحصل على درجات الحرية 543 و 498 (الفرق من 45)، لذلك يبدو R هنا. معرفة ما إذا كنت تحصل على نفس درجات الحرية في ستاتا عندما كنت تناسب التجميع وضمن نماذج بشكل فردي. المشكلة مع البرامج المغلقة المصدر مثل ستاتا هو we39ll لا نعرف على وجه التحديد كيف يحسبون اختبارهم F. نداش فنسنت 30 مايو 11 في 03:50 أنا حقا لا أعتقد أن هذا الاختبار مفيد على الإطلاق. بدلا من تقدير ما تسمونه تأثير ثابت (عدم استدعائه لا تجمع نموذج)، لماذا لا نموذج هرمي نموذج هرمي (أو نموذج التجميع الجزئي) سوف تسمح لتقلص الخاص بك إلى تقليص متوسط كوموم للدول، ولكن من دون فرض لهم أن تكون متساوية. موريفور، إذا كنت بحاجة إلى تقييم مقدار الدول تختلف، تحتاج فقط إلى استخدام التباين المقدرة بين الدولة وبين الدول. إذا كان التباين بين الدول منخفضا (بالقرب من الصفر)، مما كنت تكتسب كسبا كثيرا باستخدام نموذج هرمي والمعارضة هي نفسها تقريبا. إذا كان التباين كبير جدا (في الحد، عندما يذهب إلى ما لا نهاية) النموذج الهرمي يضيف القليل ويمكنك تشغيل نموذج فصل لكل حالة. يمكنك تقدير نموذج هرمي في R مع حزمة Lme4. استخدام البيانات الخاصة بك: الانحراف المعياري المقدر للاعتراض من قبل الدول هو 4.39 والانحراف المعياري من قبل الفرد هو 4.19.NOTICE: سوف إدر المجموعة الاستشارية الإحصائية ترحيل الموقع إلى وردبريس كمس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد . ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة المجموعة الاستشارية للاستشارات من خلال إعطاء هدية ستاتا أسئلة وأجوبة كيف يمكنني إجراء نسبة الاحتمال، والد، و لاغرانج مضاعف (درجة) اختبار في ستاتا نسبة احتمال (لر) اختبار، اختبار والد، واختبار المضاعف لاغرانج (يسمى أحيانا اختبار نقاط) يستخدم عادة لتقييم الفرق بين النماذج المتداخلة. ويعتبر نموذج واحد متداخلة في نموذج آخر إذا كان يمكن توليد النموذج الأول بفرض قيود على المعلمات من الثانية. في معظم الأحيان، فإن التقييد هو أن المعلمة تساوي الصفر. في نموذج الانحدار يتم تقييد معلمات إلى الصفر عن طريق إزالة متغيرات التنبؤ من النموذج. على سبيل المثال، في النماذج أدناه، نموذج مع متغيرات التنبؤ الإناث. و أقرأ . متداخلة داخل النموذج مع متغيرات التنبؤ الإناث. اقرأ . الرياضيات. والعلوم. وتطرح اختبارات المضاعفات لر و والد و لاغرانج نفس السؤال الأساسي الذي يعني تقييد هذه المعلمات إلى الصفر (أي ترك هذه المتغيرات المتوقعة) تقلل إلى حد كبير من ملاءمة النموذج لإجراء اختبار نسبة الاحتمال، يجب على المرء أن يقدر كلا من من النماذج التي يرغب المرء في مقارنتها. ميزة اختبارات والد والنتيجة هي أنها تقارب اختبار لر ولكن تتطلب أن يتم تقدير نموذج واحد فقط. عندما كانت قوة الحوسبة أكثر محدودية بكثير، واستغرقت العديد من النماذج وقتا طويلا للتشغيل، كانت هذه ميزة كبيرة إلى حد ما. اليوم، بالنسبة لمعظم النماذج من المرجح أن يرغب الباحثون في المقارنة، هذه ليست قضية، ونحن نوصي عموما تشغيل اختبار نسبة الاحتمال في معظم الحالات. هذا لا يعني أن المرء لا ينبغي أبدا استخدام والد أو تسجيل الاختبارات. على سبيل المثال، يستخدم اختبار والد عادة لأداء درجات متعددة من اختبارات الحرية على مجموعات من المتغيرات الوهمية المستخدمة لنمذجة المتغيرات الفئوية في الانحدار (لمزيد من المعلومات انظر موقعنا على الانحدار مع ستاتا، وتحديدا الفصل 3 - الانحدار مع التنبؤات الفئوية). مثال آخر هو كوتموديفيكاتيون إندسسكوت المستخدمة في النمذجة المعادلة الهيكلية، فهي لاغرانج اختبارات المضاعف. كما ذكرنا أعلاه، يتطلب اختبار لر أن يتم تشغيل نموذجين، واحدة منها لديها مجموعة من المعلمات (المتغيرات)، ونموذج ثان مع جميع المعلمات من الأولى، بالإضافة إلى واحد أو أكثر من المتغيرات الأخرى. يفحص اختبار والد نموذجا بمزيد من المعلمات ويقيم ما إذا كان تقييد تلك المعلمات (عموما إلى الصفر، عن طريق إزالة المتغيرات المرتبطة بها من النموذج) يضر بشكل خطير بملاءمة النموذج. وعلى النقيض من ذلك، يدرس اختبار النقاط نتائج نموذج أصغر ويسأل عما إذا كان إضافة متغير واحد أو أكثر محذوف من شأنه أن يحسن ملاءمة النموذج. بشكل عام، يجب أن تأتي الاختبارات الثلاثة إلى نفس الاستنتاج (لأن والد واختبار النتيجة، على الأقل من الناحية النظرية، تقارب اختبار لر). على سبيل المثال، سوف نقوم باختبار فرق ذو دلالة إحصائية بين نموذجين، باستخدام الاختبارات الثلاثة جميعها. تتضمن مجموعة البيانات لهذا المثال البيانات الديموغرافية، وكذلك نتائج الاختبارات القياسية ل 200 طالب في المرحلة الثانوية. وسوف نقارن نموذجين. المتغير التابع لكلا النموذجين هو هوريت (ليتم تداخل نموذجين يجب أن يشتركا في المتغير التابع نفسه)، وهو متغير ثنائي التفرع يشير إلى أن الطالب كان لديه درجة الكتابة التي كانت فوق المتوسط. هناك أربعة متغيرات متوقعة المحتملة، الإناث. وهو متغير وهمية يشير إلى أن الطالب أنثى، والمتغيرات المستمرة قراءة. الرياضيات. والعلوم. والتي هي الطلاب درجات الاختبار موحدة في القراءة والرياضيات والعلوم، على التوالي. وسوف نقوم باختبار نموذج يحتوي فقط المتغيرات التنبؤ الإناث والقراءة. ضد النموذج الذي يحتوي على متغيرات التنبؤ الإناث والقراءة. فضلا عن متغيرات التنبؤ الإضافية والرياضيات والعلوم. مثال لاختبار نسبة الاحتمال. كما نوقش أعلاه، اختبار لر يتضمن تقدير نموذجين ومقارنتها. إن تحديد معلمة واحدة أو أكثر إلى الصفر، عن طريق إزالة المتغيرات المقترنة بتلك المعلمة من النموذج، سيجعل دائما النموذج مناسبا بشكل أقل، لذا فإن التغيير في احتمال السجل لا يعني بالضرورة أن النموذج ذو المتغيرات الأكثر ملاءمة بشكل أفضل. اختبار لر يقارن احتمال السجل من النموذجين واختبار ما إذا كان هذا الاختلاف ذو دلالة إحصائية. إذا كان الفرق ذو دلالة إحصائية، فإن النموذج الأقل تقييدا (النموذج ذو المتغيرات الأكثر) يقال إنه يناسب البيانات بشكل أفضل بكثير من النموذج الأكثر تقييدا. يتم حساب إحصائية اختبار لر على النحو التالي: LR - لن (L (m1) L (m2) 2 (ل (m2) - ll (m1)) حيث يشير L (m) إلى احتمال النموذج المعين، و ل (م) السجل الطبيعي من احتمال النماذج. وتوزع هذه الإحصائية تشي مربع مع درجات الحرية تساوي الفرق في عدد درجات الحرية بين النموذجين (أي عدد المتغيرات المضافة إلى النموذج). من أجل إجراء اختبار نسبة الاحتمالات سوف نحتاج إلى تشغيل كلا النموذجين وتقديم ملاحظة لاحتمالات السجل النهائي. سنقوم بتشغيل النماذج باستخدام ستاتا واستخدام الأوامر لتخزين إمكانيات السجل. يمكننا أيضا نسخ الاحتمالات إلى أسفل (أي عن طريق كتابتها أو قطعها ولصقها)، ولكن استخدام الأوامر أسهل قليلا ومن المحتمل أن تؤدي إلى أخطاء. السطر الأول من بناء الجملة أدناه يقرأ في مجموعة البيانات من موقعنا على الانترنت. السطر الثاني من بناء الجملة تدير نموذج الانحدار اللوجستي، وتوقع هيوريت على أساس الطلاب الجنسين (الإناث)، وقراءة عشرات (قراءة). السطر الثالث من التعليمات البرمجية يخزن قيمة احتمال السجل للنموذج، الذي يتم تخزينه مؤقتا مثل تقدير عاد ه (ل) (لمزيد من المعلومات نوع المساعدة العودة في إطار الأمر ستاتا)، في العدد المسمى m1. أدناه هو الإخراج. من أجل إجراء اختبار نسبة الاحتمالات سنحتاج إلى تتبع احتمال السجل (-10.44)، وبناء الجملة لهذا المثال (أعلاه) يفعل ذلك عن طريق تخزين القيمة في العددية. وبما أنه ليس لدينا الشاغل الرئيسي هنا، ونحن سوف تخطي تفسير بقية نموذج الانحدار اللوجستي. لاحظ أن تخزين التقدير الذي تم إرجاعه لا ينتج أي ناتج. السطر الأول من بناء الجملة أدناه يدير النموذج الثاني، وهذا هو، النموذج مع متغيرات التنبؤ الأربعة. السطر الثاني من التعليمات البرمجية يخزن قيمة احتمال السجل للنموذج (-84.4)، والتي يتم تخزينها مؤقتا كما تقدير عاد (ه (ل))، في العدد المسمى M2. مرة أخرى، ونحن لن نقول الكثير عن الإخراج إلا أن نلاحظ أن معاملات لكل من الرياضيات والعلوم على حد سواء ذات دلالة إحصائية. لذلك نحن نعلم أن، بشكل فردي، فهي تنبؤات هامة إحصائيا من هيوريت. الآن لدينا إمكانيات السجل من كلا النموذجين، يمكننا إجراء اختبار نسبة احتمال. السطر الأول من بناء الجملة يحسب إحصائية اختبار نسبة الاحتمال. السطر الثاني من بناء الجملة يجد قيمة p المرتبطة إحصائية اختبار لدينا مع درجتين من الحرية. ننظر أدناه نرى أن إحصائية الاختبار هي 36.05، وأن قيمة p المرتبطة منخفضة جدا (أقل من 0.0001). وأظهرت النتائج أن إضافة الرياضيات والعلوم كمتغيرات تنبؤ معا (وليس فقط بشكل فردي) النتائج في تحسن كبير إحصائيا في نموذج صالح. لاحظ أنه إذا أجرينا اختبار نسبة الاحتمال لإضافة متغير واحد إلى النموذج، ستكون النتائج هي نفس اختبار الدلالة لمعامل هذا المتغير المعروض في الجدول أعلاه. باستخدام ستاتاس بوستستيماشيون الأوامر لحساب احتمال نسبة اختبار كما رأيت، فمن السهل بما فيه الكفاية لحساب احتمال نسبة اختبار كوبي hand. quot ومع ذلك، يمكنك أيضا استخدام ستاتا لتخزين التقديرات وتشغيل الاختبار بالنسبة لك. هذا الأسلوب هو أسهل لا يزال، وربما أقل عرضة للخطأ. السطر الأول من بناء الجملة تدير نموذج الانحدار اللوجستي، وتوقع هيوريت على أساس الطلاب الجنس (الإناث)، وقراءة عشرات (قراءة). السطر الثاني من بناء الجملة يطلب من ستاتا لتخزين التقديرات من نموذج ركضنا للتو، ويوجه ستاتا أننا نريد أن ندعو التقديرات m1. من الضروري إعطاء التقديرات اسما، حيث أن ستاتا تسمح للمستخدمين بتخزين التقديرات من أكثر من تحليل واحد، وسنقوم بتخزين أكثر من مجموعة واحدة من التقديرات. أدناه هو الإخراج. وبما أنه ليس شاغلنا الرئيسي هنا، فإننا سوف تخطي تفسير نموذج الانحدار اللوجستي. لاحظ أن تخزين التقديرات لا ينتج أي إخراج. السطر الأول من بناء الجملة أدناه هذه الفقرة يدير النموذج الثاني، وهذا هو النموذج مع متغيرات التنبؤ الأربعة. السطر الثاني من بناء الجملة يحفظ التقديرات من هذا النموذج، وأسماء لهم m2. أسفل بناء الجملة هو الناتج ولدت. Again, we wont say much about the output except to note that the coefficients for both math and science are both statistically significant. So we know that, individually, they are statistically significant predictors of hiwrite . The tests below will allow us to test whether adding both of these variables to the model significantly improves the fit of the model, compared to a model that contains just female and read . The first line of syntax below tells Stata that we want to run an lr test, and that we want to compare the estimates we have saved as m1 to those we have saved as m2 . The output reminds us that this test assumes that A is nested in B, which it is. It also gives us the chi-squared value for the test (36.05) as well as the p-value for a chi-squared of 36.05 with two degrees of freedom. Note that the degrees of freedom for the lr test, along with the other two tests, is equal to the number of parameters that are constrained (i. e. removed from the model), in our case, 2. Note that the results are the same as when we calculated the lr test by hand above. Adding math and science as predictor variables together (not just individually) results in a statistically significant improvement in model fit. As noted when we calculated the likelihood ratio test by hand, if we performed a likelihood ratio test for adding a single variable to the model, the results would be the same as the significance test for the coefficient for that variable presented in the table above. The entire syntax for a likelihood ratio test, all in one block, looks like this: Example of a Wald test As was mentioned above, the Wald test approximates the lr test, but with the advantage that it only requires estimating one model. The Wald test works by testing that the parameters of interest are simultaneously equal to zero. If they are, this strongly suggests that removing them from the model will not substantially reduce the fit of that model, since a predictor whose coefficient is very small relative to its standard error is generally not doing much to help predict the dependent variable. The first step in performing a Wald test is to run the full model (i. e. the model containing all four predictor variables). The first line of syntax below does this (but uses the quietly prefix so that the output from the regression is not shown). The second line of syntax below instructs Stata to run a Wald test in order to test whether the coefficients for the variables math and science are simultaneously equal to zero. The output first gives the null hypothesis. Below that we see the chi-squared value generated by the Wald test, as well as the p-value associated with a chi-squared of 27.53 with two degrees of freedom. Based on the p-value, we are able to reject the null hypothesis, again indicating that the coefficients for math and science are not simultaneously equal to zero, meaning that including these variables create a statistically significant improvement in the fit of the model. Example of a score or Lagrange multiplier test Please note that the user-written testomit is no longer available in Stata. In order to perform the score test, you will need to download two user written packages for Stata. These packages are called enumopt and testomit . If your computer is online, you can type findit enumopt in the Stata command window. (For more information or help see our FAQ page How do I use findit to search for programs and additional help ) Assuming the necessary packages are installed, the syntax below shows how to run a score test. The first line of syntax runs the model with just female and read as predictor variables (recall that the score test uses a model with fewer variables and tests for omitted variables). The next line uses the command predict to generate a new variable called test that contains the score for each case. Without going into too much detail, the scores here are based on the model estimated and the value of the variables in the model for each case. The third line of syntax uses the testomit command to examine whether the variables math andor science are variables which were incorrectly omitted from the model. The option score(test) tells Stata the name of the variable containing the scores, although it is in the options section (i. e. after the comma), this is required. Please note that the user-written testomit is no longer available in Stata. The first part of the output gives the type of model run, followed by a table of results. The results of the score test are distributed chi-squared with degrees of freedom equal to the number of variables added to the model. The table has three columns, the first giving the value of the test statistic, the second the number of degrees of freedom for the test, and the third giving the p-value associated with a chi-squared of a given value with a given number of degrees of freedom. The variables math and science appear separately in their own rows, the first two rows contain the results for a test of whether adding either (but not both) of these variables to the model would significantly improve the fit of the model. The bottom row, labeled simultaneous test, tests whether adding both variables to the model will significantly improve the fit of the model. The results shown in the table are consistent with the Wald and lr tests we performed above. They are also consistent with the regression output above, in which the coefficients for math and science were statistically significant. The command testomit behaves somewhat differently for different estimation commands. Below are examples of how to use testomit with several other regression commands. Most multiple equation commands will use a syntax similar to the syntax for mlogit . Two exceptions are ologit and oprobit . and regress . which are shown separately. Please note that the user-written testomit is no longer available in Stata. For mlogit and many other multiple-equation commands: For ologit and oprobit :
Comments
Post a Comment