作者:金勇進,劉曉宇
摘要:在實際調查工作中,由于客觀條件的限制,難以完全避免無回答情況的出現,需在數據分析階段彌補無回答對估計產生的負面影響。本文嘗試通過機器學習中的聚類算法進行無回答權數調整,以突破可忽略性的限制,著重考察在不可忽略的無回答機制下的估計效果。實證研究根據2015年中國綜合社會調查(CGSS)數據進行,結果表明,無論無回答機制是否可忽略,基于機器學習聚類算法進行的權數調整,均能有效控制無回答偏差、得到變異性小的最終權數和性質優良的目標變量估計。
發文機構:中國人民大學統計學院
關鍵詞:非隨機缺失不可忽略的無回答機制權數調整聚類分析
分類號: C81[社會學—統計學]