在處理具遺失值之類別資料時,傳統的方法是將資料捨棄,但是這通常不是明智之舉,這些遺失某些分類訊息的資料通常還是可以提供其它重要的訊息,尤其當這類型資料的個數佔大多數時,將其捨棄可能使得估計的變異數增加,甚至影響最後的決策。如何將這些遺失某些訊息的資料納入考慮,作出完整的分析是最近幾十年間頗為重要的課題。本文主要整理了五種分析這類型資料的方法,分別為單樣本方法、多樣本方法、概似方程式因式分解法、EM演算法,以上四種方法可使用在資料遺失呈隨機分佈的條件成立下來進行分析。第五種則為樣本遺失不呈隨機分佈之分析方法。Traditionally, the simple way to deal with observations for which some of the variables are missing so that they cannot cross-classified into a contingency table simply excludes them from any analysis. However, it is generally agreed that such a practice would usually affect both the accuracy and the precision of the results. The purpose of the study is to bring together some of the sound alternatives available in the literature, and provide a comprehensive review. Four methods for handlin...
Models of contingency tables are based on the counts by category. In a two-way table, models can dep...
Maximum likelihood estimate(MLE) is obtained from the partial log-likelihood function for the cell p...
[[abstract]]在生物醫學及臨床領域中,檢驗雙樣本存活曲線是一個常見的問題。在過去所有方法中,log rank test 為最常使用的方法,但是這個方法卻在兩條存活曲線交叉的情況下無法得到較好...
有效价差是刻画金融资产交易成本的一种重要度量。本文基于Roll的价格模型,利用对数价格极差分布的近似正态特征,提出了一种有效价差的近似极大似然估计,并通过数值模拟比较了这一新的估计与以往文献中提出的R...
在環境檢測與實驗研究中,由於收集的資料容易受儀器的偵測極限影響而產生遺失值。過去多數文獻只針對模型中至多兩個變數受偵測極限影響的資料,進行簡單替代法、插補法或模式建構法等的處理方法;而當模型中含有多個...
給定一些條件分配,若其相容,我們可以試著找出對應的聯合分配,並由概似函數求其參數的最大概似估計。但當聯合密度函數不易求出或過於複雜時,我們可以利用擬概似函數去估計參數。本文透過三個分配:(1)聯合分配...
當密度函數難以完整表示,例如無法求得其正規化常數,則求最大概似估計(MLE)時會有困難。因此一種替代方案就是使用擬概似函數去求得最大擬概似估計(MPLE)以取代MLE。本研究之目的在探討二元指數族中參...
計畫編號:NSC100-2118-M032-005 研究期間:20110801~20120731 研究經費:371,000[[abstract]]遺失值常發生於長期追蹤研究中,多重插補法即為解決遺失值...
計畫編號:NSC96-2118-M032-009研究期間:2007/08/01~2008/07/31研究經費:396,000[[abstract]]在流行病學領域中,羅吉斯迴歸模式經常用來推論風險因子...
[[abstract]]©2003 SNM - 背景:利用maximum likelihood expectation maximization(MLEM)方法重建正子斷層掃描(PET)影像,其結果比...
[[abstract]]©2003 SNM - 背景:利用maximum likelihood expectation maximization(MLEM)方法重建正子斷層掃描(PET)影像,其結果比...
Рассмотрен общий случай определения вероятности попадания на заданный участок случайной в...
This article describes estimation of the cell probabilities in an R C contingency table with ignora...
[[abstract]] 資料探勘是由大量資料中挖掘出隠藏知識的重要技術,目前企業或政府各方面決策幾乎是以歷史資料探勘結果分析為基礎,故資料庫的完整性則十分的重要。若是資料庫中出現過多的遺漏值,則容...
Models of contingency tables are based on the counts by category. In a two-way table, models can dep...
Models of contingency tables are based on the counts by category. In a two-way table, models can dep...
Maximum likelihood estimate(MLE) is obtained from the partial log-likelihood function for the cell p...
[[abstract]]在生物醫學及臨床領域中,檢驗雙樣本存活曲線是一個常見的問題。在過去所有方法中,log rank test 為最常使用的方法,但是這個方法卻在兩條存活曲線交叉的情況下無法得到較好...
有效价差是刻画金融资产交易成本的一种重要度量。本文基于Roll的价格模型,利用对数价格极差分布的近似正态特征,提出了一种有效价差的近似极大似然估计,并通过数值模拟比较了这一新的估计与以往文献中提出的R...
在環境檢測與實驗研究中,由於收集的資料容易受儀器的偵測極限影響而產生遺失值。過去多數文獻只針對模型中至多兩個變數受偵測極限影響的資料,進行簡單替代法、插補法或模式建構法等的處理方法;而當模型中含有多個...
給定一些條件分配,若其相容,我們可以試著找出對應的聯合分配,並由概似函數求其參數的最大概似估計。但當聯合密度函數不易求出或過於複雜時,我們可以利用擬概似函數去估計參數。本文透過三個分配:(1)聯合分配...
當密度函數難以完整表示,例如無法求得其正規化常數,則求最大概似估計(MLE)時會有困難。因此一種替代方案就是使用擬概似函數去求得最大擬概似估計(MPLE)以取代MLE。本研究之目的在探討二元指數族中參...
計畫編號:NSC100-2118-M032-005 研究期間:20110801~20120731 研究經費:371,000[[abstract]]遺失值常發生於長期追蹤研究中,多重插補法即為解決遺失值...
計畫編號:NSC96-2118-M032-009研究期間:2007/08/01~2008/07/31研究經費:396,000[[abstract]]在流行病學領域中,羅吉斯迴歸模式經常用來推論風險因子...
[[abstract]]©2003 SNM - 背景:利用maximum likelihood expectation maximization(MLEM)方法重建正子斷層掃描(PET)影像,其結果比...
[[abstract]]©2003 SNM - 背景:利用maximum likelihood expectation maximization(MLEM)方法重建正子斷層掃描(PET)影像,其結果比...
Рассмотрен общий случай определения вероятности попадания на заданный участок случайной в...
This article describes estimation of the cell probabilities in an R C contingency table with ignora...
[[abstract]] 資料探勘是由大量資料中挖掘出隠藏知識的重要技術,目前企業或政府各方面決策幾乎是以歷史資料探勘結果分析為基礎,故資料庫的完整性則十分的重要。若是資料庫中出現過多的遺漏值,則容...
Models of contingency tables are based on the counts by category. In a two-way table, models can dep...
Models of contingency tables are based on the counts by category. In a two-way table, models can dep...
Maximum likelihood estimate(MLE) is obtained from the partial log-likelihood function for the cell p...
[[abstract]]在生物醫學及臨床領域中,檢驗雙樣本存活曲線是一個常見的問題。在過去所有方法中,log rank test 為最常使用的方法,但是這個方法卻在兩條存活曲線交叉的情況下無法得到較好...